算力 标签,匹配到约361个结果, 耗时0.0275秒

模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

现阶段,微调大型语言模型(LLMs)的难点在于,人们通常没有高质量的标注数据。...
2025-03-30
·
浏览18次

3D领域DeepSeek「源神」启动!国产明星创业公司,一口气开源八大项目

2025 开年,DeepSeek-R1 的成功在全球掀起了一股开源风潮,上个月的开源周更是毫无保留地将自己的多项核心技术开放给了全球开发者。...
2025-03-28
·
浏览35次

三年狂飙!「AIGC第一股」纯软件营收产品交付破2.2亿,暴增88.5%跑通全球

三年狂飙!「AIGC第一股」纯软件营收产品交付破2.2亿,暴增88.5%跑通全球...
2025-03-28
·
浏览26次

中国首个高速动车组空气动力学智能化仿真大模型问世

2025 年 3 月,中国高速动车组空气动力学智能化仿真大模型在青岛成功问世,推动高速列车气动仿真计算从“天级”提升至“秒级”,标志着中国高速列车研发迈入人工智能新阶段。...
2025-03-28
·
浏览41次



阿里蔡崇信:数据中心建设领域需警惕可能正在形成潜在的泡沫

有市场消息称,在香港举办的 2025 年汇丰全球投资峰会上,阿里巴巴集团董事长蔡崇信称,人工智能数据中心建设出现泡沫,算力已经过剩。不过,传到股票自媒体口中却变成,蔡崇信说人工...
2025-03-26
·
浏览45次


DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑...
2025-03-25
·
浏览82次

美国恐惧:冷战2.0将至,中国开源模型大爆炸临近!LeCun:DeepSeek只是卷王副产品

美国恐惧:冷战2.0将至,中国开源模型大爆炸临近!LeCun:DeepSeek只是卷王副产品...
2025-03-24
·
浏览38次

强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍

虽然大多数强化学习(RL)方法都在使用浅层多层感知器(MLP),但普林斯顿大学和华沙理工的新研究表明,将对比 RL(CRL)扩展到 1000 层可以显著提高性能,在各种机器人任...
2025-03-23
·
浏览50次





英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型,支持“智能体 AI”系统,可独立推理、规划并执行多步骤任务,适用于机器人、自动化和决策优化等场景,显著降...
2025-03-20
·
浏览56次

全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开

全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开...
2025-03-18
·
浏览73次

摩尔线程开源 MT-MegatronLM 和 MT-TransformerEngine 两大 AI 框架

摩尔线程官方今日发文宣布,近日已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策...
2025-03-18
·
浏览67次

谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路

谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路...
2025-03-16
·
浏览88次

没有归一化层的Transformer!刘壮带队,何恺明、Yann LeCun都参与了

何恺明又双叒叕发新作了,这次还是与图灵奖得主 Yann LeCun 合作。...
2025-03-16
·
浏览75次



Anthropic CEO:全体失业好过50%失业!AI将接管所有代码,但可以一键「躺平」

Anthropic CEO:全体失业好过50%失业!AI将接管所有代码,但可以一键「躺平」...
2025-03-14
·
浏览66次

百万美金炼出「调参秘籍」!阶跃星辰开源LLM最优超参工具

近日,阶跃星辰研究团队通过大规模实证探索,耗费了近 100 万 NVIDIA H800 GPU 小时(约百万美元),从头训练了 3,700 个不同规模,共计训了 100 万亿个...
2025-03-13
·
浏览94次