ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割
当人形机器人能够辨识身边的一切,VR/AR 设备呈现出定制化的虚拟世界,自动驾驶汽车实时捕捉路面状况,这一切都依赖于对 3D 场景的精确理解。...
2025-03-09
·
浏览349次
7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!
随着 DeepSeek-R1 的流行与 AI4Math 研究的深入,大模型在辅助形式化证明写作方面的需求日益增长。...
2025-03-09
·
浏览291次
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek...
2025-03-09
·
浏览308次
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布...
2025-03-08
·
浏览210次
英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025
英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025...
2025-03-08
·
浏览374次
狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投
狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投...
2025-03-08
·
浏览207次
DeepSeek的MLA,任意大模型都能轻松迁移了
DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。...
2025-03-07
·
浏览447次
FP8训练新范式:减少40%显存占用,训练速度提高1.4倍
近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。...
2025-03-07
·
浏览501次
消息称 Meta 的 Llama 4 模型将聚焦语音交互,全力开拓 AI 商业版图
据英国金融时报报道,社交媒体巨头 Meta 正在加速其人工智能的语音功能开发,计划在未来几周内推出其最新开源大语言模型 Llama 4,并将语音交互作为核心功能之一。据知情人士...
2025-03-07
·
浏览495次
消息称微软正开发内部 AI 推理模型,并测试 xAI、DeepSeek 等多种 OpenAI 替代方案
外媒The Information 今晚发布消息称,微软正在开发内部人工智能推理模型,以与OpenAI竞争,并可能向开发者出售。...
2025-03-07
·
浏览398次
32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理
32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理...
2025-03-07
·
浏览507次
Nature:如何借助AI高效完成学术论文同行评审
研究者 Dritjon Gruda 在社交媒体上进行了一项非正式调查。他在 1 月份的 Facebook 和 LinkedIn 上发布帖子,询问学术同行花费多少时间审阅论文。...
2025-03-06
·
浏览377次
快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本
FPL-net 获得结果的速度比以前的方法快 1,000 倍,误差幅度仅为十万分之一,表现出卓越的准确性。...
2025-03-06
·
浏览279次
ET-SEED:提升机器人操作泛化能力的高效等变扩散策略
本文提出了一种轨迹级别 SE (3) 等变的扩散策略(ET-SEED),通过将等变表示学习和扩散策略结合,使机器人能够在极少的示范数据下高效学习复杂操作技能,并能够泛化到不同物...
2025-03-06
·
浏览277次
当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?
2025 年开年,DeepSeek R1 和 V3 重磅发布,其超强的语言建模与推理能力,引爆了全球 AI 社区。...
2025-03-06
·
浏览1311次
AI 中文社