
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek

让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek...
2025-03-09
·
浏览84次


DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布

DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布...
2025-03-08
·
浏览72次

狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投

狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投...
2025-03-08
·
浏览54次

英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025

英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025...
2025-03-08
·
浏览87次

DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。...
2025-03-07
·
浏览115次


FP8训练新范式:减少40%显存占用,训练速度提高1.4倍

近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。...
2025-03-07
·
浏览91次



消息称 Meta 的 Llama 4 模型将聚焦语音交互,全力开拓 AI 商业版图

据英国金融时报报道,社交媒体巨头 Meta 正在加速其人工智能的语音功能开发,计划在未来几周内推出其最新开源大语言模型 Llama 4,并将语音交互作为核心功能之一。据知情人士...
2025-03-07
·
浏览96次

消息称微软正开发内部 AI 推理模型,并测试 xAI、DeepSeek 等多种 OpenAI 替代方案

外媒The Information 今晚发布消息称,微软正在开发内部人工智能推理模型,以与OpenAI竞争,并可能向开发者出售。...
2025-03-07
·
浏览85次


32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理

32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理...
2025-03-07
·
浏览107次


Nature:如何借助AI高效完成学术论文同行评审

研究者 Dritjon Gruda 在社交媒体上进行了一项非正式调查。他在 1 月份的 Facebook 和 LinkedIn 上发布帖子,询问学术同行花费多少时间审阅论文。...
2025-03-06
·
浏览97次

快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本

FPL-net 获得结果的速度比以前的方法快 1,000 倍,误差幅度仅为十万分之一,表现出卓越的准确性。...
2025-03-06
·
浏览76次

ET-SEED:提升机器人操作泛化能力的高效等变扩散策略

本文提出了一种轨迹级别 SE (3) 等变的扩散策略(ET-SEED),通过将等变表示学习和扩散策略结合,使机器人能够在极少的示范数据下高效学习复杂操作技能,并能够泛化到不同物...
2025-03-06
·
浏览71次


当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?

2025 年开年,DeepSeek R1 和 V3 重磅发布,其超强的语言建模与推理能力,引爆了全球 AI 社区。...
2025-03-06
·
浏览232次


字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景

2025 年 3 月 5 日,豆包宣布上线「深度思考」推理模式,全面覆盖问答、搜索、写作和阅读场景。要想进入「深度思考」推理模式,用户只需在输入框打开「深度思考Beta」开关即...
2025-03-06
·
浏览133次

DeepSeek 们上终端,未来手机、PC、汽车体验如何?

相信随着 AI 技术的不断进步和应用场景的不断拓展,包括高通在内的众多技术公司将继续引领终端侧 AI 推理创新,赋能千行百业,为我们创造更智能、更美好的生活...
2025-03-06
·
浏览85次

告别跑酷!波士顿动力 Atlas 机器人,正式进厂「搬砖」

波士顿动力公司刚刚发布了 Atlas 机器人的新视频,这位曾经以跑酷和空翻闻名的「网红」,如今竟然走进了工厂,开始认真从事零件排序工作!这标志着 Atlas 从「炫技」到「实用...
2025-03-06
·
浏览88次