AI 中文社区

ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割

当人形机器人能够辨识身边的一切，VR/AR 设备呈现出定制化的虚拟世界，自动驾驶汽车实时捕捉路面状况，这一切都依赖于对 3D 场景的精确理解。...

2025-03-09 · 浏览349次

微软甩开OpenAI自研大模型，还计划用DeepSeek

思维链引发的战争。...

2025-03-09 · 浏览315次

目标超级智能，前DeepMind科学家离职创业，获1.3亿刀融资

从来没见过人类做出这样的决策……太优美了。...

2025-03-09 · 浏览388次

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

随着 DeepSeek-R1 的流行与 AI4Math 研究的深入，大模型在辅助形式化证明写作方面的需求日益增长。...

2025-03-09 · 浏览291次

让SFT重新伟大！CMU等华人学者提出全新「批判式微调」，媲美复刻版DeepSeek

让SFT重新伟大！CMU等华人学者提出全新「批判式微调」，媲美复刻版DeepSeek...

2025-03-09 · 浏览308次

Manus火到国外？网友实测惊呆！00后博士生0天复刻霸榜开源第一

Manus火到国外？网友实测惊呆！00后博士生0天复刻霸榜开源第一...

2025-03-08 · 浏览584次

DeepSeek占比升至9.6%，稳居全球第二！「全球生成式AI行业趋势」发布

DeepSeek占比升至9.6%，稳居全球第二！「全球生成式AI行业趋势」发布...

2025-03-08 · 浏览210次

英伟达提出首个Mamba-Transformer视觉骨干网络！打破精度/吞吐瓶颈 | CVPR 2025

英伟达提出首个Mamba-Transformer视觉骨干网络！打破精度/吞吐瓶颈 | CVPR 2025...

2025-03-08 · 浏览374次

狂揽1.3亿美金！AlphaGo大神组队Gemini大牛，用RL打造超级智能，英伟达抢投

狂揽1.3亿美金！AlphaGo大神组队Gemini大牛，用RL打造超级智能，英伟达抢投...

2025-03-08 · 浏览207次

DeepSeek的MLA，任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界，特别是其训练与推理成本仅为同等性能大模型的数十分之一。...

2025-03-07 · 浏览447次

DeepSeek行业实战指南：下周四这场闭门会速来围观！

模型选型→场景部署→应用实战，这场闭门会一网打尽。...

2025-03-07 · 浏览326次

FP8训练新范式：减少40%显存占用，训练速度提高1.4倍

近期DeepSeek V3 引爆国内外的社交媒体，他们在训练中成功应用了 FP8 精度，显著降低了 GPU 内存使用和计算开销。...

2025-03-07 · 浏览501次

谷歌创始人拉里·佩奇出山成立大模型公司，目标智能制造

谷歌联合创始人、全球第七富豪拉里・佩奇 (Larry Page) 已经成立了一个 AI 创业公司。...

2025-03-07 · 浏览285次

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

个人设备进入最强模型时代。...

2025-03-07 · 浏览663次

消息称 Meta 的 Llama 4 模型将聚焦语音交互，全力开拓 AI 商业版图

据英国金融时报报道，社交媒体巨头 Meta 正在加速其人工智能的语音功能开发，计划在未来几周内推出其最新开源大语言模型 Llama 4，并将语音交互作为核心功能之一。据知情人士...

2025-03-07 · 浏览495次

消息称微软正开发内部 AI 推理模型，并测试 xAI、DeepSeek 等多种 OpenAI 替代方案

外媒The Information 今晚发布消息称，微软正在开发内部人工智能推理模型，以与OpenAI竞争，并可能向开发者出售。...

2025-03-07 · 浏览398次

谁是最强AI研究助手？Meta等提出全新基准MLGym：LLM智能体大排名

谁是最强AI研究助手？Meta等提出全新基准MLGym：LLM智能体大排名...

2025-03-07 · 浏览334次

32B击败DeepSeek-R1、o3-mini，成本暴降100倍！GRPO让小模型称霸推理

32B击败DeepSeek-R1、o3-mini，成本暴降100倍！GRPO让小模型称霸推理...

2025-03-07 · 浏览507次

Ilya再融20亿SSI估值300亿！20人王牌团队首曝光，阵容超豪华

Ilya再融20亿SSI估值300亿！20人王牌团队首曝光，阵容超豪华...

2025-03-07 · 浏览376次

Nature:如何借助AI高效完成学术论文同行评审

研究者 Dritjon Gruda 在社交媒体上进行了一项非正式调查。他在 1 月份的 Facebook 和 LinkedIn 上发布帖子，询问学术同行花费多少时间审阅论文。...

2025-03-06 · 浏览377次

快1000倍，十万分之一误差，深度学习模型降低核聚变等离子体预测计算成本

FPL-net 获得结果的速度比以前的方法快 1,000 倍，误差幅度仅为十万分之一，表现出卓越的准确性。...

2025-03-06 · 浏览279次

ET-SEED：提升机器人操作泛化能力的高效等变扩散策略

本文提出了一种轨迹级别 SE (3) 等变的扩散策略（ET-SEED），通过将等变表示学习和扩散策略结合，使机器人能够在极少的示范数据下高效学习复杂操作技能，并能够泛化到不同物...

2025-03-06 · 浏览277次

智源开源多模态向量模型BGE-VL：多模态检索新突破

BGE 系列模型自发布以来广受社区好评。...

2025-03-06 · 浏览415次

当开源创新遇上推理革命：SGLang如何炼就DeepSeek最强开源推理引擎？

2025 年开年，DeepSeek R1 和 V3 重磅发布，其超强的语言建模与推理能力，引爆了全球 AI 社区。...

2025-03-06 · 浏览1311次