


用LLM做半导体设计,IBM&MIT提出受神经启发的LLM推理网络SOLOMON

来自 IBM TJ 沃森研究中心和 MIT-IBM 沃森人工智能实验室的研究人员提出了一种受神经启发的 LLM 推理网络 ——SOLOMON,旨在增强领域特定的适应性。...
2025-03-19
·
浏览96次

本地也能运行Deep Research!支持arXiv平台,兼容PDF、Markdown等

今年年初,OpenAI 上线 Deep Research,开启了智能体又一新阶段,其能根据用户需求自主进行网络信息检索、整合多源信息、深度分析数据,并最终为用户提供全面深入的解...
2025-03-19
·
浏览103次

OpenAI 后训练研究负责人离职,创办材料科学 AI 初创公司

OpenAI负责后训练研究的副总裁Liam Fedus宣布离职,创立一家专注于材料科学的人工智能初创企业。OpenAI计划投资并与其建立合作关系。Fedus的公司将与谷歌Dee...
2025-03-19
·
浏览83次

生成式 AI 已过时:英伟达黄仁勋首提 Agentic AI,后续是机器人 Physical AI

现在我们处于生成式 AI(Generative AI)阶段,但根据黄仁勋的路线图,我们将迈向一个代理式 AI(Agentic AI)时代,随后是物理 AI(Physical A...
2025-03-19
·
浏览86次

英伟达 Grace Blackwell 解决方案已全面投产,黄仁勋展示各厂商数据中心机架

黄仁勋展示了使用 Grace Blackwell 的各厂商数据中心机架,可以看到包括联想、戴尔、微软、亚马逊 AWS、Meta、谷歌等。...
2025-03-19
·
浏览82次

英伟达 Dynamo 发布:号称“AI 工厂的操作系统”,Blackwell 买得越多、省得越多

Dynamo 是一个“分布式推理服务库”。本质上,它是一个针对用户需求 token 而无法生产足够 token 之间问题的开源解决方案。...
2025-03-19
·
浏览98次

英伟达新一代 AI 芯片 Rubin 重磅官宣,2026 年下半年推出

Vera Rubin NVL144 将于 2026 年下半年推出,而 Rubin Ultra NVL576 将于 2027 年下半年推出。...
2025-03-19
·
浏览71次

英伟达下下一代 AI 芯片架构命名 Feynman:取自物理学家费曼,2028 年登场

在今日凌晨的英伟达 GTC 2025 大会上,英伟达 CEO 黄仁勋公布了新一代 AI 芯片 Rubin,将于 2026 年推出。随后,黄仁勋在一个路线图 PPT 中宣布,Ru...
2025-03-19
·
浏览75次

英伟达推出全球首款开源人形机器人功能模型 GR00T N1

英伟达 GTC 2025 大会正在进行中,英伟达 CEO 黄仁勋宣布推出 GR00T N1,这是机器人的通用基础模型。英伟达还推出了 Simulation Frameworks...
2025-03-19
·
浏览102次

英伟达宣布创造满血 DeepSeek-R1 模型 AI 推理性能的世界纪录

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。...
2025-03-19
·
浏览101次

谷歌升级 Gemini 2.0 系列模型,AI 助手可免费深度推理

此次更新标志着谷歌进一步普及AI工具,降低用户使用门槛。通过免费开放核心功能与优化模型性能,谷歌持续强化其AI生态竞争力。未来若能明确Pro版本优势并完善隐私保障,或将进一步推...
2025-03-18
·
浏览80次

超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO

DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率,不过其论文中似乎还缺少一些关键细节,让人难以复现出大规模和工业级的强化学习系统。...
2025-03-18
·
浏览149次

单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香

多模态,性能超 GPT-4o Mini、Gemma 3,还能在单个 RTX 4090 上运行,这个小模型值得一试。...
2025-03-18
·
浏览89次

多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代

DeepSeek-R1 问世后,我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。...
2025-03-18
·
浏览131次


全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开

全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开...
2025-03-18
·
浏览100次


无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025

来自北京大学、卡耐基梅隆大学、斯坦福大学等机构的研究团队提出 TFG-Flow 框架,在无需额外训练的条件下,成功实现了多模态数据的定向分子生成。该方法在量子属性匹配、结构相似...
2025-03-18
·
浏览108次

摩尔线程开源 MT-MegatronLM 和 MT-TransformerEngine 两大 AI 框架

摩尔线程官方今日发文宣布,近日已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策...
2025-03-18
·
浏览91次

刚刚,o1/o3后训练掌门人出走创业,OpenAI鼎力支持押注AI材料!曾师从Bengio

刚刚,o1/o3后训练掌门人出走创业,OpenAI鼎力支持押注AI材料!曾师从Bengio...
2025-03-18
·
浏览87次

