AI 中文社区

豆包编程能力升级：支持 HTML 代码实时预览、交互，号称 3 分钟做出专属小游戏

目前豆包支持HTML代码实时预览和交互，可以更加直观地制作各类小游戏和网页；支持Python代码直接运行，报错可一键修复。同时，豆包还支持生成完整的项目代码，用户无需分别生成前...

2025-03-20 · 浏览484次

感谢 DeepSeek：Predibase 发布全球首个端到端强化微调平台并开源，支持无服务器和端到端训练方法

Predibase 表示，DeepSeek-R1 的开源在全球 AI 领域产生了巨大影响，让很多人意识到强化学习微调对训练大模型的重要性。受此启发，他们开发了这个端到端无服务器...

2025-03-20 · 浏览354次

地表最贵 AI 模型：OpenAI 推出 o1-pro API，每百万 tokens 输入 150 / 输出 600 美元

OpenAI 昨日（3 月 19 日）在 X 平台发布推文，宣布通过开发者 API，正式推出 o1 系列升级版“o1-pro”，宣称其通过更高计算资源投入实现“更一致且优质的回...

2025-03-20 · 浏览279次

英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型，支持“智能体 AI”系统，可独立推理、规划并执行多步骤任务，适用于机器人、自动化和决策优化等场景，显著降...

2025-03-20 · 浏览455次

揭秘老黄演讲中关键技术：PD分离！UCSD华人团队力作，LLM吞吐量跃升4倍

揭秘老黄演讲中关键技术：PD分离！UCSD华人团队力作，LLM吞吐量跃升4倍...

2025-03-19 · 浏览456次

Gemini大升级！谷歌引爆程序员革命：编程只需一句话，不到1分钟

Gemini大升级！谷歌引爆程序员革命：编程只需一句话，不到1分钟...

2025-03-19 · 浏览300次

用LLM做半导体设计，IBM&MIT提出受神经启发的LLM推理网络SOLOMON

来自 IBM TJ 沃森研究中心和 MIT-IBM 沃森人工智能实验室的研究人员提出了一种受神经启发的 LLM 推理网络 ——SOLOMON，旨在增强领域特定的适应性。...

2025-03-19 · 浏览375次

本地也能运行Deep Research！支持arXiv平台，兼容PDF、Markdown等

今年年初，OpenAI 上线 Deep Research，开启了智能体又一新阶段，其能根据用户需求自主进行网络信息检索、整合多源信息、深度分析数据，并最终为用户提供全面深入的解...

2025-03-19 · 浏览368次

OpenAI 后训练研究负责人离职，创办材料科学 AI 初创公司

OpenAI负责后训练研究的副总裁Liam Fedus宣布离职，创立一家专注于材料科学的人工智能初创企业。OpenAI计划投资并与其建立合作关系。Fedus的公司将与谷歌Dee...

2025-03-19 · 浏览380次

生成式 AI 已过时：英伟达黄仁勋首提 Agentic AI，后续是机器人 Physical AI

现在我们处于生成式 AI（Generative AI）阶段，但根据黄仁勋的路线图，我们将迈向一个代理式 AI（Agentic AI）时代，随后是物理 AI（Physical A...

2025-03-19 · 浏览480次

英伟达 Grace Blackwell 解决方案已全面投产，黄仁勋展示各厂商数据中心机架

黄仁勋展示了使用 Grace Blackwell 的各厂商数据中心机架，可以看到包括联想、戴尔、微软、亚马逊 AWS、Meta、谷歌等。...

2025-03-19 · 浏览446次

英伟达 Dynamo 发布：号称“AI 工厂的操作系统”，Blackwell 买得越多、省得越多

Dynamo 是一个“分布式推理服务库”。本质上，它是一个针对用户需求 token 而无法生产足够 token 之间问题的开源解决方案。...

2025-03-19 · 浏览427次

英伟达新一代 AI 芯片 Rubin 重磅官宣，2026 年下半年推出

Vera Rubin NVL144 将于 2026 年下半年推出，而 Rubin Ultra NVL576 将于 2027 年下半年推出。...

2025-03-19 · 浏览404次

英伟达下下一代 AI 芯片架构命名 Feynman：取自物理学家费曼，2028 年登场

在今日凌晨的英伟达 GTC 2025 大会上，英伟达 CEO 黄仁勋公布了新一代 AI 芯片 Rubin，将于 2026 年推出。随后，黄仁勋在一个路线图 PPT 中宣布，Ru...

2025-03-19 · 浏览412次

英伟达推出全球首款开源人形机器人功能模型 GR00T N1

英伟达 GTC 2025 大会正在进行中，英伟达 CEO 黄仁勋宣布推出 GR00T N1，这是机器人的通用基础模型。英伟达还推出了 Simulation Frameworks...

2025-03-19 · 浏览426次

英伟达宣布创造满血 DeepSeek-R1 模型 AI 推理性能的世界纪录

英伟达表示，随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限，其性能将会继续不断提高。...

2025-03-19 · 浏览366次

谷歌升级 Gemini 2.0 系列模型，AI 助手可免费深度推理

此次更新标志着谷歌进一步普及AI工具，降低用户使用门槛。通过免费开放核心功能与优化模型性能，谷歌持续强化其AI生态竞争力。未来若能明确Pro版本优势并完善隐私保障，或将进一步推...

2025-03-18 · 浏览337次

超越DeepSeek GRPO的关键RL算法，字节、清华AIR开源DAPO

DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率，不过其论文中似乎还缺少一些关键细节，让人难以复现出大规模和工业级的强化学习系统。...

2025-03-18 · 浏览657次

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

多模态，性能超 GPT-4o Mini、Gemma 3，还能在单个 RTX 4090 上运行，这个小模型值得一试。...

2025-03-18 · 浏览482次

多模态也做到了强推理！工业界首个开源的R1V，让视觉思考进入o1时代

DeepSeek-R1 问世后，我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。...

2025-03-18 · 浏览356次

AI真·抢饭碗？美国码农就业跌至1980年以来最低，重回「吃豆人」时代

AI真·抢饭碗？美国码农就业跌至1980年以来最低，重回「吃豆人」时代...

2025-03-18 · 浏览462次

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开...

2025-03-18 · 浏览308次

真正的AI智能体时代即将到来，我们发现了几点「苦涩的教训」

最近一段时间，智能体（Agent）再次成为 AI 领域热议的焦点。...

2025-03-18 · 浏览514次

无需训练即可定制分子生成：全新多模态引导框架TFG-Flow登上ICLR 2025

来自北京大学、卡耐基梅隆大学、斯坦福大学等机构的研究团队提出 TFG-Flow 框架，在无需额外训练的条件下，成功实现了多模态数据的定向分子生成。该方法在量子属性匹配、结构相似...

2025-03-18 · 浏览424次