豆包编程能力升级:支持 HTML 代码实时预览、交互,号称 3 分钟做出专属小游戏
目前豆包支持HTML代码实时预览和交互,可以更加直观地制作各类小游戏和网页;支持Python代码直接运行,报错可一键修复。同时,豆包还支持生成完整的项目代码,用户无需分别生成前...
2025-03-20
·
浏览484次
感谢 DeepSeek:Predibase 发布全球首个端到端强化微调平台并开源,支持无服务器和端到端训练方法
Predibase 表示,DeepSeek-R1 的开源在全球 AI 领域产生了巨大影响,让很多人意识到强化学习微调对训练大模型的重要性。受此启发,他们开发了这个端到端无服务器...
2025-03-20
·
浏览354次
地表最贵 AI 模型:OpenAI 推出 o1-pro API,每百万 tokens 输入 150 / 输出 600 美元
OpenAI 昨日(3 月 19 日)在 X 平台发布推文,宣布通过开发者 API,正式推出 o1 系列升级版“o1-pro”,宣称其通过更高计算资源投入实现“更一致且优质的回...
2025-03-20
·
浏览279次
英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员
英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型,支持“智能体 AI”系统,可独立推理、规划并执行多步骤任务,适用于机器人、自动化和决策优化等场景,显著降...
2025-03-20
·
浏览455次
揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍
揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍...
2025-03-19
·
浏览456次
用LLM做半导体设计,IBM&MIT提出受神经启发的LLM推理网络SOLOMON
来自 IBM TJ 沃森研究中心和 MIT-IBM 沃森人工智能实验室的研究人员提出了一种受神经启发的 LLM 推理网络 ——SOLOMON,旨在增强领域特定的适应性。...
2025-03-19
·
浏览375次
本地也能运行Deep Research!支持arXiv平台,兼容PDF、Markdown等
今年年初,OpenAI 上线 Deep Research,开启了智能体又一新阶段,其能根据用户需求自主进行网络信息检索、整合多源信息、深度分析数据,并最终为用户提供全面深入的解...
2025-03-19
·
浏览368次
OpenAI 后训练研究负责人离职,创办材料科学 AI 初创公司
OpenAI负责后训练研究的副总裁Liam Fedus宣布离职,创立一家专注于材料科学的人工智能初创企业。OpenAI计划投资并与其建立合作关系。Fedus的公司将与谷歌Dee...
2025-03-19
·
浏览380次
生成式 AI 已过时:英伟达黄仁勋首提 Agentic AI,后续是机器人 Physical AI
现在我们处于生成式 AI(Generative AI)阶段,但根据黄仁勋的路线图,我们将迈向一个代理式 AI(Agentic AI)时代,随后是物理 AI(Physical A...
2025-03-19
·
浏览480次
英伟达 Grace Blackwell 解决方案已全面投产,黄仁勋展示各厂商数据中心机架
黄仁勋展示了使用 Grace Blackwell 的各厂商数据中心机架,可以看到包括联想、戴尔、微软、亚马逊 AWS、Meta、谷歌等。...
2025-03-19
·
浏览446次
英伟达 Dynamo 发布:号称“AI 工厂的操作系统”,Blackwell 买得越多、省得越多
Dynamo 是一个“分布式推理服务库”。本质上,它是一个针对用户需求 token 而无法生产足够 token 之间问题的开源解决方案。...
2025-03-19
·
浏览427次
英伟达新一代 AI 芯片 Rubin 重磅官宣,2026 年下半年推出
Vera Rubin NVL144 将于 2026 年下半年推出,而 Rubin Ultra NVL576 将于 2027 年下半年推出。...
2025-03-19
·
浏览404次
英伟达下下一代 AI 芯片架构命名 Feynman:取自物理学家费曼,2028 年登场
在今日凌晨的英伟达 GTC 2025 大会上,英伟达 CEO 黄仁勋公布了新一代 AI 芯片 Rubin,将于 2026 年推出。随后,黄仁勋在一个路线图 PPT 中宣布,Ru...
2025-03-19
·
浏览412次
英伟达推出全球首款开源人形机器人功能模型 GR00T N1
英伟达 GTC 2025 大会正在进行中,英伟达 CEO 黄仁勋宣布推出 GR00T N1,这是机器人的通用基础模型。英伟达还推出了 Simulation Frameworks...
2025-03-19
·
浏览426次
英伟达宣布创造满血 DeepSeek-R1 模型 AI 推理性能的世界纪录
英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。...
2025-03-19
·
浏览366次
谷歌升级 Gemini 2.0 系列模型,AI 助手可免费深度推理
此次更新标志着谷歌进一步普及AI工具,降低用户使用门槛。通过免费开放核心功能与优化模型性能,谷歌持续强化其AI生态竞争力。未来若能明确Pro版本优势并完善隐私保障,或将进一步推...
2025-03-18
·
浏览337次
超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO
DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率,不过其论文中似乎还缺少一些关键细节,让人难以复现出大规模和工业级的强化学习系统。...
2025-03-18
·
浏览657次
单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香
多模态,性能超 GPT-4o Mini、Gemma 3,还能在单个 RTX 4090 上运行,这个小模型值得一试。...
2025-03-18
·
浏览482次
多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代
DeepSeek-R1 问世后,我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。...
2025-03-18
·
浏览356次
全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开
全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开...
2025-03-18
·
浏览308次
无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025
来自北京大学、卡耐基梅隆大学、斯坦福大学等机构的研究团队提出 TFG-Flow 框架,在无需额外训练的条件下,成功实现了多模态数据的定向分子生成。该方法在量子属性匹配、结构相似...
2025-03-18
·
浏览424次
AI 中文社