入门 标签,匹配到约56个结果, 耗时0.0326秒


DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们之前也多次报道过该技术,比如《DeepSee...
2025-03-02
·
浏览160次

两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?

刚刚过去的春节,DeepSeek-R1 推理大模型引爆了国内外 AI 社区,并火出了圈。...
2025-02-21
·
浏览215次


字节最新OmniHuman数字人模型即将上线即梦

采用了全新的多模态视频生成模型OmniHuman,用户仅需输入一张图片和一段音频,就可以生成一条生动的AI视频,有望大幅提升AI短片的制作效率和质量。...
2025-02-07
·
浏览119次

腾讯云TI平台支持DeepSeek系列模型,开发者可免费体验、一键部署

腾讯云TI平台宣布上架DeepSeek系列模型,包括“满血”的V3、R1原版模型,参数量达到671B;以及基于DeepSeek-R1蒸馏得到的系列模型,参数规模从70B到1.5...
2025-02-06
·
浏览167次


成功率达100%,上交团队提出AI辅助的酶热稳定性工程策略,设计热稳定性的组合突变体

本研究提出的人工智能辅助的酶热稳定性工程策略,可以高效地组合多个有益单点突变。...
2025-02-03
·
浏览121次

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

过年这几天,DeepSeek 算是彻底破圈了,火遍大江南北,火到人尽皆知。...
2025-02-03
·
浏览946次



逆向设计电路,深度学习开辟全新的自动综合道路

来自美国普林斯顿大学与印度理工学院的联合团队展示了一种通用的逆向设计方法,用于具有设计辐射和散射特性的任意形状复杂多端口电磁结构,与有源电路共同设计。...
2025-01-09
·
浏览167次

Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。...
2025-01-04
·
浏览123次






谷歌、MIT等开发多智能体医疗决策框架MDAgents,医学LLM新用法

麻省理工学院、谷歌研究院和首尔国立大学医院的研究人员提出了一种新颖的多智能体框架,称为医疗决策智能体 (MDAgents),它通过自动为 LLM 团队分配协作结构来帮助解决这一...
2024-11-10
·
浏览405次


化学空间导航仪:流生成式AI引导分子属性控制

来自康奈尔、哈佛、加州理工和深度原理的研究者们联合提出了一个名为ChemFlow的生成式AI新框架,被收录在2024年的NeurIPS会议中。...
2024-10-15
·
浏览232次

除了Ilya,刚拿诺奖的Hinton还教出了这些AI博士

自近日获知自己摘得诺贝尔物理学奖之后,76 岁的人工智能教父 Geoffrey Hinton 便「闲不住」了。...
2024-10-14
·
浏览276次

Kimi探索版发布,10倍搜索量自主解决复杂问题

2024年10月11日,通用人工智能创业公司——月之暗面正式发布可自主海量搜索解决复杂问题的 Kimi 探索版。...
2024-10-13
·
浏览291次

OpenAI今天Open了一下:开源多智能体框架Swarm

毫无疑问,多智能体肯定是 OpenAI 未来重要的研究方向之一,前些天 OpenAI 著名研究科学家 Noam Brown 还在 X 上为 OpenAI 正在组建的一个新的多智...
2024-10-13
·
浏览453次