出人意料!DeepSeek-R1用的GRPO其实没必要?规模化强化学习训练用PPO就够了

出人意料!DeepSeek-R1用的GRPO其实没必要?规模化强化学习训练用PPO就够了

出人意料!DeepSeek-R1用的GRPO其实没必要?规模化强化学习训练用PPO就够了
DeepSeek-R1 非常热门,而在其公布的训练配方中,GRPO(Group Relative Policy Optimization)非常关键,是 DeepSeek-R1 ...
2025-02-21 · 浏览183次
物理直觉不再是人类专属?LeCun等新研究揭示AI可如何涌现出此能力

物理直觉不再是人类专属?LeCun等新研究揭示AI可如何涌现出此能力

物理直觉不再是人类专属?LeCun等新研究揭示AI可如何涌现出此能力
在当今的 AI 领域,图灵奖得主 Yann LeCun 算是一个另类。...
2025-02-21 · 浏览121次
重磅发现!DeepSeek R1方法成功迁移到视觉领域,多模态AI迎来新突破!

重磅发现!DeepSeek R1方法成功迁移到视觉领域,多模态AI迎来新突破!

重磅发现!DeepSeek R1方法成功迁移到视觉领域,多模态AI迎来新突破!
嘿,各位开发小伙伴,今天要给大家安利一个全新的开源项目 ——VLM-R1!...
2025-02-21 · 浏览138次
2025年度国际挑战赛正式启动,期待你的加入!

2025年度国际挑战赛正式启动,期待你的加入!

2025年度国际挑战赛正式启动,期待你的加入!
2025年度国际挑战赛旨在通过全球合作促进具身智能与自动驾驶领域的发展。赛事汇聚全球顶尖团队,推动创新实践。挑战赛道覆盖 人形机器人世界模型、端到端自动驾驶、机器人操作三大领域...
2025-02-21 · 浏览157次
再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件

再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件

再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件
一直以来,研究者普遍认为,去噪扩散模型要想成功运行,噪声条件是必不可少的。...
2025-02-21 · 浏览148次
OpenAI 周活跃用户达 4 亿,高管称用户“口口相传”发现其价值

OpenAI 周活跃用户达 4 亿,高管称用户“口口相传”发现其价值

OpenAI 周活跃用户达 4 亿,高管称用户“口口相传”发现其价值
莱特凯普解释道:“人们通过口碑了解 ChatGPT,发现它的实用性,看到朋友们在使用它。”他还补充道,用户通常需要一些时间才能找到与自己需求相契合的使用场景。...
2025-02-21 · 浏览130次
OpenAI GPT-4.5 有望下周发布,GPT-5 被曝将与 o3 大一统、定档 5 月底

OpenAI GPT-4.5 有望下周发布,GPT-5 被曝将与 o3 大一统、定档 5 月底

OpenAI GPT-4.5 有望下周发布,GPT-5 被曝将与 o3 大一统、定档 5 月底
据外媒 The Verge 今日消息,据了解公司计划的知情人士透露,微软工程师目前正在为 OpenAI 即将推出的 GPT-4.5 和 GPT-5 模型准备服务器容量。...
2025-02-21 · 浏览138次
抛弃OpenAI,Figure亮王牌:史上首次两个机器人「共脑」,网友直呼太恐怖!

抛弃OpenAI,Figure亮王牌:史上首次两个机器人「共脑」,网友直呼太恐怖!

抛弃OpenAI,Figure亮王牌:史上首次两个机器人「共脑」,网友直呼太恐怖!
抛弃OpenAI,Figure亮王牌:史上首次两个机器人「共脑」,网友直呼太恐怖!...
2025-02-21 · 浏览133次
突发,Grok-3免费上线!答对9.11和9.9谁大,1分攻克MIT积分难题

突发,Grok-3免费上线!答对9.11和9.9谁大,1分攻克MIT积分难题

突发,Grok-3免费上线!答对9.11和9.9谁大,1分攻克MIT积分难题
突发,Grok-3免费上线!答对9.11和9.9谁大,1分攻克MIT积分难题...
2025-02-20 · 浏览122次
「开源类脑芯片」二代发布!支持反向传播突触学习规则和并行神经元计算

「开源类脑芯片」二代发布!支持反向传播突触学习规则和并行神经元计算

「开源类脑芯片」二代发布!支持反向传播突触学习规则和并行神经元计算
「开源类脑芯片」二代发布!支持反向传播突触学习规则和并行神经元计算...
2025-02-20 · 浏览100次
2025最强开发者盛宴倒计时,MIT顶级大神亲授秘籍!百亿招标等你拿

2025最强开发者盛宴倒计时,MIT顶级大神亲授秘籍!百亿招标等你拿

2025最强开发者盛宴倒计时,MIT顶级大神亲授秘籍!百亿招标等你拿
2025最强开发者盛宴倒计时,MIT顶级大神亲授秘籍!百亿招标等你拿...
2025-02-20 · 浏览115次
iPhone 16e强势来袭,自研5G芯片首秀!搭载A18支持苹果AI,4499元起

iPhone 16e强势来袭,自研5G芯片首秀!搭载A18支持苹果AI,4499元起

iPhone 16e强势来袭,自研5G芯片首秀!搭载A18支持苹果AI,4499元起
iPhone 16e强势来袭,自研5G芯片首秀!搭载A18支持苹果AI,4499元起...
2025-02-20 · 浏览80次
单机支持500人团队,无问芯穹「满血DeepSeek-R1多并发一体机」同时支持联网/本地搜索

单机支持500人团队,无问芯穹「满血DeepSeek-R1多并发一体机」同时支持联网/本地搜索

单机支持500人团队,无问芯穹「满血DeepSeek-R1多并发一体机」同时支持联网/本地搜索
单机支持500人团队,无问芯穹「满血DeepSeek-R1多并发一体机」同时支持联网/本地搜索...
2025-02-20 · 浏览153次
DeepSeek 被曝首次考虑进行外部融资,巨头阿里巴巴有意参投

DeepSeek 被曝首次考虑进行外部融资,巨头阿里巴巴有意参投

DeepSeek 被曝首次考虑进行外部融资,巨头阿里巴巴有意参投
外媒 The Information 报道提到,由于其 AI 模型大受欢迎,因而要增加资源投放以满足明显增加的需求,所以促成内部讨论引入更多投资者。...
2025-02-20 · 浏览132次
谷歌推出“AI 实验室助理”:能推理分析、提出假设、优化方案

谷歌推出“AI 实验室助理”:能推理分析、提出假设、优化方案

谷歌推出“AI 实验室助理”:能推理分析、提出假设、优化方案
谷歌表示,在一项关于肝纤维化的实验中,这个“助理”提出的所有方法都展现了抑制疾病原因的潜力,且活性表现十分积极。...
2025-02-20 · 浏览140次
最豪华大模型创业阵容!OpenAI前CTO组建,翁荔、Schulman等ChatGPT核心成员加盟

最豪华大模型创业阵容!OpenAI前CTO组建,翁荔、Schulman等ChatGPT核心成员加盟

最豪华大模型创业阵容!OpenAI前CTO组建,翁荔、Schulman等ChatGPT核心成员加盟
今天凌晨,一个创业消息引爆了整个 AI 社区:一家名为 Thinking Machines Lab 的新创业公司建立了,而其背后有一个堪称有史以来最豪华的大模型创业团队阵容。...
2025-02-20 · 浏览133次
Claude挣钱强于o1!OpenAI开源百万美元编码基准,检验大模型钞能力

Claude挣钱强于o1!OpenAI开源百万美元编码基准,检验大模型钞能力

Claude挣钱强于o1!OpenAI开源百万美元编码基准,检验大模型钞能力
昨天,AI 圈可以说非常热闹。...
2025-02-20 · 浏览120次
DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍

DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍

DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍
DeepSeek V3/ R1 火爆全网,基于原始模型的解决方案和 API 服务已随处可见,陷入低价和免费内卷。...
2025-02-20 · 浏览176次
撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开

撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开

撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开
昨天下午,DeepSeek 发布了一篇新论文,提出了一种改进版的注意力机制 NSA;加上还有创始人兼 CEO 梁文锋亲自参与,一时之间吸引眼球无数...
2025-02-20 · 浏览135次
Springer知识蒸馏专著解读 | 面向图像识别的知识蒸馏综述

Springer知识蒸馏专著解读 | 面向图像识别的知识蒸馏综述

Springer知识蒸馏专著解读 | 面向图像识别的知识蒸馏综述
该篇文章的主要内容是整理了面向图像识别的知识蒸馏的相关工作。...
2025-02-20 · 浏览160次
大模型强化学习新发现:删减84%数据反提升效果

大模型强化学习新发现:删减84%数据反提升效果

大模型强化学习新发现:删减84%数据反提升效果
在人工智能领域,"更大即更强" 的理念一直主导着大模型强化学习的发展方向。...
2025-02-20 · 浏览133次
OpenAI:强化学习确实可显著提高LLM性能,DeepSeek R1、Kimi k1.5发现o1的秘密

OpenAI:强化学习确实可显著提高LLM性能,DeepSeek R1、Kimi k1.5发现o1的秘密

OpenAI:强化学习确实可显著提高LLM性能,DeepSeek R1、Kimi k1.5发现o1的秘密
最近,OpenAI 发了一篇论文,宣称 o3 模型在 2024 IOI 上达到了金牌水平,并且在 CodeForces 上获得了与精英级人类相当的得分。...
2025-02-20 · 浏览168次
OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一
OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一...
2025-02-19 · 浏览133次
英伟达CEO老黄预言:未来,每个人都自己的AI导师!

英伟达CEO老黄预言:未来,每个人都自己的AI导师!

英伟达CEO老黄预言:未来,每个人都自己的AI导师!
英伟达CEO老黄预言:未来,每个人都自己的AI导师!...
2025-02-19 · 浏览99次
第一页 · 上一页 · 下一页 · 当前第32页