训练模型 标签,匹配到约366个结果, 耗时0.3184秒
模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平
现阶段,微调大型语言模型(LLMs)的难点在于,人们通常没有高质量的标注数据。...
2025-03-30 · 浏览17次
3D领域DeepSeek「源神」启动!国产明星创业公司,一口气开源八大项目

3D领域DeepSeek「源神」启动!国产明星创业公司,一口气开源八大项目

3D领域DeepSeek「源神」启动!国产明星创业公司,一口气开源八大项目
2025 开年,DeepSeek-R1 的成功在全球掀起了一股开源风潮,上个月的开源周更是毫无保留地将自己的多项核心技术开放给了全球开发者。...
2025-03-28 · 浏览35次
活性提升65倍,山大新AI工具定向进化高活性酶,外部数据集验证成功率达80%

活性提升65倍,山大新AI工具定向进化高活性酶,外部数据集验证成功率达80%

活性提升65倍,山大新AI工具定向进化高活性酶,外部数据集验证成功率达80%
以山东大学为主导的团队提出了一种基于预训练模型和分子指纹的深度学习模型 CataPro ,并用它来预测转换数(k(cat))、米歇尔常数(K(m))和催化效率(k(cat)/K...
2025-03-26 · 浏览54次
上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能
近日,上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合数据科学和统计研究院、财跃星辰、滴水湖高级金融学院正式发布首款 ...
2025-03-26 · 浏览58次
牛津教授惊人预警:AI十年科学发现,顶人类100年!科研速度已超人类500倍

牛津教授惊人预警:AI十年科学发现,顶人类100年!科研速度已超人类500倍

牛津教授惊人预警:AI十年科学发现,顶人类100年!科研速度已超人类500倍
牛津教授惊人预警:AI十年科学发现,顶人类100年!科研速度已超人类500倍...
2025-03-25 · 浏览47次
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?...
2025-03-25 · 浏览65次
腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?
在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。...
2025-03-24 · 浏览47次
Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页

Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页

Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页
Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页...
2025-03-24 · 浏览50次
地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型

地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型

地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型
OpenAI 的 o1 和 DeepSeek 的 R1 模型在数学,科学等复杂领域达到甚至超过了人类专家的水平,强化学习训练和推理技术是其中的关键。...
2025-03-24 · 浏览50次
揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案

揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案

揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案
其实大模型在DeepSeek-V3时期就已经「顿悟」了?...
2025-03-23 · 浏览89次
英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命
英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命...
2025-03-22 · 浏览39次
被谷歌点名感谢!杭州六小龙开源黑科技,让机器人瞬间「悟透」3D世界

被谷歌点名感谢!杭州六小龙开源黑科技,让机器人瞬间「悟透」3D世界

被谷歌点名感谢!杭州六小龙开源黑科技,让机器人瞬间「悟透」3D世界
被谷歌点名感谢!杭州六小龙开源黑科技,让机器人瞬间「悟透」3D世界...
2025-03-20 · 浏览54次
感谢 DeepSeek:Predibase 发布全球首个端到端强化微调平台并开源,支持无服务器和端到端训练方法

感谢 DeepSeek:Predibase 发布全球首个端到端强化微调平台并开源,支持无服务器和端到端训练方法

感谢 DeepSeek:Predibase 发布全球首个端到端强化微调平台并开源,支持无服务器和端到端训练方法
Predibase 表示,DeepSeek-R1 的开源在全球 AI 领域产生了巨大影响,让很多人意识到强化学习微调对训练大模型的重要性。受此启发,他们开发了这个端到端无服务器...
2025-03-20 · 浏览51次
无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025

无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025

无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025
来自北京大学、卡耐基梅隆大学、斯坦福大学等机构的研究团队提出 TFG-Flow 框架,在无需额外训练的条件下,成功实现了多模态数据的定向分子生成。该方法在量子属性匹配、结构相似...
2025-03-18 · 浏览82次
统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍

统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍

统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍
最近的研究强调了扩散模型与表征学习之间的相互作用。...
2025-03-17 · 浏览63次
谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路

谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路

谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路
谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路...
2025-03-16 · 浏览88次
全球首个化学反应AI「考场」,7种MLIPs模型与SOTA生成式模型同场PK

全球首个化学反应AI「考场」,7种MLIPs模型与SOTA生成式模型同场PK

全球首个化学反应AI「考场」,7种MLIPs模型与SOTA生成式模型同场PK
深度原理(Deep Principle)联合深势科技,清华大学,加州大学伯克利分校等机构开发了基于过渡态搜索框架 Yet Another Reaction Program(YA...
2025-03-16 · 浏览56次
没有归一化层的Transformer!刘壮带队,何恺明、Yann LeCun都参与了

没有归一化层的Transformer!刘壮带队,何恺明、Yann LeCun都参与了

没有归一化层的Transformer!刘壮带队,何恺明、Yann LeCun都参与了
何恺明又双叒叕发新作了,这次还是与图灵奖得主 Yann LeCun 合作。...
2025-03-16 · 浏览75次
何恺明LeCun暴击Transformer命门,9行代码砍掉归一化层!性能反而更强了?

何恺明LeCun暴击Transformer命门,9行代码砍掉归一化层!性能反而更强了?

何恺明LeCun暴击Transformer命门,9行代码砍掉归一化层!性能反而更强了?
何恺明LeCun暴击Transformer命门,9行代码砍掉归一化层!性能反而更强了?...
2025-03-14 · 浏览74次
超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场
大语言模型(LLM)在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力,比如 OpenAI 的 o1 系列。...
2025-03-13 · 浏览91次
使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独
没有任何冷启动数据,7B 参数模型能单纯通过强化学习学会玩数独吗?...
2025-03-12 · 浏览96次
Manus被破解了?曝出系统提示词和背后大模型,CTO也回复了

Manus被破解了?曝出系统提示词和背后大模型,CTO也回复了

Manus被破解了?曝出系统提示词和背后大模型,CTO也回复了
最近几天,一个叫「Manus」的通用 AI Agent 产品刷屏网络。...
2025-03-11 · 浏览107次
15B硬刚GPT-4o,CMU祭出LCPO提示可控思考!每token性能较S1暴涨2倍

15B硬刚GPT-4o,CMU祭出LCPO提示可控思考!每token性能较S1暴涨2倍

15B硬刚GPT-4o,CMU祭出LCPO提示可控思考!每token性能较S1暴涨2倍
15B硬刚GPT-4o,CMU祭出LCPO提示可控思考!每token性能较S1暴涨2倍...
2025-03-09 · 浏览79次
ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割

ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割

ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割
当人形机器人能够辨识身边的一切,VR/AR 设备呈现出定制化的虚拟世界,自动驾驶汽车实时捕捉路面状况,这一切都依赖于对 3D 场景的精确理解。...
2025-03-09 · 浏览83次
第一页 · 上一页 · 下一页 · 当前第1页