理想 标签,匹配到约238个结果, 耗时0.0325秒
火了!高中生用Minecraft做AI基准,用户看图投票决定大模型排名

火了!高中生用Minecraft做AI基准,用户看图投票决定大模型排名

火了!高中生用Minecraft做AI基准,用户看图投票决定大模型排名
偶然发现了一个很有趣的 AI 基准测试,点开链接,竟然是一个 MineCraft 作品投票页面?...
2025-03-24 · 浏览53次
生信工具评测方法:基于蛋白质对的计算机预测工具评估

生信工具评测方法:基于蛋白质对的计算机预测工具评估

生信工具评测方法:基于蛋白质对的计算机预测工具评估
在这里,埃默里大学(Emory University)的研究人员探索了现有方法在预测数千种此类蛋白质的分子功能方面的潜力和局限性。...
2025-03-23 · 浏览40次
AI自我纠错,Diffusion超越自回归!质量提升55%,已达理论证据下界

AI自我纠错,Diffusion超越自回归!质量提升55%,已达理论证据下界

AI自我纠错,Diffusion超越自回归!质量提升55%,已达理论证据下界
AI自我纠错,Diffusion超越自回归!质量提升55%,已达理论证据下界...
2025-03-23 · 浏览63次
揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍

揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍

揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍
揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍...
2025-03-19 · 浏览50次
真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」

真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」

真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」
最近一段时间,智能体(Agent)再次成为 AI 领域热议的焦点。...
2025-03-18 · 浏览213次
统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍

统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍

统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍
最近的研究强调了扩散模型与表征学习之间的相互作用。...
2025-03-17 · 浏览63次
谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路

谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路

谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路
谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路...
2025-03-16 · 浏览88次
AI进入推理模型时代,一文带你读懂思维链

AI进入推理模型时代,一文带你读懂思维链

AI进入推理模型时代,一文带你读懂思维链
近段时间,推理模型 DeepSeek R1 可说是 AI 领域的头号话题。...
2025-03-16 · 浏览101次
纽约时报重磅曝料:特朗普任期内将实现AGI,美国政府早知AGI即将降临!

纽约时报重磅曝料:特朗普任期内将实现AGI,美国政府早知AGI即将降临!

纽约时报重磅曝料:特朗普任期内将实现AGI,美国政府早知AGI即将降临!
纽约时报重磅曝料:特朗普任期内将实现AGI,美国政府早知AGI即将降临!...
2025-03-15 · 浏览85次
百万美金炼出「调参秘籍」!阶跃星辰开源LLM最优超参工具

百万美金炼出「调参秘籍」!阶跃星辰开源LLM最优超参工具

百万美金炼出「调参秘籍」!阶跃星辰开源LLM最优超参工具
近日,阶跃星辰研究团队通过大规模实证探索,耗费了近 100 万 NVIDIA H800 GPU 小时(约百万美元),从头训练了 3,700 个不同规模,共计训了 100 万亿个...
2025-03-13 · 浏览94次
超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场
大语言模型(LLM)在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力,比如 OpenAI 的 o1 系列。...
2025-03-13 · 浏览91次
Open-Sora 2.0全面开源,20万复刻百万级大片!11B媲美闭源巨头,224张GPU创奇迹

Open-Sora 2.0全面开源,20万复刻百万级大片!11B媲美闭源巨头,224张GPU创奇迹

Open-Sora 2.0全面开源,20万复刻百万级大片!11B媲美闭源巨头,224张GPU创奇迹
Open-Sora 2.0全面开源,20万复刻百万级大片!11B媲美闭源巨头,224张GPU创奇迹...
2025-03-13 · 浏览94次
担心成为「AI界奥本海默」!DeepMind、Anthropic CEO同框,26年AGI降临?

担心成为「AI界奥本海默」!DeepMind、Anthropic CEO同框,26年AGI降临?

担心成为「AI界奥本海默」!DeepMind、Anthropic CEO同框,26年AGI降临?
担心成为「AI界奥本海默」!DeepMind、Anthropic CEO同框,26年AGI降临?...
2025-03-13 · 浏览71次
L²M条件,MIT团队为长文本建模建立新理论框架

L²M条件,MIT团队为长文本建模建立新理论框架

L²M条件,MIT团队为长文本建模建立新理论框架
近日,麻省理工学院 Zhuo Chen、Oriol Mayn ́e i Comas 、Zhuotao Jin 、Di Luo 、Marin Soljači 领衔的研究团队提出自...
2025-03-12 · 浏览97次
陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现

陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现

陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现
陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现...
2025-03-11 · 浏览65次
轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错
轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错...
2025-03-11 · 浏览65次
“专为我开了一个新课题”,顶尖博士为什么偏爱去字节实习?

“专为我开了一个新课题”,顶尖博士为什么偏爱去字节实习?

“专为我开了一个新课题”,顶尖博士为什么偏爱去字节实习?
在字节跳动,有这样一群实习生,他们的另一重身份,都是来自顶尖高校的技术博士。...
2025-03-11 · 浏览124次
PyTorch灵魂人物出走,被Ilya奥特曼抢破头!放弃大厂offer,却选择了ChatGPT之母

PyTorch灵魂人物出走,被Ilya奥特曼抢破头!放弃大厂offer,却选择了ChatGPT之母

PyTorch灵魂人物出走,被Ilya奥特曼抢破头!放弃大厂offer,却选择了ChatGPT之母
PyTorch灵魂人物出走,被Ilya奥特曼抢破头!放弃大厂offer,却选择了ChatGPT之母...
2025-03-05 · 浏览71次
REVOLVE:响应演化驱动的智能优化框架,破解传统AI优化瓶颈

REVOLVE:响应演化驱动的智能优化框架,破解传统AI优化瓶颈

REVOLVE:响应演化驱动的智能优化框架,破解传统AI优化瓶颈
本文将介绍REVOLVE的核心概念、创新机制,并探讨其在解决方案优化、提示优化和代码优化等任务中的应用,分析其在多种场景中的实际效果。...
2025-03-04 · 浏览84次
历时6个月,Hugging Face开源LLM「超大规模实战手册」!200页3万字4000次训练

历时6个月,Hugging Face开源LLM「超大规模实战手册」!200页3万字4000次训练

历时6个月,Hugging Face开源LLM「超大规模实战手册」!200页3万字4000次训练
历时6个月,Hugging Face开源LLM「超大规模实战手册」!200页3万字4000次训练...
2025-03-03 · 浏览70次
奥尔特曼坦诚 OpenAI 急缺 GPU,GPT-4.5 只能分阶段推出

奥尔特曼坦诚 OpenAI 急缺 GPU,GPT-4.5 只能分阶段推出

奥尔特曼坦诚 OpenAI 急缺 GPU,GPT-4.5 只能分阶段推出
GPT-4.5是一个“庞大”且“昂贵”的模型,需要数万个额外的GPU才能向更多ChatGPT用户开放。GPT-4.5将首先推向ChatGPT Pro订阅者,随后将在下周向Cha...
2025-02-28 · 浏览72次
北京大学两部 DeepSeek 秘籍新出炉!(附全集下载)

北京大学两部 DeepSeek 秘籍新出炉!(附全集下载)

北京大学两部 DeepSeek 秘籍新出炉!(附全集下载)
这次给大家分享的 PDF 下载,是原汁原味的原版哦,网上有太多卖课者魔改的内置其广告版本。...
2025-02-27 · 浏览207次
DeepSeek-R2曝5月前上线!第三弹DeepGEMM 300行代码暴击专家优化内核

DeepSeek-R2曝5月前上线!第三弹DeepGEMM 300行代码暴击专家优化内核

DeepSeek-R2曝5月前上线!第三弹DeepGEMM 300行代码暴击专家优化内核
DeepSeek-R2曝5月前上线!第三弹DeepGEMM 300行代码暴击专家优化内核...
2025-02-26 · 浏览117次
扩散模型新突破!无需微调,就能高效稳定移除目标物体

扩散模型新突破!无需微调,就能高效稳定移除目标物体

扩散模型新突破!无需微调,就能高效稳定移除目标物体
最近,扩散模型在生成模型领域异军突起,凭借其独特的生成机制在图像生成方面大放异彩,尤其在处理高维复杂数据时优势明显。...
2025-02-25 · 浏览161次
第一页 · 上一页 · 下一页 · 当前第1页