

OpenAI:强化学习确实可显著提高LLM性能,DeepSeek R1、Kimi k1.5发现o1的秘密

最近,OpenAI 发了一篇论文,宣称 o3 模型在 2024 IOI 上达到了金牌水平,并且在 CodeForces 上获得了与精英级人类相当的得分。...
2025-02-20
·
浏览169次

OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一...
2025-02-19
·
浏览133次



李彦宏:文心大模型 4.5 将开源,是百度有史以来最强大的大模型

据新浪科技报道,在百度 2024 年 Q4 及全年财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,文心大模型 4.5 将开源,4.5 将是百度有史以来最强大的大模型,“...
2025-02-19
·
浏览113次

网易云音乐接入 DeepSeek-R1 大模型,用于歌曲智能推荐等领域

网易云音乐18日宣布,其面向创作者研发的“音乐播客生成工具”与“对谈播客生成工具”已完成国产开源大模型DeepSeek-R1的全能力接入。...
2025-02-19
·
浏览137次

研究:2000 人中仅两人能准确识别深度伪造内容

随着深度伪造技术(deepfake)的不断发展,人们对虚假信息、诈骗和身份盗窃的担忧日益加剧。一项最新研究显示,人们对 AI 工具的认知水平极低,难以有效识别深度伪造内容。...
2025-02-19
·
浏览125次

谷歌憋大招:Gemini 将内嵌 AI 视频生成,让人人都能是导演

科技媒体 Android Authority 昨日(2 月 18 日)发布博文,报道称谷歌旗下 AI 助手 Gemini 即将具备生成视频能力。该功能虽未正式上线,但种种迹象表...
2025-02-19
·
浏览128次

刚刚,Ilya被曝正筹资超10亿美元、估值超300亿美元,知名创投Greenoaks牵头

一觉醒来,Ilya Sutskever 及其创业公司 Safe SuperIntelligence(SSI)又有了新消息!...
2025-02-19
·
浏览122次

200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源

在关于 DeepSeek 的文章中,我们会多次听到「Aha Moment」这个词。...
2025-02-19
·
浏览140次

这届出题太难了!新基准让多模态模型集体自闭,GPT-4o都是零分

眼下最顶尖的一批 LMM 是哪些?你可能想到了无所不能的 GPT-4o、Gemini 2 Flash 等等……...
2025-02-19
·
浏览158次


TOMG-Bench:大语言模型开放域分子生成新基准

香港理工大学、上海交通大学、上海人工智能实验的研究者提出了基于文本的开放分子生成基准测试(TOMG-Bench),旨在评估 LLM 在分子领域的开放域生成能力。...
2025-02-19
·
浏览130次

自动化、高精度,告别人工测量!Meta SAM模型高效解析复杂纳米颗粒

德国康斯坦茨大学与巴西米纳斯吉拉斯联邦大学的研究团队提出了一种创新解决方案:利用预训练人工智能模型(Segment Anything Model, SAM)实现纳米颗粒的自动化...
2025-02-19
·
浏览128次

刚刚!DeepSeek梁文锋亲自挂名,公开新注意力架构NSA

DeepSeek 新论文来了!相关消息刚刚发布到 𝕏 就吸引了大量用户点赞、转发、评论三连。...
2025-02-19
·
浏览150次

前OpenAI CTO另立门户,2/3 ChatGPT骨干被挖!北大校友Lilian Weng加盟

前OpenAI CTO另立门户,2/3 ChatGPT骨干被挖!北大校友Lilian Weng加盟...
2025-02-19
·
浏览110次


马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI...
2025-02-18
·
浏览130次

超强DNA大模型「GENERator」问世!解锁生命密码设计新范式

近日,阿里云飞天实验室的 AI for Science 团队提出了一个全新的生成式 DNA 大模型——GENERator...
2025-02-18
·
浏览129次

首个基于统计学的线性注意力机制ToST,高分拿下ICLR Spotlight

Transformer 架构在过去几年中通过注意力机制在多个领域(如计算机视觉、自然语言处理和长序列任务)中取得了非凡的成就。...
2025-02-18
·
浏览141次

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

近年来,大语言模型(LLMs)取得了突破性进展,展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。...
2025-02-18
·
浏览136次

2024 IBM博士生奖学金出炉:韩迟、卓越、张逸骅、冯尚彬等AI研究者入选

清华、浙大、西南大学、西安交大、华中科技大学、台湾大学…… 多位 2024 IBM 博士生奖学金获得者毕业于国内高校。其中有你的校友吗?...
2025-02-18
·
浏览130次

打破AI遗忘诅咒的学习算法,慕尼黑-南大团队打造会自主积累知识的学习框架

慕尼黑大学与南京大学的研究团队联手打造了一款机器人终身强化学习框架,它通过开发一个受贝叶斯非参数域启发的知识空间来解决这一差距。...
2025-02-18
·
浏览132次