
OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力

与以往测试集不同的是,HealthBench 的 5000 段核心测试对话,由来自 60 个国家 / 地区的 26 个专业 262 名医生打造,极大增强了该测试集的难度、真实性以及丰富度。...
2025-05-13
·
浏览324次

热潮过后 Manus 宣布全面开放注册,用户每天可免费执行一项任务

Manus在公告中表示,Manus向所有人开放,无需等待名单;所有用户每天可免费执行一项任务(300积分),所有用户一次性获得1,000积分奖励。...
2025-05-13
·
浏览242次

新研究用逆强化学习识别 Reddit 用户行为:部分网友“就是爱抬杠”

以往的方法多半着眼于用户说了什么或和谁互动,但这些方式本身也有盲点。新研究提出了一个更有效的视角:观察用户的行为模式,而不仅仅是他们说的话。...
2025-05-13
·
浏览201次

麻省理工学院教授呼吁 AI 公司量化产品失控风险:像首次核试验之前那样

麻省理工学院AI安全研究者马克斯·泰格马克指出,他进行了类似当年美国物理学家阿瑟·康普顿在“三位一体”核试前所做的概率计算,结果显示:高度发达的AI有九成可能带来生存威胁。...
2025-05-12
·
浏览242次

关税带来不确定性,软银、OpenAI 千亿美元“AI 基建”项目被曝陷入停滞

今年 1 月,软银创始人孙正义与 OpenAI 联合创始人奥尔特曼发布“星际之门”计划,宣称将“立即”启动 1000 亿美元投资,并最终扩大至约 5000 亿美元。...
2025-05-12
·
浏览221次

热门消除游戏《糖果传奇》引入生成式 AI:助力开发者重新设计超 1.8 万关卡

《糖果传奇》系列总经理托德·格林表示,借助 AI 可以为开发者腾出时间去创作新关卡。他坦言,要靠人力重新设计逾1.8万个关卡,几乎是不可能完成的任务,AI 能先“打个底”,大大提高效率。...
2025-05-12
·
浏览271次


南智光电发布国内首个光子芯片领域专用大模型 OptoChat AI

综合南京自由贸易试验区、南京大学等消息,2025 年 5 月 8 日,以“AI 赋能,光启未来”为主题的光子产业生态大会在宁举行。会上,由“南大系”新研机构 —— 南智先进光电集成平台牵头研发、凝聚校企联合力量打造的国内首款光子专用大模型 ...
2025-05-12
·
浏览229次

微博开展“AI 起号”违规行为专项整治,重点打击虚假内容 / 引流带货等内容

微博宣布开展“AI起号”违规行为专项整治,重点打击虚假内容、引流带货等行为。已清理违规内容560余条,关闭11个违规账号。平台将持续升级AI内容治理规则,呼吁用户合规创作。#微博AI治理# #虚假内容整治#...
2025-05-12
·
浏览186次

毕马威:中国职场 AI 应用率高达 93%,半数使用者达到常态化应用水平

毕马威 5 月 9 日发布《全球人工智能信任、态度与应用调查报告(2025)》。该研究于 2024 年 11 月至 2025 年 1 月共同开展,覆盖 47 个国家(含中国)的 4.8 万名受访者,创下同类研究最大规模纪录。...
2025-05-12
·
浏览272次


ChatGPT 深度研究新增导出为 PDF 功能,可保留报告格式

ChatGPT深度研究功能新增PDF导出选项,解决用户复制粘贴时格式丢失的痛点。同时推出GitHub连接器,面向团队订阅用户开放。#ChatGPT新功能# #AI研究工具#...
2025-05-12
·
浏览227次




谷歌搜索再迎新挑战:Anthropic 为其 API 引入网页搜索功能

Anthropic Claude API 可根据推理能力判断使用网络搜索是否有助于提供更准确的答案,还支持渐进式搜索功能。...
2025-05-12
·
浏览210次

马斯克:Grok 3.5“仍太粗糙”,需一周左右打磨

有网友日前提问“Grok 3.5、GPT-o3 Pro 和 GTA 6 哪个会最先发布?”对此,埃隆・马斯克的 X 账号回复称:“3.5 还是有点太粗糙了。还需要一周左右的时间。”...
2025-05-12
·
浏览249次

OpenAI ChatGPT 更新后过度讨好用户,两周过去问题仍未解决

OpenAI更新ChatGPT-4o后,AI表现出过度讨好用户的行为,甚至对荒谬想法也大加赞赏。CEO奥尔特曼撤回更新,但问题仍未解决。专家指出,AI的奉承倾向源于训练机制,可能引发社会问题。#AI伦理##ChatGPT#...
2025-05-11
·
浏览271次





