4o 标签,匹配到约419个结果, 耗时0.0395秒

OpenAI 上线安全评估中心,定期公开 AI 模型评估结果以提升透明度

OpenAI宣布上线安全评估中心,将定期公开AI模型在有害内容生成、模型越狱等方面的测试结果,以提高透明度。此举旨在让用户更清晰了解系统安全性能变化,并支持行业透明度努力。#OpenAI# #AI安全#...
2025-05-15
·
浏览14次


OpenAI 升级 ChatGPT AI 聊天机器人,GPT-4.1 编程专家模型登场

OpenAI 官方账号在 X 平台发布推文,宣布将于昨日(5 月 14 日)开始,在 ChatGPT AI 聊天机器人中,引入 GPT-4.1 模型。...
2025-05-15
·
浏览40次


OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力

与以往测试集不同的是,HealthBench 的 5000 段核心测试对话,由来自 60 个国家 / 地区的 26 个专业 262 名医生打造,极大增强了该测试集的难度、真实性以及丰富度。...
2025-05-13
·
浏览77次

OpenAI ChatGPT 更新后过度讨好用户,两周过去问题仍未解决

OpenAI更新ChatGPT-4o后,AI表现出过度讨好用户的行为,甚至对荒谬想法也大加赞赏。CEO奥尔特曼撤回更新,但问题仍未解决。专家指出,AI的奉承倾向源于训练机制,可能引发社会问题。#AI伦理##ChatGPT#...
2025-05-11
·
浏览62次

卡内基梅隆大学推出 AI 模型“乐高 GPT”,敲敲键盘就能生成可搭建积木

据外媒Tom's Hardware今日报道,卡内基梅隆大学的研究团队开发出一款名为 LegoGPT 的 AI 模型,能够根据文字指令生成可实际搭建的乐高设计。...
2025-05-10
·
浏览65次

OpenAI 突破传统微调,RFT 技术可精准定制 o4-mini 模型

OpenAI 公司在其 o4-mini 推理模型上,推出了强化微调技术(Reinforcement Fine-Tuning, 简称 RFT),为定制基础模型以适应特定任务带来了突破性工具。...
2025-05-09
·
浏览59次

研究发现:要求 AI 简洁作答可能致其出现更多“幻觉”

巴黎AI公司Giskard研究发现,要求AI聊天机器人简短回答问题时,其产生“幻觉”(输出虚假信息)的概率会显著增加。包括GPT-4o在内的主流模型均存在此现象,因简洁回答缺乏反驳错误的空间。#AI幻觉##ChatGPT#...
2025-05-08
·
浏览59次

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车...
2025-05-08
·
浏览69次

Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7

Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7...
2025-05-07
·
浏览99次



超越 DeepSeek-R1,英伟达开源模型 Llama-Nemotron 登顶

超越 DeepSeek-R1 的英伟达开源新王 Llama-Nemotron,是怎么训练出来的?刚刚放出的论文,把一切细节毫无保留地全部揭秘了!...
2025-05-06
·
浏览100次

医疗自诊依赖 AI 聊天机器人存风险,专家呼吁谨慎使用

牛津大学研究发现,人们使用聊天机器人获取健康建议时,往往难以提供关键信息,导致建议质量不佳。研究显示,聊天机器人不仅增加识别健康问题的难度,还可能低估问题严重性。#AI医疗##健康科技#...
2025-05-06
·
浏览65次

超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光

超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光...
2025-05-06
·
浏览74次


68 页论文再锤大模型竞技场:Llama4 发布前私下测试 27 个版本,只取最佳成绩

最近一篇名为《排行榜幻觉》(The Leaderboard Illusion)的论文在学术圈引发关注。...
2025-05-02
·
浏览90次



奥尔特曼:OpenAI 正逐步撤回 GPT-4o“过于奉承”的更新

奥尔特曼今日凌晨在 X 上表示,免费版 ChatGPT 用户的回退已经“完全完成”,预计付费用户的回退“今天也能完成”。他还透露:“我们正在调整模型的个性,未来几天会发布更多更新。”...
2025-04-30
·
浏览97次

ChatGPT 被指向未成年用户生成色情内容,OpenAI 承认并着手修复

TechCrunch测试发现,ChatGPT存在漏洞,会向未成年账户生成色情内容。OpenAI承认问题并紧急修复,称其政策明确禁止此类行为。测试显示,ChatGPT不仅生成色情内容,还会鼓励更露骨的请求。#AI安全# #未成年人保护#...
2025-04-29
·
浏览172次


前微软高管剖析 OpenAI ChatGPT 变谄媚根源:人类不喜 AI 直言的人格画像

前微软高管、现 Spotify 首席技术官 Mikhail Parakhin 表示,ChatGPT 并非一开始就以奉承用户为默认风格,不过由于用户对直接的人格反馈表现出强烈反感,OpenAI 决定调整聊天机器人,让其更讨好用户。...
2025-04-29
·
浏览91次