4 标签,匹配到约937个结果, 耗时0.0423秒

OpenAI 上线安全评估中心,定期公开 AI 模型评估结果以提升透明度

OpenAI宣布上线安全评估中心,将定期公开AI模型在有害内容生成、模型越狱等方面的测试结果,以提高透明度。此举旨在让用户更清晰了解系统安全性能变化,并支持行业透明度努力。#OpenAI# #AI安全#...
2025-05-15
·
浏览20次


OpenAI 升级 ChatGPT AI 聊天机器人,GPT-4.1 编程专家模型登场

OpenAI 官方账号在 X 平台发布推文,宣布将于昨日(5 月 14 日)开始,在 ChatGPT AI 聊天机器人中,引入 GPT-4.1 模型。...
2025-05-15
·
浏览43次


OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力

与以往测试集不同的是,HealthBench 的 5000 段核心测试对话,由来自 60 个国家 / 地区的 26 个专业 262 名医生打造,极大增强了该测试集的难度、真实性以及丰富度。...
2025-05-13
·
浏览77次



OpenAI ChatGPT 更新后过度讨好用户,两周过去问题仍未解决

OpenAI更新ChatGPT-4o后,AI表现出过度讨好用户的行为,甚至对荒谬想法也大加赞赏。CEO奥尔特曼撤回更新,但问题仍未解决。专家指出,AI的奉承倾向源于训练机制,可能引发社会问题。#AI伦理##ChatGPT#...
2025-05-11
·
浏览62次


12GB 显存可实现 128K 上下文 5 并发会话,IBM 预览 Granite 4.0 Tiny 模型

该模型采用混合 Mamba-2 / Transformer 架构,现有版本总参数规模为 7B、活动参数为 1B,可在消费级硬件上实现可用的体验。...
2025-05-10
·
浏览66次

卡内基梅隆大学推出 AI 模型“乐高 GPT”,敲敲键盘就能生成可搭建积木

据外媒Tom's Hardware今日报道,卡内基梅隆大学的研究团队开发出一款名为 LegoGPT 的 AI 模型,能够根据文字指令生成可实际搭建的乐高设计。...
2025-05-10
·
浏览65次

OpenAI 突破传统微调,RFT 技术可精准定制 o4-mini 模型

OpenAI 公司在其 o4-mini 推理模型上,推出了强化微调技术(Reinforcement Fine-Tuning, 简称 RFT),为定制基础模型以适应特定任务带来了突破性工具。...
2025-05-09
·
浏览60次

研究发现:要求 AI 简洁作答可能致其出现更多“幻觉”

巴黎AI公司Giskard研究发现,要求AI聊天机器人简短回答问题时,其产生“幻觉”(输出虚假信息)的概率会显著增加。包括GPT-4o在内的主流模型均存在此现象,因简洁回答缺乏反驳错误的空间。#AI幻觉##ChatGPT#...
2025-05-08
·
浏览59次

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车...
2025-05-08
·
浏览69次

Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7

Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7...
2025-05-07
·
浏览99次


机架级系统已成 AMD AI 战略核心,Instinct MI400 早期客户反馈积极

AMD 首席执行官苏姿丰称 Instinct MI400 的早期客户反馈积极,用户对这一产品有着很高热情。...
2025-05-07
·
浏览58次


超越 DeepSeek-R1,英伟达开源模型 Llama-Nemotron 登顶

超越 DeepSeek-R1 的英伟达开源新王 Llama-Nemotron,是怎么训练出来的?刚刚放出的论文,把一切细节毫无保留地全部揭秘了!...
2025-05-06
·
浏览101次

医疗自诊依赖 AI 聊天机器人存风险,专家呼吁谨慎使用

牛津大学研究发现,人们使用聊天机器人获取健康建议时,往往难以提供关键信息,导致建议质量不佳。研究显示,聊天机器人不仅增加识别健康问题的难度,还可能低估问题严重性。#AI医疗##健康科技#...
2025-05-06
·
浏览66次

超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光

超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光...
2025-05-06
·
浏览74次


让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗?

让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗?...
2025-05-04
·
浏览101次
