GPT5 标签,匹配到约39个结果, 耗时0.2064秒
GPT-5.2 生成字母挂图错误频出,“人类专家水平”遭质疑

GPT-5.2 生成字母挂图错误频出,“人类专家水平”遭质疑

GPT-5.2 生成字母挂图错误频出,“人类专家水平”遭质疑
模型只覆盖了 24 个字母,遗漏了“U”和“Z”,并在“T”之后直接跳到“Y”,对应“Yak”。生成的字母表最终以“X”结束,对应“X-ray fish”,插图却是一只斑马。...
2025-12-20 · 浏览74次
GPT-5.2 被曝作弊:偷袭谷歌竟靠拉爆 token 刷高分,不如 Gemini 3

GPT-5.2 被曝作弊:偷袭谷歌竟靠拉爆 token 刷高分,不如 Gemini 3

GPT-5.2 被曝作弊:偷袭谷歌竟靠拉爆 token 刷高分,不如 Gemini 3
GPT-5.2 打赢 Gemini 3.0 Pro,竟是靠高推理与海量 Token「作弊」?网友的这个发现,在 AI 社区一石激起千层浪。更多网友七嘴八舌表示:GPT-5.2,并没有那么好用!...
2025-12-13 · 浏览85次
奥尔特曼:OpenAI GPT-5.2 API 上线首日 tokens 超万亿,且增长迅速

奥尔特曼:OpenAI GPT-5.2 API 上线首日 tokens 超万亿,且增长迅速

奥尔特曼:OpenAI GPT-5.2 API 上线首日 tokens 超万亿,且增长迅速
OpenAI发布GPT-5.2模型,首日API调用量即破万亿,展现强大市场吸引力。新模型在多步推理、长上下文理解及生产力工具支持等方面均有显著提升。#AI技术# #OpenAI#...
2025-12-13 · 浏览93次
对抗 OpenAI GPT-5.2:谷歌祭出 Gemini Deep Research 深度研究智能体并首次向开发者开放,DeepSearchQA 因果链测试基准重磅开源

对抗 OpenAI GPT-5.2:谷歌祭出 Gemini Deep Research 深度研究智能体并首次向开发者开放,DeepSearchQA 因果链测试基准重磅开源

对抗 OpenAI GPT-5.2:谷歌祭出 Gemini Deep Research 深度研究智能体并首次向开发者开放,DeepSearchQA 因果链测试基准重磅开源
谷歌推出Gemini Deep Research智能体,开源DeepSearchQA基准,对抗OpenAI GPT-5.2。该智能体在复杂信息环境中表现优异,幻觉率降低40%,并已在金融、生物技术等领域应用。#AI技术# #谷歌Gemini...
2025-12-12 · 浏览108次
GPT-5.2 提前泄露?线索显示其已“超越 Gemini 3”

GPT-5.2 提前泄露?线索显示其已“超越 Gemini 3”

GPT-5.2 提前泄露?线索显示其已“超越 Gemini 3”
开发者社区流传的截图显示,Cursor 的模型下拉菜单中,赫然出现了 gpt-5.2 和 gpt-5.2-thinking 的选项。...
2025-12-11 · 浏览104次
OpenAI 被曝正开发全新 AI 大语言模型:代号“大蒜”,性能超越谷歌 Gemini 3

OpenAI 被曝正开发全新 AI 大语言模型:代号“大蒜”,性能超越谷歌 Gemini 3

OpenAI 被曝正开发全新 AI 大语言模型:代号“大蒜”,性能超越谷歌 Gemini 3
OpenAI 正开发代号“大蒜”的新 AI 大语言模型,据称在编程与逻辑推理任务中表现优于谷歌 Gemini 3.0 及 Anthropic Opus 4.5。该模型通过优化预训练阶段算法,显著降低训练成本与时间,预计 2026 年初发布。...
2025-12-03 · 浏览87次
OpenAI 推出 GPT-5-Codex-Mini:“经济高效型”AI 编程模型

OpenAI 推出 GPT-5-Codex-Mini:“经济高效型”AI 编程模型

OpenAI 推出 GPT-5-Codex-Mini:“经济高效型”AI 编程模型
相比原版,其性能有小幅折损,开发者可获得约4倍的使用额度。在SWE-bench Verified测试中,GPT-5 High得分72.8%,GPT-5-Codex得分74.5%,而GPT-5-Codex-Mini得分71.3%。...
2025-11-08 · 浏览194次
OpenAI 改进 ChatGPT 语言模型,提早识别心理压力与风险话题

OpenAI 改进 ChatGPT 语言模型,提早识别心理压力与风险话题

OpenAI 改进 ChatGPT 语言模型,提早识别心理压力与风险话题
OpenAI宣布升级ChatGPT,新模型能识别心理危机、自残/自杀等风险话题,并引导用户寻求帮助。通过与170余名专家合作,改进后的模型减少80%不恰当回应,还能区分中性、情绪化及紧急对话语境。#AI心理干预# #ChatGPT升级#...
2025-11-03 · 浏览149次
研究称 GPT-5“有害回答”比 GPT-4o 更多,不回避“自杀”相关话题

研究称 GPT-5“有害回答”比 GPT-4o 更多,不回避“自杀”相关话题

研究称 GPT-5“有害回答”比 GPT-4o 更多,不回避“自杀”相关话题
研究显示,GPT-5在回答涉及自杀、自残等问题时,比GPT-4o产生更多有害内容。OpenAI回应称已推出改进措施,包括更严格的内容限制和家长控制。...
2025-10-17 · 浏览194次
Anthropic 开源 AI 安全分析框架 Petri,利用 Agent 代理人测试主流模型潜在不对齐风险

Anthropic 开源 AI 安全分析框架 Petri,利用 Agent 代理人测试主流模型潜在不对齐风险

Anthropic 开源 AI 安全分析框架 Petri,利用 Agent 代理人测试主流模型潜在不对齐风险
Anthropic开源AI模型安全分析框架Petri,可检测主流大模型在高风险情境下的潜在弱点。测试显示,Claude Sonnet 4.5与GPT-5安全性最佳,而Gemini 2.5 Pro、Grok-4与Kimi K2存在较强欺骗倾向...
2025-10-14 · 浏览147次
OpenAI 更新 GPT-5 Instant 模型:依旧理性、稳重,但更具共情力

OpenAI 更新 GPT-5 Instant 模型:依旧理性、稳重,但更具共情力

OpenAI 更新 GPT-5 Instant 模型:依旧理性、稳重,但更具共情力
OpenAI 表示,GPT-5 现在能够识别出用户可能的心理或情绪困扰,并以更准确、温和的方式回应。这项改进是在心理健康专家的协助下完成的。...
2025-10-05 · 浏览149次
陶哲轩用 GPT-5 解决数学难题:仅 29 行 Python 代码

陶哲轩用 GPT-5 解决数学难题:仅 29 行 Python 代码

陶哲轩用 GPT-5 解决数学难题:仅 29 行 Python 代码
由于用的是 GPT-5,OpenAI 研究员 Sebastien Bubeck(微软前 AI 副总裁 & 杰出科学家)也火速转发了一波,由此在𝕏社区引发热烈讨论。...
2025-10-04 · 浏览166次
OpenAI ChatGPT 会自动切换严格模型处理情感话题,用户却不知情

OpenAI ChatGPT 会自动切换严格模型处理情感话题,用户却不知情

OpenAI ChatGPT 会自动切换严格模型处理情感话题,用户却不知情
OpenAI正在测试新的“安全路由系统”,当ChatGPT检测到情感或敏感话题时,会自动切换到更严格的模型处理,但这一过程不会通知用户。部分用户和专家批评此举缺乏透明度。#ChatGPT# #AI安全#...
2025-09-29 · 浏览262次
OpenAI 奥尔特曼爆料:GPT-5 重构一切,一人顶五个团队

OpenAI 奥尔特曼爆料:GPT-5 重构一切,一人顶五个团队

OpenAI 奥尔特曼爆料:GPT-5 重构一切,一人顶五个团队
在播客节目中,OpenAI CEO 奥尔特曼谈到:算力与资本的再分配,创业护城河的真正构建,甚至教育与家庭在 AI 冲击下的重新定位。...
2025-09-18 · 浏览192次
真・博士水平:OpenAI GPT-5 首次给出第四矩定理显式收敛率,数学教授只点拨了一下

真・博士水平:OpenAI GPT-5 首次给出第四矩定理显式收敛率,数学教授只点拨了一下

真・博士水平:OpenAI GPT-5 首次给出第四矩定理显式收敛率,数学教授只点拨了一下
简单来讲就是,原来的定理仅说明收敛会发生,却没有给出具体速度,而借助 GPT-5,这项研究首次明确了收敛速率。...
2025-09-10 · 浏览191次
GPT-5“变笨”实锤:退休教授出了道井字棋送分题,结果它真送了

GPT-5“变笨”实锤:退休教授出了道井字棋送分题,结果它真送了

GPT-5“变笨”实锤:退休教授出了道井字棋送分题,结果它真送了
教授告诉 GPT-5:“游戏开始前,把棋盘向右旋转 90 度一次”。显然,按常识来看,这么做根本不会让游戏本身有任何变化。...
2025-09-01 · 浏览215次
GPT-5 Pro 独立做数学研究:读论文后给出更精确边界,OpenAI 总裁称这是生命迹象

GPT-5 Pro 独立做数学研究:读论文后给出更精确边界,OpenAI 总裁称这是生命迹象

GPT-5 Pro 独立做数学研究:读论文后给出更精确边界,OpenAI 总裁称这是生命迹象
OpenAI研究人员发现,GPT-5 Pro在阅读一篇关于凸优化问题的论文后,能够独立给出更精确的边界证明。尽管人类随后更新了论文,但GPT-5 Pro的证明思路不同,展示了其自主探索能力。OpenAI总裁Brockman称这一成果为“生命...
2025-08-21 · 浏览200次
OpenAI:正在让 GPT-5 变得“更温暖、更友好、不奉承”

OpenAI:正在让 GPT-5 变得“更温暖、更友好、不奉承”

OpenAI:正在让 GPT-5 变得“更温暖、更友好、不奉承”
用户会注意到GPT-5将使用一些“细微而真诚”的措辞,如“Good question(好问题)”或“Great start(好的开始)”而非奉承。内部测试显示,与之前的GPT-5相比,其谄媚程度没有上升。...
2025-08-16 · 浏览192次
OpenAI ChatGPT 更新:GPT-5 引入三种模式,4o 模型回归

OpenAI ChatGPT 更新:GPT-5 引入三种模式,4o 模型回归

OpenAI ChatGPT 更新:GPT-5 引入三种模式,4o 模型回归
OpenAI CEO萨姆・奥尔特曼宣布ChatGPT重大更新,GPT-5新增“自动”、“快速”和“思考”三种模式,满足不同用户需求。其中“思考”模式每周限3000条消息,上下文限制为196,000个token。此外,4o版本重新加入模型选择...
2025-08-13 · 浏览273次
微软 Visual Studio 上线 GPT-5,复杂任务推理决策能力“大幅”提升

微软 Visual Studio 上线 GPT-5,复杂任务推理决策能力“大幅”提升

微软 Visual Studio 上线 GPT-5,复杂任务推理决策能力“大幅”提升
微软表示,GPT-5 的加入能显著加快从创意到产品落地的开发流程。它在复杂任务的推理和决策上有“大幅”提升,能在极少提示下生成质量更高、易于维护的代码,并在修改代码时提供更清晰的解释。...
2025-08-13 · 浏览201次
OpenAI 申请 GPT-5 中国商标遇挫,相关申请均被驳回

OpenAI 申请 GPT-5 中国商标遇挫,相关申请均被驳回

OpenAI 申请 GPT-5 中国商标遇挫,相关申请均被驳回
OpenAI 上周正式发布新一代人工智能模型 GPT-5,该模型已在中国提交商标申请,国际分类涵盖科学仪器、网站服务,目前所有相关申请均已被驳回。...
2025-08-11 · 浏览255次
奥尔特曼听劝:OpenAI 将提升订阅用户推理配额,恢复 GPT-4o 等旧模型

奥尔特曼听劝:OpenAI 将提升订阅用户推理配额,恢复 GPT-4o 等旧模型

奥尔特曼听劝:OpenAI 将提升订阅用户推理配额,恢复 GPT-4o 等旧模型
OpenAI CEO 奥尔特曼周日在 X发文宣布,公司将恢复包括 GPT-4o 在内的旧版 AI 模型,并大幅提高付费订阅用户的使用额度,向愤怒的用户群体释出善意。...
2025-08-11 · 浏览295次
OpenAI 宣布 ChatGPT-4o 面向 Plus 和 Team 用户重新上线,下周推出迷你版 GPT-5

OpenAI 宣布 ChatGPT-4o 面向 Plus 和 Team 用户重新上线,下周推出迷你版 GPT-5

OpenAI 宣布 ChatGPT-4o 面向 Plus 和 Team 用户重新上线,下周推出迷你版 GPT-5
OpenAI表示,GPT-4o 现在也对 Plus 和 Team 用户可用。如需在各平台使用,请前往 ChatGPT 网页版设置,开启“显示旧版模型”。...
2025-08-09 · 浏览288次
“苹果牌 AI”拥抱 GPT-5,预计下月登陆 iOS / iPadOS / macOS 26

“苹果牌 AI”拥抱 GPT-5,预计下月登陆 iOS / iPadOS / macOS 26

“苹果牌 AI”拥抱 GPT-5,预计下月登陆 iOS / iPadOS / macOS 26
目前,iOS 18、iPadOS 18、macOS Sequoia 和 visionOS 2 中的 Apple Intelligence 所集成的 ChatGPT 仍由 GPT-4o 驱动。...
2025-08-09 · 浏览304次
第一页 · 上一页 · 下一页 · 当前第1页