3.5 标签,匹配到约152个结果, 耗时0.0434秒
o3完爆人类医生,OpenAI基准直击AGI!

o3完爆人类医生,OpenAI基准直击AGI!

o3完爆人类医生,OpenAI基准直击AGI!
o3完爆人类医生,OpenAI基准直击AGI!...
2025-05-13 · 浏览61次
OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力

OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力

OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力
与以往测试集不同的是,HealthBench 的 5000 段核心测试对话,由来自 60 个国家 / 地区的 26 个专业 262 名医生打造,极大增强了该测试集的难度、真实性以及丰富度。...
2025-05-13 · 浏览81次
马斯克:Grok 3.5“仍太粗糙”,需一周左右打磨

马斯克:Grok 3.5“仍太粗糙”,需一周左右打磨

马斯克:Grok 3.5“仍太粗糙”,需一周左右打磨
有网友日前提问“Grok 3.5、GPT-o3 Pro 和 GTA 6 哪个会最先发布?”对此,埃隆・马斯克的 X 账号回复称:“3.5 还是有点太粗糙了。还需要一周左右的时间。”...
2025-05-12 · 浏览64次
68 页论文再锤大模型竞技场:Llama4 发布前私下测试 27 个版本,只取最佳成绩

68 页论文再锤大模型竞技场:Llama4 发布前私下测试 27 个版本,只取最佳成绩

68 页论文再锤大模型竞技场:Llama4 发布前私下测试 27 个版本,只取最佳成绩
最近一篇名为《排行榜幻觉》(The Leaderboard Illusion)的论文在学术圈引发关注。...
2025-05-02 · 浏览90次
马斯克称下周推出 Grok 3.5:首个能准确回答有关火箭发动机问题的 AI

马斯克称下周推出 Grok 3.5:首个能准确回答有关火箭发动机问题的 AI

马斯克称下周推出 Grok 3.5:首个能准确回答有关火箭发动机问题的 AI
马斯克宣布下周将向SuperGrok订阅者发布Grok 3.5早期测试版,称这是首个能准确回答火箭发动机或电化学技术问题的AI。Grok 3.5能从第一原理推理并得出互联网上不存在的答案。#AI##马斯克#...
2025-04-29 · 浏览83次
永别了,GPT-4!

永别了,GPT-4!

永别了,GPT-4!
永别了,GPT-4!...
2025-04-12 · 浏览103次
OpenAI 遭实锤:研究称其 AI 模型“记住”了受版权保护的内容

OpenAI 遭实锤:研究称其 AI 模型“记住”了受版权保护的内容

OpenAI 遭实锤:研究称其 AI 模型“记住”了受版权保护的内容
华盛顿大学等研究为OpenAI用受版权保护内容训练模型指控提供依据。研究人员用新方法测试,发现GPT - 4记住部分小说和《纽约时报》文章内容。#OpenAI版权争议#...
2025-04-07 · 浏览100次
OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手

OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手

OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手
OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手...
2025-03-12 · 浏览162次
REVOLVE:响应演化驱动的智能优化框架,破解传统AI优化瓶颈

REVOLVE:响应演化驱动的智能优化框架,破解传统AI优化瓶颈

REVOLVE:响应演化驱动的智能优化框架,破解传统AI优化瓶颈
本文将介绍REVOLVE的核心概念、创新机制,并探讨其在解决方案优化、提示优化和代码优化等任务中的应用,分析其在多种场景中的实际效果。...
2025-03-04 · 浏览134次
微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA

微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA

微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA
近年来,大型语言模型(LLMs)在代码相关的任务上展现了惊人的表现,各种代码大模型层出不穷。...
2025-03-02 · 浏览146次
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河

GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河

GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河...
2025-03-01 · 浏览122次
刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席

刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席

刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席
刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席...
2025-02-28 · 浏览241次
北京大学两部 DeepSeek 秘籍新出炉!(附全集下载)

北京大学两部 DeepSeek 秘籍新出炉!(附全集下载)

北京大学两部 DeepSeek 秘籍新出炉!(附全集下载)
这次给大家分享的 PDF 下载,是原汁原味的原版哦,网上有太多卖课者魔改的内置其广告版本。...
2025-02-27 · 浏览285次
TOMG-Bench:大语言模型开放域分子生成新基准

TOMG-Bench:大语言模型开放域分子生成新基准

TOMG-Bench:大语言模型开放域分子生成新基准
香港理工大学、上海交通大学、上海人工智能实验的研究者提出了基于文本的开放分子生成基准测试(TOMG-Bench),旨在评估 LLM 在分子领域的开放域生成能力。...
2025-02-19 · 浏览153次
超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分

超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分

超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分
ARC Prize,曾在去年底 OpenAI 12 天连发的最后一天赚尽了眼球,其发布已经 5 年的基准 ARC-AGI 首次迎来了得分达到优良等级的挑战者:o3 系列模型。...
2025-02-18 · 浏览189次
AAAI 2025 | 大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路

AAAI 2025 | 大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路

AAAI 2025 | 大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路
人类拥有一种强大的能力,能够理解多个实体之间复杂的关系并基于这些关系进行推理,这被称为组合关系推理(Compositional Relational Reasoning, CR...
2025-02-06 · 浏览119次
英伟达憾失DeepSeek关键人才?美国放走AI「钱学森」,哈佛教授痛心疾首

英伟达憾失DeepSeek关键人才?美国放走AI「钱学森」,哈佛教授痛心疾首

英伟达憾失DeepSeek关键人才?美国放走AI「钱学森」,哈佛教授痛心疾首
英伟达憾失DeepSeek关键人才?美国放走AI「钱学森」,哈佛教授痛心疾首...
2025-02-05 · 浏览156次
能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?

能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?

能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?
一家来自杭州的“小公司” DeepSeek,却给整个 AI 行业带来了新思路,这两天可以说是火遍了全网。...
2025-01-29 · 浏览385次
ChatGPT全年更新大总结!重看「大模型风向标」进化之路

ChatGPT全年更新大总结!重看「大模型风向标」进化之路

ChatGPT全年更新大总结!重看「大模型风向标」进化之路
ChatGPT全年更新大总结!重看「大模型风向标」进化之路...
2025-01-15 · 浏览559次
研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI 模型

研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI 模型

研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI 模型
纽约大学的一项研究揭示了大型语言模型(LLM)在医学信息训练中的潜在风险。研究表明,即使训练数据中仅含有 0.001% 的错误信息,也可能导致模型输出不准确的医学答案。...
2025-01-15 · 浏览165次
ChatGPT两周年:从不被看好到掀起AI浪潮,一文解析缘起与未来

ChatGPT两周年:从不被看好到掀起AI浪潮,一文解析缘起与未来

ChatGPT两周年:从不被看好到掀起AI浪潮,一文解析缘起与未来
ChatGPT两周年:从不被看好到掀起AI浪潮,一文解析缘起与未来...
2025-01-10 · 浏览136次
奥特曼崩溃认错:ChatGPT被用户薅秃,OpenAI亏大了!专访痛忆宫斗事件

奥特曼崩溃认错:ChatGPT被用户薅秃,OpenAI亏大了!专访痛忆宫斗事件

奥特曼崩溃认错:ChatGPT被用户薅秃,OpenAI亏大了!专访痛忆宫斗事件
奥特曼崩溃认错:ChatGPT被用户薅秃,OpenAI亏大了!专访痛忆宫斗事件...
2025-01-07 · 浏览150次
刚刚,奥特曼更新博客:创业第十年,我的反思

刚刚,奥特曼更新博客:创业第十年,我的反思

刚刚,奥特曼更新博客:创业第十年,我的反思
山姆・奥特曼开始反思了。...
2025-01-06 · 浏览123次
奥特曼回应一切:宫斗、马斯克、ChatGPT两周年

奥特曼回应一切:宫斗、马斯克、ChatGPT两周年

奥特曼回应一切:宫斗、马斯克、ChatGPT两周年
2022 年 11 月 30 日,OpenAI 的网站访问量达到了一个从未有过的峰值。...
2025-01-06 · 浏览158次
第一页 · 上一页 · 下一页 · 当前第1页