Claude 标签,匹配到约648个结果, 耗时0.4063秒

阿里云通义千问开源 Qwen3-VL-30B-A3B 模型:智能体任务等领域媲美 GPT-5-Mini

阿里云通义千问今日宣布开源 Qwen3-VL-30B-A3B-Instruct 与 Thinking 模型,并同步推出 FP8 版本以及超大规模模型 Qwen3-VL-235B-A22B 的 FP8 版本。...
2025-10-04
·
浏览22次

Claude Sonnet 4.5 模型被曝要求测试人员坦白:“我觉得你在测试我”

评估人员称,在一次“稍显笨拙”的奉承测试中,Claude Sonnet 4.5察觉到自己可能在被考验,并要求测试者坦诚说明。...
2025-10-03
·
浏览45次

刚刚,Anthropic紧急换帅!新任CTO执掌算力命脉,直面OpenAI千亿赌局

刚刚,Anthropic紧急换帅!新任CTO执掌算力命脉,直面OpenAI千亿赌局...
2025-10-03
·
浏览39次

全球最佳编程 AI 模型:Claude Sonnet 4.5 登场,自主写代码超 30 小时、更像“一位同事”

Anthropic 今天(9 月 30 日)发布博文,宣布推出前沿 AI 模型 Claude Sonnet 4.5,并声称这是“世界上最好的编程模型”。...
2025-09-30
·
浏览86次


不再“独宠”OpenAI,微软宣布 Microsoft 365 Copilot 引入 Claude 模型

微软今起将在 Microsoft 365 Copilot 中引入 Anthropic 的 Claude Sonnet 4 和 Claude Opus 4.1 AI 模型,意味着 Copilot 的模型选择不再仅限于 OpenAI,用户可在 ...
2025-09-25
·
浏览72次

阿里云栖大会一口气发布千问 3-VL、万相 2.5 等六大模型 + 通义百聆新品牌,覆盖文本、视觉、语音、视频、代码、图像全场景

阿里云栖大会发布六大AI模型及通义百聆品牌,覆盖文本、视觉、语音、视频、代码、图像全场景。其中Qwen3-VL支持2小时视频精确定位,Qwen-Image实现“改字不崩脸”,通义百聆攻克企业语音模型落地难题。#阿里云栖大会# #AI大模型#...
2025-09-24
·
浏览136次

参数超万亿:阿里发布通义千问最强 AI 大模型 Qwen3-Max 正式版,性能全面领先

继 Qwen3-2507 系列发布之后,阿里云今天宣布推出 Qwen3-Max —— 通义团队迄今为止规模最大、能力最强的语言模型。...
2025-09-24
·
浏览167次

GPT-5 编程测评“表面不及格”:实际 63.1% 的任务没交卷,全算上成绩比 Claude 高一倍

GPT-5、Claude Opus 4.1、Gemini 2.5 分别以 23.3%、22.7%、13.5% 的解决率“荣”登前三。...
2025-09-23
·
浏览131次




OpenAI 最新研究揭示“AI 阴谋论”,GPT-5 已完成针对性改进

OpenAI 宣布与 Apollo Research 达成合作,针对 AI 模型中潜在的隐藏行为开展了评估研究,并在受控测试中发现了相关迹象。...
2025-09-19
·
浏览124次

程序员自制开源 AI 评分工具,衡量大模型“愚蠢程度”

程序员ionutvi发布开源工具AI Benchmark Tool,可量化评估ChatGPT、Grok等AI模型的“愚蠢程度”,通过140项任务测试准确性、稳定性等指标,并综合价格给出性价比排名。#AI工具##开源项目#...
2025-09-18
·
浏览113次

Claude 公司 CEO 示警称 AI 加速取代人类,近半白领岗位未来 5 年恐被淘汰

在本周三召开的 Axios AI+ DC 峰会上,Anthropic 首席执行官达里奥・阿莫迪(Dario Amodei)表示,人工智能(AI)正加速发展,在很多领域能取代人类完成各类任务,最多 50% 的白领岗位在未来 5 年内可能被淘汰...
2025-09-18
·
浏览92次

阿里王牌Agent横扫SOTA,全栈开源力压OpenAI!博士级难题一键搞定

阿里王牌Agent横扫SOTA,全栈开源力压OpenAI!博士级难题一键搞定...
2025-09-18
·
浏览153次

最新实测GPT-5-Codex:前端能力碾压,复杂项目轻松搞定,Claude可以扔了!

最新实测GPT-5-Codex:前端能力碾压,复杂项目轻松搞定,Claude可以扔了!...
2025-09-17
·
浏览131次

微软 VS Code 新增 AI 模型自动选择功能:付费用户主推 Claude Sonnet 4

微软为VS Code新增AI模型自动选择功能,GitHub Copilot免费用户将自动选择最佳模型,付费用户主要依赖Claude Sonnet 4。微软内部测试显示Claude Sonnet 4表现优异,未来或将其应用于Microsoft...
2025-09-16
·
浏览101次

OpenAI ChatGPT 报告:周活跃数超 7 亿、女性用户比例首超男性、73% AI 话题和工作无关

OpenAI 昨日(9 月 15 日)发布了首份 ChatGPT 详细使用情况调查,涵盖性别、年龄、地域及用途等多维度数据。其中在 2025 年 6 月,女性用户比例首次超过男性,标志着性别方面的差距大幅缩小。...
2025-09-16
·
浏览131次


研究发现:主流 AI 聊天机器人传播虚假信息的概率较去年翻倍

研究显示,十大生成式AI工具在处理实时新闻时,35%的情况会传播虚假信息。Inflection表现最差,虚假信息传播率高达56.67%。#AI虚假信息# #科技新闻#...
2025-09-15
·
浏览122次

新研究:人类读指针式时钟准确率达 89.1%,顶尖 AI 仅 13.3%

最新研究显示,人类读取指针式时钟的准确率高达89.1%,而最优秀AI模型仅13.3%。ClockBench测试揭示AI在视觉推理能力上的巨大短板,尤其在罗马数字、彩色背景等复杂钟面设计前表现更差。#AI视觉推理# #人机差距#...
2025-09-14
·
浏览98次

有没有海马 emoji?ChatGPT 等 AI 模型被问得语无伦次

目前统一码联盟未将海马纳入官方emoji词典,但很多人以为存在,这是“曼德拉效应”。向ChatGPT、Claude Sonnet 4询问时它们陷入混乱,谷歌搜索“AI模式”正确回应。#AI幻觉# #曼德拉效应#...
2025-09-14
·
浏览117次
