3.5 标签,匹配到约145个结果, 耗时0.3630秒

OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手

OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手...
2025-03-12
·
浏览99次

REVOLVE:响应演化驱动的智能优化框架,破解传统AI优化瓶颈

本文将介绍REVOLVE的核心概念、创新机制,并探讨其在解决方案优化、提示优化和代码优化等任务中的应用,分析其在多种场景中的实际效果。...
2025-03-04
·
浏览84次

微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA

近年来,大型语言模型(LLMs)在代码相关的任务上展现了惊人的表现,各种代码大模型层出不穷。...
2025-03-02
·
浏览85次

GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河

GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河...
2025-03-01
·
浏览74次

刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席

刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席...
2025-02-28
·
浏览186次


TOMG-Bench:大语言模型开放域分子生成新基准

香港理工大学、上海交通大学、上海人工智能实验的研究者提出了基于文本的开放分子生成基准测试(TOMG-Bench),旨在评估 LLM 在分子领域的开放域生成能力。...
2025-02-19
·
浏览103次

超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分

ARC Prize,曾在去年底 OpenAI 12 天连发的最后一天赚尽了眼球,其发布已经 5 年的基准 ARC-AGI 首次迎来了得分达到优良等级的挑战者:o3 系列模型。...
2025-02-18
·
浏览120次

AAAI 2025 | 大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路

人类拥有一种强大的能力,能够理解多个实体之间复杂的关系并基于这些关系进行推理,这被称为组合关系推理(Compositional Relational Reasoning, CR...
2025-02-06
·
浏览84次

英伟达憾失DeepSeek关键人才?美国放走AI「钱学森」,哈佛教授痛心疾首

英伟达憾失DeepSeek关键人才?美国放走AI「钱学森」,哈佛教授痛心疾首...
2025-02-05
·
浏览103次

能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?

一家来自杭州的“小公司” DeepSeek,却给整个 AI 行业带来了新思路,这两天可以说是火遍了全网。...
2025-01-29
·
浏览359次


研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI 模型

纽约大学的一项研究揭示了大型语言模型(LLM)在医学信息训练中的潜在风险。研究表明,即使训练数据中仅含有 0.001% 的错误信息,也可能导致模型输出不准确的医学答案。...
2025-01-15
·
浏览135次


奥特曼崩溃认错:ChatGPT被用户薅秃,OpenAI亏大了!专访痛忆宫斗事件

奥特曼崩溃认错:ChatGPT被用户薅秃,OpenAI亏大了!专访痛忆宫斗事件...
2025-01-07
·
浏览119次




Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。...
2025-01-04
·
浏览123次


离职OpenAI后Lilian Weng博客首发!深扒RL训练漏洞,业内狂赞

离职OpenAI后Lilian Weng博客首发!深扒RL训练漏洞,业内狂赞...
2024-12-06
·
浏览173次

细思极恐,GPT-4竟串谋AI欺骗人类!哈佛PSU重磅揭秘「算法共谋」,AI教父预言正成真

细思极恐,GPT-4竟串谋AI欺骗人类!哈佛PSU重磅揭秘「算法共谋」,AI教父预言正成真...
2024-11-29
·
浏览214次

代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024

代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024...
2024-11-28
·
浏览247次
