性能 标签,匹配到约1427个结果, 耗时0.2689秒

模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

现阶段,微调大型语言模型(LLMs)的难点在于,人们通常没有高质量的标注数据。...
2025-03-30
·
浏览19次

OpenAI豪赌400亿美金融资,却遭微软围剿!改组霸王条款,失败砍半200亿

OpenAI豪赌400亿美金融资,却遭微软围剿!改组霸王条款,失败砍半200亿...
2025-03-30
·
浏览21次


性能优于o3-mini,DeepMind发布通用医学开源LLM与问答Agent,改善治疗开发

Google DeepMind 团队发布了 TxGemma,这是一组开源模型,旨在通过利用大型语言模型的强大功能来提高治疗开发的效率。...
2025-03-28
·
浏览31次

3D领域DeepSeek「源神」启动!国产明星创业公司,一口气开源八大项目

2025 开年,DeepSeek-R1 的成功在全球掀起了一股开源风潮,上个月的开源周更是毫无保留地将自己的多项核心技术开放给了全球开发者。...
2025-03-28
·
浏览35次

Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光

Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光...
2025-03-28
·
浏览34次

2024 ACM计算奖出炉!ETU教授、超算架构革命者获奖,贡献加速ChatGPT诞生

2024 ACM计算奖出炉!ETU教授、超算架构革命者获奖,贡献加速ChatGPT诞生...
2025-03-28
·
浏览30次


活性提升65倍,山大新AI工具定向进化高活性酶,外部数据集验证成功率达80%

以山东大学为主导的团队提出了一种基于预训练模型和分子指纹的深度学习模型 CataPro ,并用它来预测转换数(k(cat))、米歇尔常数(K(m))和催化效率(k(cat)/K...
2025-03-26
·
浏览55次

上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

近日,上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合数据科学和统计研究院、财跃星辰、滴水湖高级金融学院正式发布首款 ...
2025-03-26
·
浏览59次

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

近日,英伟达发布了一系列针对物理常识推理进行了专门优化的新模型:Cosmos-Reason1。...
2025-03-26
·
浏览64次

Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍

从微观世界的分子与材料结构、到宏观世界的几何与空间智能,创建和理解 3D 结构是推进科学研究的重要基石。...
2025-03-26
·
浏览44次

谷歌最强模型 Gemini 2.5 Pro 发布即屠榜,创下史上最大分数飞跃纪录

谷歌称,它是世界上最强大的模型,具备统一的推理能力,以及用户所喜爱的 Gemini 的所有功能(长上下文、工具等)。...
2025-03-26
·
浏览49次

暴击GPT-4.5,DeepSeek-V3-0324官方报告出炉!系统提示、最佳温度全放出

暴击GPT-4.5,DeepSeek-V3-0324官方报告出炉!系统提示、最佳温度全放出...
2025-03-26
·
浏览19次

谷歌地表最强模型深夜来袭!Gemini 2.5 Pro发布即屠榜,代码推理杀疯了

谷歌地表最强模型深夜来袭!Gemini 2.5 Pro发布即屠榜,代码推理杀疯了...
2025-03-26
·
浏览22次



全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话...
2025-03-25
·
浏览35次

首个评估MLLMs对地质图理解的基准集,以及专为地质图理解设计的Agent

为了帮助地质学领域更好地解读地质图,微软亚洲研究院推出了首个用于评估多模态大语言模型在地质图理解方面的基准集 GeoMap-Bench。...
2025-03-25
·
浏览62次

DeepSeek-V3 模型完成小版本升级,已可试用体验

DeepSeek 在其官方交流群宣布称,DeepSeek-V3 模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API 接口和使用方式保持不变。...
2025-03-25
·
浏览66次

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑...
2025-03-25
·
浏览82次


爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合 | ICLR 2025

爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合 | ICLR 2025...
2025-03-25
·
浏览60次

CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑

香港科技大学谭平教授团队在 CVPR 2025 发表两项三维生成技术框架,核心代码全部开源,助力三维生成技术的开放与进步。...
2025-03-24
·
浏览45次