AI 中文社区

字节跳动豆包大模型团队开源MoE架构优化技术，训练成本节省40%

字节跳动豆包大模型团队官宣开源一项针对 MoE（混合专家模型）架构的关键优化技术，可将大模型训练效率提升 1.7 倍，成本节省 40%。据悉，该技术叫做 COMET，已实际应用...

2025-03-11 · 浏览829次

DeepSeek的最佳用法？西湖大学发布可以自主进化的手机智能体AppAgentX

近年来，大语言模型（LLM）的快速发展正推动人工智能迈向新的高度。...

2025-03-11 · 浏览404次

扩散模型+深度学习双剑合璧，生成式AI破解染色质构象

麻省理工学院的化学家们现在想出了一种使用生成式人工智能来确定这些 3D 基因组结构的新方法。他们的技术可以在几分钟内预测数千个结构，这比现有的结构分析实验方法要快得多。...

2025-03-11 · 浏览312次

优于o1预览版，推理阶段KV缓存缩减一半，LightTransfer降本还能增效

LLM 在生成 long CoT 方面展现出惊人的能力，例如 o1 已能生成长度高达 100K tokens 的序列。...

2025-03-11 · 浏览234次

报名｜这可能是讨论 Deepseek 部署与实践最有深度的闭门会

模型选型→场景部署→应用实战，这场闭门会一网打尽。...

2025-03-11 · 浏览316次

全新CoD颠覆推理范式，准确率接近但token消耗成倍降低

随着推理模型 Deepseek R1 的爆火，Zoom 研究团队将认知科学中的思维链注入进 AI 推理领域，开创性地提出 Chain of Draft（CoD）技术框架，重塑大...

2025-03-11 · 浏览315次

Manus被破解了？曝出系统提示词和背后大模型，CTO也回复了

最近几天，一个叫「Manus」的通用 AI Agent 产品刷屏网络。...

2025-03-11 · 浏览405次

“专为我开了一个新课题”，顶尖博士为什么偏爱去字节实习？

在字节跳动，有这样一群实习生，他们的另一重身份，都是来自顶尖高校的技术博士。...

2025-03-11 · 浏览515次

哥大本科生靠AI横扫硅谷大厂offer，学校震怒！预言码农两年内淘汰准备退学

哥大本科生靠AI横扫硅谷大厂offer，学校震怒！预言码农两年内淘汰准备退学...

2025-03-10 · 浏览542次

谷歌CEO劈柴：DeepSeek让人兴奋，自己难以追上AI步伐

谷歌CEO劈柴：DeepSeek让人兴奋，自己难以追上AI步伐...

2025-03-10 · 浏览281次

4090价格炒到离谱！RTX 5000 Ada成DeepSeek一体机新宠，32GB性价比拉满

4090价格炒到离谱！RTX 5000 Ada成DeepSeek一体机新宠，32GB性价比拉满...

2025-03-10 · 浏览294次

超越 Mistral 和 Qwen：谷歌 Gemini Embedding 登顶 MTEB，问鼎最强文本嵌入 AI 模型

Gemini Embedding的发布标志着谷歌在AI文本处理领域的又一次突破。其卓越的性能和广泛的应用潜力，不仅为谷歌搜索和云服务提供了强大支持，也为企业用户带来了更多可能性...

2025-03-10 · 浏览647次

1次搭建完胜1亿次编码，MCP硅谷疯传！Anthropic协议解锁智能体「万能手」

1次搭建完胜1亿次编码，MCP硅谷疯传！Anthropic协议解锁智能体「万能手」...

2025-03-10 · 浏览716次

调查显示 ChatGPT 为全球职场最受欢迎 AI 工具，印度使用率居首

根据 DeskTime 于 2023 年 1 月至 2024 年 12 月间开展的一项研究，ChatGPT 仍然是全球职场中使用最为广泛的人工智能工具，且其采用率仍在持续增长。...

2025-03-10 · 浏览343次

15B硬刚GPT-4o，CMU祭出LCPO提示可控思考！每token性能较S1暴涨2倍

15B硬刚GPT-4o，CMU祭出LCPO提示可控思考！每token性能较S1暴涨2倍...

2025-03-09 · 浏览319次

准博士生把导师履历论文输入ChatGPT，制成「AI评委」！顺利通过资格考试

准博士生把导师履历论文输入ChatGPT，制成「AI评委」！顺利通过资格考试...

2025-03-09 · 浏览292次

10²⁶参数，AGI还需70年！清华人大预测届时GPU总价达4000万倍苹果市值

10²⁶参数，AGI还需70年！清华人大预测届时GPU总价达4000万倍苹果市值...

2025-03-09 · 浏览417次

Ilya错了？Scaling另有他用，ViT大佬力挺谷歌1000亿数据新发现

Ilya错了？Scaling另有他用，ViT大佬力挺谷歌1000亿数据新发现...

2025-03-09 · 浏览403次

马斯克「大闹白宫」！美政府12000人将被GSAi优化，xAI 100万块GPU巨兽年底建成

马斯克「大闹白宫」！美政府12000人将被GSAi优化，xAI 100万块GPU巨兽年底建成...

2025-03-09 · 浏览400次

精度效率双冠王！时序预测新范式TimeDistill：跨架构知识蒸馏，全面超越SOTA

精度效率双冠王！时序预测新范式TimeDistill：跨架构知识蒸馏，全面超越SOTA...

2025-03-09 · 浏览261次

Nature封面：探索真菌网络，用机器人进行高通量延时成像研究

为了监测 AM 网络的构建过程，来自荷兰阿姆斯特丹 AMOLF 研究所等机构的研究者设计了一款定制机器人，用于高通量延时成像，能够同时追踪超过 50 万个真菌节点。研究登上《N...

2025-03-09 · 浏览352次

纳米世界的实时电影，科学家首次使用AI以毫秒级分辨率观察原子移动，登Science

实现了在温和电子束剂量下对气体环境中金属纳米颗粒表面进行毫秒级时间分辨率的原子尺度观察。...

2025-03-09 · 浏览275次

ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割

当人形机器人能够辨识身边的一切，VR/AR 设备呈现出定制化的虚拟世界，自动驾驶汽车实时捕捉路面状况，这一切都依赖于对 3D 场景的精确理解。...

2025-03-09 · 浏览349次

微软甩开OpenAI自研大模型，还计划用DeepSeek

思维链引发的战争。...

2025-03-09 · 浏览314次