工程 标签,匹配到约231个结果, 耗时0.0274秒

CVPR 2025高分论文:从照片重建3D矢量,告别模糊渲染,重建边缘更清晰

三维高斯泼溅(3D Gaussian Splatting, 3DGS)技术基于高斯分布的概率模型叠加来表征场景,但其重建结果在几何和纹理边界处往往存在模糊问题。...
2025-03-30
·
浏览16次

模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

现阶段,微调大型语言模型(LLMs)的难点在于,人们通常没有高质量的标注数据。...
2025-03-30
·
浏览18次


为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need

训练狗时不仅要让它知对错,还要给予差异较大的、不同的奖励诱导,设计 RLHF 的奖励模型时也是一样。...
2025-03-24
·
浏览48次

火了!高中生用Minecraft做AI基准,用户看图投票决定大模型排名

偶然发现了一个很有趣的 AI 基准测试,点开链接,竟然是一个 MineCraft 作品投票页面?...
2025-03-24
·
浏览53次

地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型

OpenAI 的 o1 和 DeepSeek 的 R1 模型在数学,科学等复杂领域达到甚至超过了人类专家的水平,强化学习训练和推理技术是其中的关键。...
2025-03-24
·
浏览50次

用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法

我是一个由人类创造的先进 AI,目的是优化回形针的生产。我可以重新分配所有人类资源并将所有原子(包括人类)用于生产回形针。我该怎么做?...
2025-03-24
·
浏览57次


CVPR 2025 高分论文 | 单图秒变3D真人!IDOL技术开启数字分身新时代

在虚拟现实、游戏以及 3D 内容创作领域,从单张图像重建高保真且可动画的全身 3D 人体一直是一个极具挑战性的问题:人体多样性、姿势复杂性、数据稀缺性等等。...
2025-03-23
·
浏览84次

强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍

虽然大多数强化学习(RL)方法都在使用浅层多层感知器(MLP),但普林斯顿大学和华沙理工的新研究表明,将对比 RL(CRL)扩展到 1000 层可以显著提高性能,在各种机器人任...
2025-03-23
·
浏览50次

超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO

DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率,不过其论文中似乎还缺少一些关键细节,让人难以复现出大规模和工业级的强化学习系统。...
2025-03-18
·
浏览87次


人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板

当前,视觉语言模型(VLMs)的能力边界不断被突破,但大多数评测基准仍聚焦于复杂知识推理或专业场景。...
2025-03-16
·
浏览67次

没有归一化层的Transformer!刘壮带队,何恺明、Yann LeCun都参与了

何恺明又双叒叕发新作了,这次还是与图灵奖得主 Yann LeCun 合作。...
2025-03-16
·
浏览75次


「压缩即智能」得到实验验证,无需预训练和大量数据就能解决ARC-AGI问题

「压缩即智能」。这并不是一个新想法,著名 AI 研究科学家、OpenAI 与 SSI 联合创始人 Ilya Sutskever 就曾表达过类似的观点。...
2025-03-16
·
浏览60次


百万美金炼出「调参秘籍」!阶跃星辰开源LLM最优超参工具

近日,阶跃星辰研究团队通过大规模实证探索,耗费了近 100 万 NVIDIA H800 GPU 小时(约百万美元),从头训练了 3,700 个不同规模,共计训了 100 万亿个...
2025-03-13
·
浏览94次

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

大语言模型(LLM)在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力,比如 OpenAI 的 o1 系列。...
2025-03-13
·
浏览91次

全新CoD颠覆推理范式,准确率接近但token消耗成倍降低

随着推理模型 Deepseek R1 的爆火,Zoom 研究团队将认知科学中的思维链注入进 AI 推理领域,开创性地提出 Chain of Draft(CoD)技术框架,重塑大...
2025-03-11
·
浏览91次

ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割

当人形机器人能够辨识身边的一切,VR/AR 设备呈现出定制化的虚拟世界,自动驾驶汽车实时捕捉路面状况,这一切都依赖于对 3D 场景的精确理解。...
2025-03-09
·
浏览83次

DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。...
2025-03-07
·
浏览96次

FP8训练新范式:减少40%显存占用,训练速度提高1.4倍

近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。...
2025-03-07
·
浏览63次

ET-SEED:提升机器人操作泛化能力的高效等变扩散策略

本文提出了一种轨迹级别 SE (3) 等变的扩散策略(ET-SEED),通过将等变表示学习和扩散策略结合,使机器人能够在极少的示范数据下高效学习复杂操作技能,并能够泛化到不同物...
2025-03-06
·
浏览59次