让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek

让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek

让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek...
2025-03-09 · 浏览84次
Manus火到国外?网友实测惊呆!00后博士生0天复刻霸榜开源第一

Manus火到国外?网友实测惊呆!00后博士生0天复刻霸榜开源第一

Manus火到国外?网友实测惊呆!00后博士生0天复刻霸榜开源第一
Manus火到国外?网友实测惊呆!00后博士生0天复刻霸榜开源第一...
2025-03-08 · 浏览140次
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布

DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布

DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布...
2025-03-08 · 浏览72次
狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投

狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投

狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投
狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投...
2025-03-08 · 浏览54次
英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025

英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025

英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025
英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025...
2025-03-08 · 浏览87次
DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek的MLA,任意大模型都能轻松迁移了
DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。...
2025-03-07 · 浏览115次
DeepSeek行业实战指南:下周四这场闭门会速来围观!

DeepSeek行业实战指南:下周四这场闭门会速来围观!

DeepSeek行业实战指南:下周四这场闭门会速来围观!
模型选型→场景部署→应用实战,这场闭门会一网打尽。...
2025-03-07 · 浏览80次
FP8训练新范式:减少40%显存占用,训练速度提高1.4倍

FP8训练新范式:减少40%显存占用,训练速度提高1.4倍

FP8训练新范式:减少40%显存占用,训练速度提高1.4倍
近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。...
2025-03-07 · 浏览91次
谷歌创始人拉里·佩奇出山成立大模型公司,目标智能制造

谷歌创始人拉里·佩奇出山成立大模型公司,目标智能制造

谷歌创始人拉里·佩奇出山成立大模型公司,目标智能制造
谷歌联合创始人、全球第七富豪拉里・佩奇 (Larry Page) 已经成立了一个 AI 创业公司。...
2025-03-07 · 浏览80次
全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键

全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键

全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键
个人设备进入最强模型时代。...
2025-03-07 · 浏览111次
消息称 Meta 的 Llama 4 模型将聚焦语音交互,全力开拓 AI 商业版图

消息称 Meta 的 Llama 4 模型将聚焦语音交互,全力开拓 AI 商业版图

消息称 Meta 的 Llama 4 模型将聚焦语音交互,全力开拓 AI 商业版图
据英国金融时报报道,社交媒体巨头 Meta 正在加速其人工智能的语音功能开发,计划在未来几周内推出其最新开源大语言模型 Llama 4,并将语音交互作为核心功能之一。据知情人士...
2025-03-07 · 浏览96次
消息称微软正开发内部 AI 推理模型,并测试 xAI、DeepSeek 等多种 OpenAI 替代方案

消息称微软正开发内部 AI 推理模型,并测试 xAI、DeepSeek 等多种 OpenAI 替代方案

消息称微软正开发内部 AI 推理模型,并测试 xAI、DeepSeek 等多种 OpenAI 替代方案
外媒The Information 今晚发布消息称,微软正在开发内部人工智能推理模型,以与OpenAI竞争,并可能向开发者出售。...
2025-03-07 · 浏览85次
谁是最强AI研究助手?Meta等提出全新基准MLGym:LLM智能体大排名

谁是最强AI研究助手?Meta等提出全新基准MLGym:LLM智能体大排名

谁是最强AI研究助手?Meta等提出全新基准MLGym:LLM智能体大排名
谁是最强AI研究助手?Meta等提出全新基准MLGym:LLM智能体大排名...
2025-03-07 · 浏览78次
32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理

32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理

32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理
32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理...
2025-03-07 · 浏览107次
Ilya再融20亿SSI估值300亿!20人王牌团队首曝光,阵容超豪华

Ilya再融20亿SSI估值300亿!20人王牌团队首曝光,阵容超豪华

Ilya再融20亿SSI估值300亿!20人王牌团队首曝光,阵容超豪华
Ilya再融20亿SSI估值300亿!20人王牌团队首曝光,阵容超豪华...
2025-03-07 · 浏览93次
Nature:如何借助AI高效完成学术论文同行评审

Nature:如何借助AI高效完成学术论文同行评审

Nature:如何借助AI高效完成学术论文同行评审
研究者 Dritjon Gruda 在社交媒体上进行了一项非正式调查。他在 1 月份的 Facebook 和 LinkedIn 上发布帖子,询问学术同行花费多少时间审阅论文。...
2025-03-06 · 浏览97次
快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本

快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本

快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本
FPL-net 获得结果的速度比以前的方法快 1,000 倍,误差幅度仅为十万分之一,表现出卓越的准确性。...
2025-03-06 · 浏览76次
ET-SEED:提升机器人操作泛化能力的高效等变扩散策略

ET-SEED:提升机器人操作泛化能力的高效等变扩散策略

ET-SEED:提升机器人操作泛化能力的高效等变扩散策略
本文提出了一种轨迹级别 SE (3) 等变的扩散策略(ET-SEED),通过将等变表示学习和扩散策略结合,使机器人能够在极少的示范数据下高效学习复杂操作技能,并能够泛化到不同物...
2025-03-06 · 浏览71次
智源开源多模态向量模型BGE-VL:多模态检索新突破

智源开源多模态向量模型BGE-VL:多模态检索新突破

智源开源多模态向量模型BGE-VL:多模态检索新突破
BGE 系列模型自发布以来广受社区好评。...
2025-03-06 · 浏览103次
当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?

当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?

当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?
2025 年开年,DeepSeek R1 和 V3 重磅发布,其超强的语言建模与推理能力,引爆了全球 AI 社区。...
2025-03-06 · 浏览232次
强化学习成帮凶,对抗攻击LLM有了新方法

强化学习成帮凶,对抗攻击LLM有了新方法

强化学习成帮凶,对抗攻击LLM有了新方法
事物都有多面性,正如水,既能载舟,亦能覆舟,还能煮粥。强化学习也是如此。...
2025-03-06 · 浏览97次
字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景

字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景

字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景
2025 年 3 月 5 日,豆包宣布上线「深度思考」推理模式,全面覆盖问答、搜索、写作和阅读场景。要想进入「深度思考」推理模式,用户只需在输入框打开「深度思考Beta」开关即...
2025-03-06 · 浏览133次
DeepSeek 们上终端,未来手机、PC、汽车体验如何?

DeepSeek 们上终端,未来手机、PC、汽车体验如何?

DeepSeek 们上终端,未来手机、PC、汽车体验如何?
相信随着 AI 技术的不断进步和应用场景的不断拓展,包括高通在内的众多技术公司将继续引领终端侧 AI 推理创新,赋能千行百业,为我们创造更智能、更美好的生活...
2025-03-06 · 浏览85次
告别跑酷!波士顿动力 Atlas 机器人,正式进厂「搬砖」

告别跑酷!波士顿动力 Atlas 机器人,正式进厂「搬砖」

告别跑酷!波士顿动力 Atlas 机器人,正式进厂「搬砖」
波士顿动力公司刚刚发布了 Atlas 机器人的新视频,这位曾经以跑酷和空翻闻名的「网红」,如今竟然走进了工厂,开始认真从事零件排序工作!这标志着 Atlas 从「炫技」到「实用...
2025-03-06 · 浏览88次
第一页 · 上一页 · 下一页 · 当前第24页