美团发布 LongCat-Flash-Lite 轻量化 MoE 模型,智能体与代码表现突出

2026-02-06 发布 · 浏览24次 · 点赞0次 · 收藏0次
感谢网友 GreatMOLA 的线索投递!

2 月 6 日消息,美团今日(2 月 6 日)发布 LongCat-Flash-Lite 模型,这是一款拥有 685 亿参数,每次推理仅激活 29 亿 ~45 亿参数的轻量化 MoE 模型

图片

通过将超过 300 亿参数用于嵌入层,LongCat-Flash-Lite 宣称不仅超越了参数量等效的 MoE 基线模型,还在与同规模现有模型的对比中展现出“卓越的竞争力”,尤其在智能体与代码领域表现突出,并依托 YARN 技术可支持最长 256 K 上下文,能高效处理长文档、大规模代码分析等场景。

图片

同时,该模型基于嵌入扩展的应用与系统级优化,让模型推理效率大幅提升,在输入 4K,输出 1k 的典型负载下,LongCat API 可提供 500-700 token/s 的生成速度

美团宣布向开发者开放 LongCat-Flash-Lite 版本 API 接口,可登录 LongCat API 开放平台申请,每日免费额度 5000 万 tokens。

附 LongCat-Flash-Lite 开源地址如下:

https://github.com/meituan-longcat/SGLang-FluentLLM

美团发布 LongCat-Flash-Lite 轻量化 MoE 模型,智能体与代码表现突出 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。