DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K
浏览338次
点赞0次
收藏0次
8 月 20 日消息,DeepSeek 昨天深夜在 Hugging Face 上开源了新模型 V3.1-Base,根据介绍,该模型将上下文长度拓展至 128K,参数约为 685B。

附开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
而在昨晚早些时候,DeepSeek 发布通知称,线上模型版本已升级至 V3.1,上下文长度拓展至 128k,可通过官方网页、App、小程序测试,API 接口调用方式保持不变。
需要注意的是,大家期待已久的 DeepSeek R2 仍没有确定的发布时间。
声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!
AI 中文社