MoE 标签,匹配到约1个结果, 耗时0.0425秒
MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5,核心能力接近 GPT-4
abab 6.5 系列模型包含万亿参数的 abab 6.5 与更高效的 abab 6.5s,支持 200k tokens 的上下文长度,最快可 1 秒内处理近 3 万字的文本,...
2024-04-17
·
浏览313次
上一页
·
下一页
· 当前第1页