云雀大模型

云雀大模型

云雀大模型，字节研发的大模型产品，字节的云雀大模型是首批上线的8家大模型之一。

浏览(3848) 点赞(0) 收藏(1) 反馈 访问工具

云雀大模型是字节跳动公司旗下的语言模型，不是抖音研发的。以下是云雀大模型的详细介绍：

模型能力：
- 模型规模：云雀大模型的参数规模为1300亿，是目前国内最大的中文预训练模型之一。
- 架构：云雀大模型使用了Transformer架构，这种架构具有良好的并行性和效率，可以在大规模数据集上进行训练。
- 训练数据量：云雀大模型使用了字节跳动公司的海量数据进行预训练，包括文本、图像、视频、音频等多种模态的数据。其中包括了中文维基百科、新闻、小说、对话、社交媒体等多种类型的文本数据。这些数据覆盖了中文语言的多个领域和风格，可以帮助模型学习丰富的语言知识和语境信息。
- 训练算力：云雀大模型基于字节跳动公司自研的字节神经网络加速器进行训练。该加速器是专门为深度学习模型设计的硬件平台，可以提供高效的计算性能和低延迟的通信能力，支持大规模的模型并行和数据并行。
任务处理能力：
- 语言翻译：云雀大模型能够处理多重自然语言处理任务，包括语言翻译。
- 问答系统：模型能够处理问答系统。
- 文本摘要：模型能够进行文本摘要。
- 视频内容理解：模型能够识别视频中的对象、场景和情感等关键要素，为多模态任务提供了坚实的基础。