LongCatAudioDiT 标签,匹配到约1个结果, 耗时0.0232秒
美团发布 LongCat-AudioDiT 音频生成模型:说话人相似度指标提升至 0.818,现已开源
美团发布 LongCat-AudioDiT 音频生成模型,直接于波形潜空间进行文本转语音,摒弃传统多阶段流程,有效减少误差累积。其 3.5B 版本在说话人相似度指标上超越多个知名模型,现已开源。#AI 语音合成##美团开源#...
2026-04-02
·
浏览16次
上一页
·
下一页
· 当前第1页
AI 中文社