音频生成模型 标签,匹配到约1个结果, 耗时0.0495秒

阿里通义开源旗下首个音频生成模型 ThinkSound:可像“专业音效师”一样思考

ThinkSound 首次将 CoT(Chain-of-Thought,思维链)应用到音频生成领域,让 AI 学会一步步“想清楚”画面事件与声音之间的关系,从而实现高保真、强同步的空间音频生成 —— 不只是“看图配音”,而是真正“听懂画面”...
2025-07-04
·
浏览20次
上一页
·
下一页
· 当前第1页