ChatTTS 是专门针对对话场景设计的语音生成模型,适用于大语言模型助手的对话任务、对话式音视频介绍等应用。该模型支持中文和英文,经过约十万小时中英文数据的训练,在语音合成中表现出较高的质量和自然度。此外,项目组计划开源一个用 4 万小时数据训练的基础模型,助力学术界和开发者社区进一步研发。