B站开发的tts工具 IndexTTS2

以上是效果

IndexTTS2 是由 Bilibili 开发的下一代文本转语音模型，于2025年9月8日正式开源。该模型在情感表达和时长控制方面实现重大突破，被社区誉为”最逼真、最具表现力的 TTS 模型”。

全球首创功能
IndexTTS2 是首个支持精确时长控制的自回归 TTS 模型，精确到毫秒级别

输入方式1：音频 + 文本
输入方式2：情感音频 + 目标文本  
输入方式3：情感描述文本 + 目标文本
输入方式4：情感向量 + 目标文本

# index-tts2 一键整合包

## 使用方法

1. 下载解压
2. 双击`双击启动.bat`
3. 第一次启动会自动创建python环境、安装依赖、下载 index-tts2模型，用时可能从几分钟到几十分钟，请耐心等待

如果最终窗口底部显示如下图，说明成功.

4. 成功后，将自动在浏览器中打开地址http://127.0.0.1:7860`

默认从 modelscope.cn 下载模型，如果你希望从 huggingface 下载，则打开 `webui.py`文件，找到第 53 行，将紧接着的4行代码前的`#`符号删掉，然后删掉后续的3行代码，即可。