GPT-SoVITS-WebUI 强大的少样本语音转换与语音合成

善渊发表于 2024-11-9 14:31:16

功能：
零样本文本到语音（TTS）：输入 5 秒的声音样本，即刻体验文本到语音转换。
少样本 TTS：仅需 1 分钟的训练数据即可微调模型，提升声音相似度和真实感。
跨语言支持：支持与训练数据集不同语言的推理，目前支持英语、日语、韩语、粤语和中文。
WebUI 工具：集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注，协助初学者创建训练数据集和 GPT/SoVITS 模型。

V2发布说明
新特性:
支持韩语及粤语
更好的文本前端
底模由2k小时扩展至5k小时
对低音质参考音频（尤其是来源于网络的高频严重缺失、听着很闷的音频）合成出来音质更好详见wiki

开源库：https://github.com/RVC-Boss/GPT-SoVITS
软件整合包：https://www.123pan.com/s/5tIqVv-GVRcv.html

页: [1]

ROOT开源's Archiver

GPT-SoVITS-WebUI 强大的少样本语音转换与语音合成