设为首页收藏本站
ROOT开源 门户 查看主题

分享一个基于VITS的简单易用的变声框架,相当简答好用!

发布者: 善渊 | 发布时间: 2024-3-1 16:57| 查看数: 121| 评论数: 0|帖子模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×

分享一个基于VITS的简单易用的变声框架

使用截图:
image.png

训练推理界面


image.png

底模使用接近50小时的开源高质量VCTK训练集训练,无版权方面的顾虑,请大家放心使用
请期待RVCv3的底模,参数更大,数据更大,效果更好,基本持平的推理速度,需要训练数据量更少。
  • 使用top1检索替换输入源特征为训练集特征来杜绝音色泄漏
  • 即便在相对较差的显卡上也能快速训练
  • 使用少量数据进行训练也能得到较好结果(推荐至少收集10分钟低底噪语音数据)
  • 可以通过模型融合来改变音色(借助ckpt处理选项卡中的ckpt-merge)
  • 简单易用的网页界面
  • 可调用UVR5模型来快速分离人声和伴奏
  • 使用最先进的[color=var(--fgColor-accent, var(--color-accent-fg))]人声音高提取算法InterSpeech2023-RMVPE根绝哑音问题。效果最好(显著地)但比crepe_full更快、资源占用更小
  • A卡I卡加速支持

站长亲测可用。

github下载地址:
游客,如果您要查看本帖隐藏内容请回复

最新评论

投诉/建议联系

admin@zgroot.com

未经授权禁止转载,复制和建立镜像,
如有违反,追究法律责任
  • 关注公众号
  • 添加微信客服
  • QQ交流群
Copyright © 2001-2024 ROOT开源 版权所有 All Rights Reserved. |网站地图 蜀ICP备2020031569号-25|川公网安备 51162202511728
关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表