设为首页收藏本站
返回列表 发布新帖

[Windows] 分享一个基于VITS的简单易用的变声框架,相当简答好用!

IP属地:四川省
122 0
发表于 2024-3-1 16:57:50 | 显示全部楼层 阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×

分享一个基于VITS的简单易用的变声框架

使用截图:
image.png

训练推理界面


image.png

底模使用接近50小时的开源高质量VCTK训练集训练,无版权方面的顾虑,请大家放心使用
请期待RVCv3的底模,参数更大,数据更大,效果更好,基本持平的推理速度,需要训练数据量更少。
  • 使用top1检索替换输入源特征为训练集特征来杜绝音色泄漏
  • 即便在相对较差的显卡上也能快速训练
  • 使用少量数据进行训练也能得到较好结果(推荐至少收集10分钟低底噪语音数据)
  • 可以通过模型融合来改变音色(借助ckpt处理选项卡中的ckpt-merge)
  • 简单易用的网页界面
  • 可调用UVR5模型来快速分离人声和伴奏
  • 使用最先进的[color=var(--fgColor-accent, var(--color-accent-fg))]人声音高提取算法InterSpeech2023-RMVPE根绝哑音问题。效果最好(显著地)但比crepe_full更快、资源占用更小
  • A卡I卡加速支持

站长亲测可用。

github下载地址:
游客,如果您要查看本帖隐藏内容请回复

风起于青萍之末,浪成于微澜之间。跌谷底也要开花。沉海底也要望月。与其抱怨于黑暗。不如提灯向前行。

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

投诉/建议联系

admin@zgroot.com

未经授权禁止转载,复制和建立镜像,
如有违反,追究法律责任
  • 关注公众号
  • 添加微信客服
  • QQ交流群
Copyright © 2001-2024 ROOT开源 版权所有 All Rights Reserved. |网站地图 蜀ICP备2020031569号-25|川公网安备 51162202511728
关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表