基于RTVC-7VoiceCloningModel的Tuned-GE2E-SayEN-EarSpeech搭建怎样的-快上网网站建设公司

基于RTVC-7VoiceCloningModel的Tuned-GE2E-SayEN-EarSpeech搭建怎样的

基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。

创新互联公司长期为上1000+客户提供的网站建设服务，团队从业经验10年，关注不同地域、不同群体，并针对不同对象提供差异化的产品和服务；打造开放共赢平台，与合作伙伴共同营造健康的互联网生态环境。为温江企业提供专业的成都网站制作、网站建设、外贸网站建设，温江网站改版等技术服务。拥有10年丰富建站经验和众多成功案例,为您定制开发。

0. 说明

和 https://blog.csdn.net/u013625492/article/details/114433738 中 GE2E 的版本几乎一致
区别就是文本是英文, 使用 VCTK 等英文数据集训练

1. Git Clone

https://github.com/ruclion/Tuned-GE2E-SayEN-EarSpeech

2. 训练数据

2.1. VCTK

之前训练 AutoVC 用过

基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的

处理数据的逻辑从: /ceph/home/hujk17/Tuned-GE2E-SayEN-EarSpeech/FaPig_extract_GE2E_VCTK_nosli.py 开始
保留了 train, val, unseen. 训练的时候只使用 train

基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的

3. speaker embedding

在 2.1. 中也一并提取了, 使用 GE2E

4. 预处理数据 -> mel

在 2.1. 中也一并提取了, 使用实验室的 mel.嘿嘿(●ˇ∀ˇ●), 终于方便啦

5. 改代码

symbols 不用动, 本身就保留了英文的标点
需要改下 train.txt 的路径
以 Kiss 为模型名字, 逻辑从 Kiss_train.py 开始
直接用本来的小 Batch 训练, batch_size = 12

6. GE2E 版逻辑

256 的 Embedding 仍然后面接了一个 FC, 和中文的一致
中文的叫 FaPig, 英文叫 Kiss, 逻辑从 Kiss_train.py 开始
from synthesizer.FaPig_train import train 和 from synthesizer.Kiss_train import train 其实完全一致, 只是为了统一格式, 拷贝了一份

看完上述内容，你们掌握基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的的方法了吗？如果还想学到更多技能或想了解更多相关内容，欢迎关注创新互联行业资讯频道，感谢各位的阅读！

本文标题：基于RTVC-7VoiceCloningModel的Tuned-GE2E-SayEN-EarSpeech搭建怎样的
分享地址：http://cdkjz.cn/article/geisgh.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

基于RTVC-7VoiceCloningModel的Tuned-GE2E-SayEN-EarSpeech搭建怎样的

0. 说明

1. Git Clone

2. 训练数据

2.1. VCTK

3. speaker embedding

4. 预处理数据 -> mel

5. 改代码

6. GE2E 版逻辑

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

基于RTVC-7VoiceCloningModel的Tuned-GE2E-SayEN-EarSpeech搭建怎样的

0. 说明

1. Git Clone

2. 训练数据

2.1. VCTK

3. speaker embedding

4. 预处理数据 -> mel

5. 改代码

6. GE2E 版逻辑

相关资讯

linux下无法启动mysql怎么解决-创新互联

支持二次开发的Zigbee模块(SNAP技术)-创新互联

今天我们不谈企业，只谈电影！-创新互联

asp.net快速开发平台，敏捷核心，多种管理系统一步到位-创新互联

Systemd如何实现在Nginx服务器中添加-创新互联

java中全局变量和局部变量有什么区别-创新互联

EonStorGSi：媒资管理的完美存储-创新互联

使用opencv将视频帧转成图片输出-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接