GPT-SoVITS beta1.30，一分钟复刻声音，支持中日英，国人自研低成本AI音色克隆软件『电脑软件』

27CaT 发表于 2024-2-1 12:38:07

GPT-SoVITS beta1.30，一分钟复刻声音，支持中日英，国人自研低成本AI音色克隆软件

简介：
本软件为B站UP主@花儿不哭耗时两个月自主研发的开源低成本AI音色克隆软件（GitHub Star7.9k），他也是知名声音克隆软件Bert-vits2和RVC变声器的创始人，按照他视频里的说法，本软件一分钟就能复刻声音(并且效果比今年1月爆火的人工智能语音公司ElevenLabs的技术好很多)，还有5秒极限复刻模式，用于特殊情况。我花了三天时间实测了一下效果确实很好，只需要半个小时就能训练出你想要的声音，并且1分钟的音频训练出来的相似度已经很高了，底下评论区置顶也有成功案例，因此来向大家推荐
此外，由于软件几乎每天都更新，且处于beta阶段，目前并没有版本号，因此暂时用最后一次更新的日期代表版本号，等软件作者给出明确版本号我再更新版本号

配置要求（直接借用秋月大佬的话了）：
训练至少10系及以上，A卡(rx6000除外)和I卡别想训练，推理还行(cpu)
训练显存至少6G，推理至少2G
看显存：任务管理器/性能/GPU/专用GPU内存
16系显卡需要额外配置
硬要用cpu训练的劝你不要为难电脑，不如玩其他去

功能：
零样本文本到语音（TTS）：输入 5 秒的声音样本，即刻体验文本到语音转换。
少样本 TTS：仅需 1 分钟的训练数据即可微调模型，提升声音相似度和真实感。
跨语言支持：支持与训练数据集不同语言的推理，目前支持英语、日语和中文。
WebUI 工具：集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注，协助初学者创建训练数据集和 GPT/SoVITS 模型。

**** Hidden Message *****

lifu2009 发表于 2024-2-16 15:21:43

6666666666666666

luhuabao110 发表于 2024-6-22 04:04:03

00000000000000000000000000

Cat7493 发表于 2024-7-14 03:29:00

6666666666666

w4341776 发表于 2024-7-17 00:15:08

感谢分享

N9loveyou 发表于 2024-7-17 01:56:29

6666666666666666

18339768758 发表于 2024-11-11 21:53:17

6666666666666

页: [1]

's Archiver

GPT-SoVITS beta1.30，一分钟复刻声音，支持中日英，国人自研低成本AI音色克隆软件