Skip to content

【脱离复杂的环境配置和整合包,极简配置推理服务】从GPT-SoVITS项目里面提取出来的,纯粹的推理服务方案。

License

Notifications You must be signed in to change notification settings

chenguo5-tal/GPT-SoVITS-Server

This branch is up to date with ben0oil1/GPT-SoVITS-Server:main.

Folders and files

NameName
Last commit message
Last commit date
Mar 7, 2024
Mar 7, 2024
Mar 7, 2024
Mar 7, 2024
Feb 21, 2024
Mar 7, 2024
Mar 14, 2024
Apr 9, 2024
Mar 7, 2024
Mar 5, 2024
Apr 9, 2024
Apr 9, 2024
Mar 7, 2024

Repository files navigation

GPT-SoVITS-Server

我在一台realme手机上运行了这个项目!

如果是ubuntu上进行推理的话,你也可以看这里

这个项目的意义在于,如果你是一个应用者,可以完全舍弃源项目! 不需要复杂的环境搭建,不需要下载特别庞大的整合包,只需要这个几M的小项目,把训练好的模型用起来即可。 我在一台手机上尝试完成的服务器的部署,这个最能说明问题。

下面的废话基本没有必要看


GPT-SoVITS项目是一个目前为止最优秀的语音克隆项目。 很多朋友使用云端的模型训练工具完成声音克隆的模型训练,推理合成的时候,其实不需要把完整的项目都克隆到本地,其实只需要从云端下载好模型文件,然后丢在本地或者服务器上即可。 训练模型对于算力要求很高,但是推理合成其实可以用CPU也行——绝大多数的服务器其实都是CPU计算,GPU服务器太贵了。

自身也懒得在很复杂的文件体系中做配置,索性从源项目提取出来了这个项目,核心内容在server.py里面,大家可以修改里面的配置,然后使用即可。

这个版本删除了日语和英语,纯粹的中文。

系统环境:

依赖

pretrained_models下载地址:https://huggingface.co/lj1995/GPT-SoVITS/tree/main 把:chinese-hubert-base ,chinese-roberta-wwm-ext-large下载后丢到本地,记得修改server.py里面的路径即可。

windows

  • 我在本地使用的是源项目提供的windows的runtime运行时环境,所以已经装好了依赖,如果有使用相同环境的,直接使用../runtime/python.exe ./server.py即可。
  • 切记下载ffmpeg.exe放在server.py同级目录;本项目已包含,linux下不需要,删除该文件即可
  • server.py里面clean_path函数一定要看注释,修改一下;

云服务器 或者 自己的安卓手机

看文章开始的提示,直接看这里

优化方向

  • 代码的结构重新规整
  • 把原来项目中的日语、英语部分重新融合进来
  • 代码规范化实现
  • 对Windows和Linux的兼容性代码做优化
  • 优化代码的运行速度
  • 把Windows部分的运行时完整提取出来,后期可以考虑用GUI进行一下封装
  • 封装一个docker

做好Windows的GUI和云服务器的部署之后,大家可以在云端训练模型,完了用CPU在云端或者本地电脑进行推理,而不需要再去仔细琢磨完整的项目,对新手或者是应用型选手更加友好便捷。

About

【脱离复杂的环境配置和整合包,极简配置推理服务】从GPT-SoVITS项目里面提取出来的,纯粹的推理服务方案。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%