-
Notifications
You must be signed in to change notification settings - Fork 1.9k
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
- Loading branch information
Showing
24 changed files
with
908 additions
and
25 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,122 @@ | ||
## 개발자용 | ||
|
||
[English](/README_dev_en.md) [Korean](/README_dev_ko.md) | ||
|
||
## 전제 | ||
|
||
- Linux(ubuntu, debian) or WSL2, (다른 리눅스 배포판과 Mac에서는 테스트하지 않았습니다) | ||
- Anaconda | ||
|
||
## 준비 | ||
|
||
1. Anaconda 가상 환경을 작성한다 | ||
|
||
``` | ||
$ conda create -n vcclient-dev python=3.10 | ||
$ conda activate vcclient-dev | ||
``` | ||
|
||
2. 리포지토리를 클론한다 | ||
|
||
``` | ||
$ git clone https://github.com/w-okada/voice-changer.git | ||
``` | ||
|
||
## 서버 개발자용 | ||
|
||
1. 모듈을 설치한다 | ||
|
||
``` | ||
$ cd voice-changer/server | ||
$ pip install -r requirements.txt | ||
``` | ||
|
||
2. 서버를 구동한다 | ||
|
||
다음 명령어로 구동합니다. 여러 가중치에 대한 경로는 환경에 맞게 변경하세요. | ||
|
||
``` | ||
$ python3 MMVCServerSIO.py -p 18888 --https true \ | ||
--content_vec_500 pretrain/checkpoint_best_legacy_500.pt \ | ||
--content_vec_500_onnx pretrain/content_vec_500.onnx \ | ||
--content_vec_500_onnx_on true \ | ||
--hubert_base pretrain/hubert_base.pt \ | ||
--hubert_base_jp pretrain/rinna_hubert_base_jp.pt \ | ||
--hubert_soft pretrain/hubert/hubert-soft-0d54a1f4.pt \ | ||
--nsf_hifigan pretrain/nsf_hifigan/model \ | ||
--crepe_onnx_full pretrain/crepe_onnx_full.onnx \ | ||
--crepe_onnx_tiny pretrain/crepe_onnx_tiny.onnx \ | ||
--rmvpe pretrain/rmvpe.pt \ | ||
--model_dir model_dir \ | ||
--samples samples.json | ||
``` | ||
|
||
브라우저(Chrome에서만 지원)에서 접속하면 화면이 나옵니다. | ||
|
||
2-1. 문제 해결법 | ||
|
||
(1) OSError: PortAudio library not found | ||
다음과 같은 메시지가 나올 경우에는 추가 라이브러리를 설치해야 합니다. | ||
|
||
``` | ||
OSError: PortAudio library not found | ||
``` | ||
|
||
ubuntu(wsl2)인 경우에는 아래 명령어로 설치할 수 있습니다. | ||
|
||
``` | ||
$ sudo apt-get install libportaudio2 | ||
$ sudo apt-get install libasound-dev | ||
``` | ||
|
||
(2) 서버 구동이 안 되는데요?! | ||
|
||
클라이언트는 자동으로 구동되지 않습니다. 브라우저를 실행하고 콘솔에 표시된 URL로 접속하세요. | ||
|
||
(3) Could not load library libcudnn_cnn_infer.so.8 | ||
WSL를 사용 중이라면 `Could not load library libcudnn_cnn_infer.so.8. Error: libcuda.so: cannot open shared object file: No such file or directory`라는 메시지가 나오는 경우가 있습니다. | ||
잘못된 경로가 원인인 경우가 많습니다. 아래와 같이 경로를 바꾸고 실행해 보세요. | ||
.bashrc 등 구동 스크립트에 추가해 두면 편리합니다. | ||
|
||
``` | ||
export LD_LIBRARY_PATH=/usr/lib/wsl/lib:$LD_LIBRARY_PATH | ||
``` | ||
|
||
- 참고 | ||
- https://qiita.com/cacaoMath/items/811146342946cdde5b83 | ||
- https://github.com/microsoft/WSL/issues/8587 | ||
|
||
3. 개발하세요 | ||
|
||
### Appendix | ||
|
||
1. Win + Anaconda일 때 (not supported) | ||
|
||
pytorch를 conda가 없으면 gpu를 인식하지 않을 수 있습니다. | ||
|
||
``` | ||
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia | ||
``` | ||
|
||
또한 추가로 아래 내용도 필요합니다. | ||
|
||
``` | ||
pip install chardet | ||
pip install numpy==1.24.0 | ||
``` | ||
|
||
## 클라이언트 개발자용 | ||
|
||
1. 모듈을 설치하고 한번 빌드합니다 | ||
|
||
``` | ||
cd client | ||
cd lib | ||
npm install | ||
npm run build:dev | ||
cd ../demo | ||
npm install | ||
npm run build:dev | ||
``` | ||
|
||
2. 개발하세요 |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,193 @@ | ||
## VC Client | ||
|
||
[English](/README_en.md) [Korean](/README_ko.md) | ||
|
||
## 새로운 기능! | ||
- v.1.5.3.15 | ||
- Improve: | ||
- new rmvpe checkpoint for rvc (torch, onnx) | ||
- Mac: upgrade torch version 2.1.0 | ||
|
||
- v.1.5.3.14 | ||
- Improve: | ||
- onnx performance (need to be converted) | ||
- Some fixes: | ||
- change default f0 det to onnx_rmvpe | ||
- disable unrecommnded f0 det on direct ml | ||
- Experimental | ||
- Add 16k RVC Sample (experimental) | ||
|
||
|
||
|
||
# VC Client란 | ||
1. 각종 음성 변환 AI(VC, Voice Conversion)를 활용해 실시간 음성 변환을 하기 위한 클라이언트 소프트웨어입니다. 지원하는 음성 변환 AI는 다음과 같습니다. | ||
|
||
- 지원하는 음성 변환 AI (지원 VC) | ||
- [MMVC](https://github.com/isletennos/MMVC_Trainer) | ||
- [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | ||
- [RVC(Retrieval-based-Voice-Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI) | ||
- [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | ||
|
||
2. 이 소프트웨어는 네트워크를 통한 사용도 가능하며, 게임 등 부하가 큰 애플리케이션과 동시에 사용할 경우 음성 변화 처리의 부하를 외부로 돌릴 수도 있습니다. | ||
|
||
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png) | ||
|
||
3. 여러 플랫폼을 지원합니다. | ||
|
||
- Windows, Mac(M1), Linux, Google Colab (MMVC만 지원) | ||
|
||
# 사용 방법 | ||
|
||
크게 두 가지 방법으로 사용할 수 있습니다. 난이도 순서는 다음과 같습니다. | ||
|
||
- 사전 빌드된 Binary 사용 | ||
- Docker, Anaconda 등으로 구축된 개발 환경에서 사용 | ||
|
||
이 소프트웨어나 MMVC에 익숙하지 않은 분들은 위에서부터 차근차근 익숙해지길 추천합니다. | ||
|
||
## (1) 사전 빌드된 Binary(파일) 사용 | ||
|
||
- 실행 형식 바이너리를 다운로드하여 실행할 수 있습니다. | ||
|
||
- 튜토리얼은 [이곳](tutorials/tutorial_rvc_ko_latest.md)을 확인하세요。([네트워크 문제 해결법](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ko.md)) | ||
|
||
- [Google Colaboratory](https://github.com/w-okada/voice-changer/blob/master/Realtime_Voice_Changer_on_Colab.ipynb) で簡単にお試しいただけるようになりました。左上の Open in Colab のボタンから起動できます。 | ||
|
||
<img src="https://github.com/w-okada/voice-changer/assets/48346627/3f092e2d-6834-42f6-bbfd-7d389111604e" width="400" height="150"> | ||
|
||
- Windows 버전과 Mac 버전을 제공하고 있습니다. | ||
|
||
- Windows와 NVIDIA GPU를 사용하는 분은 ONNX(cpu, cuda), PyTorch(cpu, cuda)를 다운로드하세요. | ||
- Windows와 AMD/Intel GPU를 사용하는 분은 ONNX(cpu, DirectML), PyTorch(cpu, cuda)를 다운로드하세요 AMD/Intel GPU는 ONNX 모델을 사용할 때만 적용됩니다. | ||
- 그 외 GPU도 PyTorch, Onnxruntime가 지원할 경우에만 적용됩니다. | ||
- Windows에서 GPU를 사용하지 않는 분은 ONNX(cpu, cuda), PyTorch(cpu, cuda)를 다운로드하세요. | ||
|
||
- Windows 버전은 다운로드한 zip 파일의 압축을 풀고 `start_http.bat`를 실행하세요. | ||
|
||
- Mac 버전은 다운로드한 파일을 풀고 `startHttp.command`를 실행하세요. 확인되지 않은 개발자 메시지가 나오면 다시 control 키를 누르고 클릭해 실행하세요(or 오른쪽 클릭으로 실행하세요). | ||
|
||
- 처음 실행할 때는 인터넷으로 여러 데이터를 다운로드합니다. 다운로드할 때 시간이 좀 걸릴 수 있습니다. 다운로드가 완료되면 브라우저가 실행됩니다. | ||
|
||
- 원격으로 접속할 때는 http 대신 https `.bat` 파일(win)、`.command` 파일(mac)을 실행하세요. | ||
|
||
- DDPS-SVC의 encoder는 hubert-soft만 지원합니다. | ||
|
||
- 다운로드는 아래에서 하세요. | ||
|
||
| Version | OS | 프레임워크 | 링크 | 지원 VC | 파일 크기 | | ||
| ---------- | --- | ------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------- | ------ | | ||
| v.1.5.3.15 | mac | ONNX(cpu), PyTorch(cpu,mps) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB | | ||
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC | 3240MB | | ||
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC | 3125MB | | ||
| v.1.5.3.14 | mac | ONNX(cpu), PyTorch(cpu,mps) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB | | ||
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC | 3240MB | | ||
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC | 3125MB | | ||
|
||
(\*1) Google Drive에서 다운로드가 안 되는 분은 [hugging_face](https://huggingface.co/wok000/vcclient000/tree/main)에서 시도해 보세요 | ||
(\*2) 개발자가 AMD 그래픽카드를 갖고 있지 않아서 작동 확인을 할 수 없습니다. onnxruntime-directml를 같이 첨부한 것이 전부입니다. | ||
(\*3) 압축 해제나 실행 속도가 느릴 경우에는 바이러스 검사가 진행 중일 가능성이 있습니다. 파일과 폴더를 검사 대상 제외를 한 후에 시도해 보세요. (이에 개발자는 책임이 없음) | ||
|
||
## (2) Docker나 Anaconda 등으로 구축된 개발 환경에서 사용 | ||
|
||
이 리포지토리를 클론해 사용할 수 있습니다. Windows에서는 WSL2 환경 구축이 필수입니다. 또한, WSL2 상에 Docker나 Anaconda 등의 가상환경 구축이 필요합니다. Mac에서는 Anaconda 등의 Python 가상환경 구축이 필요합니다. 사전 준비가 필요하지만, 많은 환경에서 이 방법이 가장 빠르게 작동합니다. **<font color="red"> GPU가 없어도 나름 최근 출시된 CPU가 있다면 충분히 작동할 가능성이 있습니다</font>(아래 실시간성 항목 참조)**. | ||
|
||
[WSL2와 Docker 설치 설명 영상](https://youtu.be/POo_Cg0eFMU) | ||
|
||
[WSL2와 Anaconda 설치 설명 영상](https://youtu.be/fba9Zhsukqw) | ||
|
||
Docker에서 실행은 [Docker를 사용](docker_vcclient/README_ko.md)을 참고해 서버를 구동하세요. | ||
|
||
Anaconda 가상 환경에서 실행은 [서버 개발자용 문서](README_dev_ko.md)를 참고해 서버를 구동하세요. | ||
|
||
# 문제 해결법 | ||
|
||
- [통신편](tutorials/trouble_shoot_communication_ko.md) | ||
|
||
# 실시간성(MMVC) | ||
|
||
GPU를 사용하면 시간 차가 거의 없이 변환할 수 있습니다. | ||
|
||
https://twitter.com/DannadoriYellow/status/1613483372579545088?s=20&t=7CLD79h1F3dfKiTb7M8RUQ | ||
|
||
CPU도 최근 제품이라면 어느 정도 빠르게 변환할 수 있습니다. | ||
|
||
https://twitter.com/DannadoriYellow/status/1613553862773997569?s=20&t=7CLD79h1F3dfKiTb7M8RUQ | ||
|
||
오래된 CPU(i7-4770)면, 1000msec 정도 걸립니다. | ||
|
||
# 개발자 서명에 대하여 | ||
|
||
이 소프트웨어는 개발자 서명이 없습니다. 本ソフトウェアは開発元の署名しておりません。下記のように警告が出ますが、コントロールキーを押しながらアイコンをクリックすると実行できるようになります。これは Apple のセキュリティポリシーによるものです。実行は自己責任となります。 | ||
|
||
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png) | ||
(이미지 번역: ctrl을 누른 채로 클릭) | ||
|
||
# 감사의 말 | ||
|
||
- [立ちずんだもん素材](https://seiga.nicovideo.jp/seiga/im10792934) | ||
- [いらすとや](https://www.irasutoya.com/) | ||
- [つくよみちゃん](https://tyc.rei-yumesaki.net/) | ||
|
||
``` | ||
이 소프트웨어의 음성 합성에는 무료 소재 캐릭터 「つくよみちゃん(츠쿠요미 짱)」이 무료 공개하고 있는 음성 데이터를 사용했습니다.■츠쿠요미 짱 말뭉치(CV.夢前黎) | ||
https://tyc.rei-yumesaki.net/material/corpus/ | ||
© Rei Yumesaki | ||
``` | ||
|
||
- [あみたろの声素材工房](https://amitaro.net/) | ||
- [れぷりかどーる](https://kikyohiroto1227.wixsite.com/kikoto-utau) | ||
|
||
# 이용약관 | ||
|
||
- 실시간 음성 변환기 츠쿠요미 짱은 츠쿠요미 짱 말뭉치 이용약관에 따라 다음과 같은 목적으로 변환 후 음성을 사용하는 것을 금지합니다. | ||
|
||
``` | ||
■사람을 비판·공격하는 행위. ("비판·공격"의 정의는 츠쿠요미 짱 캐릭터 라이센스에 준합니다) | ||
■특정 정치적 입장·종교·사상에 대한 찬반을 논하는 행위. | ||
■자극적인 표현물을 무분별하게 공개하는 행위. | ||
■타인에게 2차 창작(소재로서의 활용)을 허가하는 형태로 공개하는 행위. | ||
※감상용 작품으로서 배포·판매하는 건 문제없습니다. | ||
``` | ||
|
||
- 실시간 음성 변환기 아미타로는 あみたろの声素材工房(아미타로의 음성 소재 공방)의 다음 이용약관에 따릅니다. 자세한 내용은 [이곳](https://amitaro.net/voice/faq/#index_id6)에 있습니다. | ||
|
||
``` | ||
아미타로의 음성 소재나 말뭉치 음성으로 음성 모델을 만들거나, 음성 변환기나 말투 변환기 등을 사용해 본인 목소리를 아미타로의 목소리로 변환해 사용하는 것도 괜찮습니다. | ||
단, 그 경우에는 반드시 아미타로(혹은 코하루네 아미)의 음성으로 변환한 것을 명시하고, 아미타로(및 코하루네 아미)가 말하는 것이 아님을 누구나 알 수 있도록 하십시오. | ||
또한 아미타로의 음성으로 말하는 내용은 음성 소재 이용약관의 범위 내에서만 사용해야 하며, 민감한 발언은 삼가십시오. | ||
``` | ||
|
||
- 실시간 음성 변환기 키코토 마히로는 れぷりかどーる(레플리카 돌)의 이용약관에 따릅니다. 자세한 내용은 [이곳](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)에 있습니다. | ||
|
||
# 면책 사항 | ||
|
||
이 소프트웨어의 사용 또는 사용 불능으로 인해 발생한 직접 손해·간접 손해·파생적 손해·결과적 손해 또는 특별 손해에 대해 모든 책임을 지지 않습니다. | ||
|
||
# (1) 레코더(트레이닝용 음성 녹음 앱) | ||
|
||
MMVC 트레이닝용 음성을 간단하게 녹음할 수 있는 앱입니다. | ||
Github Pages에서 실행할 수 있어서 브라우저만 있으면 다양한 플랫폼에서 사용할 수 있습니다. | ||
녹음한 데이터는 브라우저에 저장됩니다. 외부로 유출되지 않습니다. | ||
|
||
[녹음 앱 on Github Pages](https://w-okada.github.io/voice-changer/) | ||
|
||
[설명 영상](https://youtu.be/s_GirFEGvaA) | ||
|
||
# 이전 버전 | ||
|
||
| Version | OS | 프레임워크 | link | 지원 VC | 파일 크기 | | ||
| ---------- | --- | --------------------------------- | ---------------------------------------------------------------------------------------------- | ----------------------------------------------------------------------------- | ------ | | ||
| v.1.5.2.9e | mac | ONNX(cpu), PyTorch(cpu,mps) | [normal](https://drive.google.com/uc?id=1W0d7I7619PcO7kjb1SPXp6MmH5Unvd78&export=download) \*1 | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 796MB | | ||
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [normal](https://drive.google.com/uc?id=1tmTMJRRggS2Sb4goU-eHlRvUBR88RZDl&export=download) \*1 | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, so-vits-svc 4.0v2, RVC, DDSP-SVC | 2872MB | | ||
| v.1.5.3.1 | mac | ONNX(cpu), PyTorch(cpu,mps) | [normal](https://drive.google.com/uc?id=1oswF72q_cQQeXhIn6W275qLnoBAmcrR_&export=download) \*1 | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 796MB | | ||
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [normal](https://drive.google.com/uc?id=1AWjDhW4w2Uljp1-9P8YUJBZsIlnhkJX2&export=download) \*1 | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, so-vits-svc 4.0v2, RVC, DDSP-SVC | 2872MB | | ||
|
||
# For Contributor | ||
|
||
이 리포지토리는 [CLA](https://raw.githubusercontent.com/w-okada/voice-changer/master/LICENSE-CLA)를 설정했습니다. |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -1,6 +1,6 @@ | ||
## VC Client for Docker | ||
|
||
[English](./README_en.md) | ||
[English](./README_en.md) [Korean](./README_ko.md) | ||
|
||
## ビルド | ||
|
||
|
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -1,6 +1,7 @@ | ||
## VC Client for Docker | ||
|
||
[Japanese](./README.md) | ||
[Japanese](./README.md) | ||
[Korean](./README.md) | ||
|
||
## Build | ||
|
||
|
Oops, something went wrong.