Skip to content

Commit

Permalink
Merge pull request #976 from qlife1146/master
Browse files Browse the repository at this point in the history
韓国語翻訳追加
  • Loading branch information
w-okada authored Nov 2, 2023
2 parents 59c80ca + 23be190 commit a3160c1
Show file tree
Hide file tree
Showing 15 changed files with 529 additions and 18 deletions.
2 changes: 1 addition & 1 deletion tutorials/trouble_shoot_communication_ja.md
Original file line number Diff line number Diff line change
Expand Up @@ -48,4 +48,4 @@ AudioOutput の output record を start させた状態で音声変換を開始
#### マイク入力の確認

マイク入力自体に問題がある可能性があります。録音ソフトなどを用いてマイク入力を確認してみてください。
また、[こちらの録音サイト](https://w-okada.github.io/voice-changer/)VCClient の姉妹品であり、ほぼ同等のマイク入力処理が行われているため参考になります。(インストール不要。ブラウザのみで動きます。)
また、[こちらの録音サイト](https://w-okada.github.io/voice-changer/)VC Client の姉妹品であり、ほぼ同等のマイク入力処理が行われているため参考になります。(インストール不要。ブラウザのみで動きます。)
51 changes: 51 additions & 0 deletions tutorials/trouble_shoot_communication_ko.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,51 @@
## 문제 해결법 통신편

음성이 전혀 변환되지 않는 경우나 변환 후 음성이 이상하게 될 경우에는 음성 변환 과정에서 문제점을 찾아야 합니다.

이 문서에서는 어떤 부분에서 문제가 발생하는지 대략적으로 찾을 수 있는 방법에 대한 설명입니다.

## VC Client의 구성과 문제 구분

<img src="https://user-images.githubusercontent.com/48346627/235551041-6eed4035-5542-47d1-bbd3-31fa7842011b.png" width="720">

VC Client는 이미지 자료처럼 GUI(클라이언트)가 마이크를 통해 음성을 받고, 서버에서 변환하는 구성을 하고 있습니다.

VC Client는 이미지 자료 음성이 세 곳에서 어떤 상태인지 확인할 수 있습니다.
정상 상태로 음성이 녹음됐다면 이 과정까지는 처리가 잘 된 것이고, 이후부터 문제를 찾으면 됩니다(문제 구분이라고 합니다).

## 음성의 상태 확인 방법

### (1)(2)로 음성 상태 확인

<img src="https://github.com/w-okada/voice-changer/assets/48346627/f4845f1d-2e1a-49c1-a226-0e50be807f2d" width="720">

Analyzer의 Sampling을 시작한 상태에서 음성 변환을 시도해 보세요. 어느 정도 음성을 입력 후에 Samplling을 정지하면 in/out에 재생 버튼이 표시됩니다.

- in에는 앞서 설명한 이미지 자료(1)에 음성이 녹음되어 있습니다. 마이크로 입력된 음성이 그대로 서버에 녹음될 테니 사용자의 음성이 녹음됐다면 정상입니다.
- out에는 앞서 설명한 이미지 자료(2)에 음성이 녹음되어 있습니다. AI를 통해 변환된 음성이 녹음되어 있을 겁니다.

### (3)으로 음성 상태 확인

<img src="https://github.com/w-okada/voice-changer/assets/48346627/18ddfc2c-beb2-4e7a-8a06-1e00cc6ddb72" width="720">

Audio Output의 output record를 시작한 상태로 음성 변환을 시도해 보세요. 어느 정도 음성을 입력한 후에 정리하면 .wav 파일이 다운로드됩니다. 이 .wav 파일은 서버에서 전송된 변환 후의 음성이 녹음되어있을 겁니다.

## 음성 상태 확인 후

앞서 설명한 이미지 자료의 (1)~(3) 중에서 예상한 상태의 녹음 음성이 어디까지 진행됐나 파악했다면, 예상한 상태의 음성이 녹음된 곳 이후에도 문제가 없는지 검토하세요.

### (1)에서의 음성 상태가 이상한 경우

#### 음성 파일로 확인

음성 파일로 변환이 되는지 확인하세요.

예를 들어, 다음 파일을 사용해 보세요.

- [sample_jvs001](https://drive.google.com/file/d/142aj-qFJOhoteWKqgRzvNoq02JbZIsaG/view) from [JVS](https://sites.google.com/site/shinnosuketakamichi/research-topics/jvs_corpus)
- [sample_jvs001](https://drive.google.com/file/d/1iCErRzCt5-6ftALcic9w5zXWrzVXryIA/view) from [JVS-MuSiC](https://sites.google.com/site/shinnosuketakamichi/research-topics/jvs_music)

#### 마이크 입력 확인

마이크 입력 자체에 문제가 있을 가능성이 있습니다. 녹음 프로그램 등을 사용해 마이크 입력을 확인하세요.
또한 [이 녹음 사이트](https://w-okada.github.io/voice-changer/)는 VC Client의 자매품으로 마이크 입력 처리가 거의 동일하게 이루어져 참고할 만합니다. (설치 필요 없음. 브라우저에서만 동작합니다.)
File renamed without changes.
39 changes: 39 additions & 0 deletions tutorials/tutorial_device_mode_ko.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,39 @@
## Device Mode 튜토리얼

Device Mode에 대한 설명입니다.

[설명 영상](https://youtu.be/SUnRGCJ92K8?t=99)

## v.1.5.2.9 이전의 구성(client device mode)

v.1.5.2.9 이전에는 브라우저가 제어하는 마이크와 스피커를 사용해 음성 변환을 진행했습니다.
이것을 client device mode라 부릅니다(빨간 화살표).

![image](https://github.com/w-okada/voice-changer/assets/48346627/56c0766c-45c1-4b3d-af66-73443c232807)

## v.1.5.2.9 이후의 구성(client device mode / server device mode)

v.1.5.2.9부터 PC에 접속된 마이크와 스피커를 직접 VC Client에서 제어해 음성 변환을 진행하는 모드를 추가했습니다. 이것을 server device mode라 부릅니다(파란 화살표)。

![image](https://github.com/w-okada/voice-changer/assets/48346627/34c92e36-0662-4eeb-aac5-30cd1f4a5cd8)

## client device mode / server device mode의 장점과 단점

v.1.5.2.9 이후에는 client device mode와 server device mode 중에서 사용할 것을 선택할 수 있게 됐습니다.

- client device mode
- 장점
1. Chrome이 마이크/스피커의 어려운 처리를 대신해 준다.
2. 잡음 제거 등의 Chrome이 가진 Web 회의 기능을 사용할 수 있다.
- 단점
1. 다소 지연이 발생할 수 있다.
- server device mode
- 장점
1. VC Client가 직접 마이크/스피커를 다뤄서 지연이 적다.
- 단점
1. 다룰 수 없는 마이크/스피커가 있을 수 있다.
2. 잡음 제거 등 Chrome의 편리한 기능을 사용할 수 없다.

![image](https://github.com/w-okada/voice-changer/assets/48346627/fef1ee63-e853-4867-b4c8-bf0121495bb6)

사용자는 각 장점·단점을 고려해 구분하여 사용할 수 있습니다.
2 changes: 1 addition & 1 deletion tutorials/tutorial_monitor_consept_ja.md
Original file line number Diff line number Diff line change
Expand Up @@ -10,7 +10,7 @@ v.1.5.3.7 から追加された server device mode における monitor output

## v.1.5.3.7 以降の構成

v.1.5.3.7 では、VCClient の server device mode でもう一つ出力先デバイスを設定できるようになりました(赤線)。これにより、モニター用には Voicemeeter を経由せずに直接 wasapi デバイスや asio デバイスに出力できるようになり、遅延が少ないモニタリングが可能になります。
v.1.5.3.7 では、VC Client の server device mode でもう一つ出力先デバイスを設定できるようになりました(赤線)。これにより、モニター用には Voicemeeter を経由せずに直接 wasapi デバイスや asio デバイスに出力できるようになり、遅延が少ないモニタリングが可能になります。

![image](https://github.com/w-okada/voice-changer/assets/48346627/1d5065eb-b042-4521-ade3-66828c87a712)

Expand Down
48 changes: 48 additions & 0 deletions tutorials/tutorial_monitor_consept_ko.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,48 @@
## 모니터링 튜토리얼

v.1.5.3.7부터 추가된 server device mode의 monitor output에 대한 설명입니다.

## v.1.5.3.6 이전의 구성

출력 대상 장치를 하나만 설정할 수 있었습니다. Discord나 Zoom 등 다른 애플리케이션에서 사용하기 위해서는 일반적으로 출력을 Voicemeeter와 같은 가상 오디오 장치 설정을 해야 할 필요가 있었습니다. 그로 인해 변환 후 음성을 확인하려면 가상 오디오 장치를 통해 확인해야 하는 등의 많은 수고가 필요했습니다(파란 화살표).

![image](https://github.com/w-okada/voice-changer/assets/48346627/faba8fdf-cfa5-468f-a56b-3fa986fb45a1)

## v.1.5.3.7 이후의 구성

v.1.5.3.7에서는 VC Client의 server device mode에서 출력 대상 장치를 하나 더 설정할 수 있게 됐습니다(빨간 화살표). 이를 통해 모니터링용으로 Voicemeeter를 거치지 않고 직접 wasapi 장치나 asio 장치로 출력할 수 있게 되어 지연이 적은 모니터링이 가능해졌습니다.

![image](https://github.com/w-okada/voice-changer/assets/48346627/1d5065eb-b042-4521-ade3-66828c87a712)

## 사용 방법

장치 설정 구역에서 server device mode를 선택하세요. 샘플링 레이트(S.R.), input, output, monitor를 설정할 수 있게 됩니다.

![image](https://github.com/w-okada/voice-changer/assets/48346627/c15e6800-75ec-410b-87f2-c96d0c697c91)

## 주의 사항

server device mode에서 사용하는 input, output, monitor 각 장치의 샘플링 레이트는 일치해야 합니다. 일치하지 않을 경우에는 콘솔에 자세한 정보가 표시되므로 GUI에서 각 장치가 지원하는 샘플링 레이트를 지정하세요.

### 예시

![image](https://github.com/w-okada/voice-changer/assets/48346627/d621d356-5710-4766-932e-43b7d520df5f)

샘플링 레이트가 일치하지 않으면 위와 같이 표시됩니다.

(1)는 현재 GUI에서 장치에 지정된 샘플링 레이트 지원 여부를 표시합니다. False인 장치는 지원하지 않습니다.

(2)에서 각 장치에서 지원하는 샘플링 레이트를 표시합니다. input, output, monitor 전부 지원하는 샘플링 레이트를 지정하세요. 예시에서는 48000으로 지정했습니다.

##

### 첫 번째

사용 환경에 따라 크게 달라지겠지만, 개발자 환경에서는 input, monitor를 wasapi 장치로 output을 임의로 설정해 상당히 낮은 지연으로 사용할 수 있었습니다.
(RTX 4090 사용)

### 두 번째

Wasapi의 샘플링 레이트는 장치에서 설정한 것만 선택할 수 있습니다. 이 설정은 Windows 사운드 설정에서 변경할 수 있습니다.(Win11)

![image](https://github.com/w-okada/voice-changer/assets/48346627/300c8cf0-cb7d-4f24-8253-fa313caee5df)
2 changes: 1 addition & 1 deletion tutorials/tutorial_rvc_en_1_5_3_1.md
Original file line number Diff line number Diff line change
Expand Up @@ -233,7 +233,7 @@ If you have 2 or more GPUs, you can choose your GPU here.

Choose between client device mode and server device mode. You can only change it when the voice conversion is stopped.

For more details on each mode, please see [here](./tutorial_device_mode.md).
For more details on each mode, please see [here](./tutorial_device_mode_ja.md).

### Audio Input

Expand Down
2 changes: 1 addition & 1 deletion tutorials/tutorial_rvc_en_1_5_3_3.md
Original file line number Diff line number Diff line change
Expand Up @@ -226,7 +226,7 @@ If you have 2 or more GPUs, you can choose your GPU here.

Choose between client device mode and server device mode. You can only change it when the voice conversion is stopped.

For more details on each mode, please see [here](./tutorial_device_mode.md).
For more details on each mode, please see [here](./tutorial_device_mode_ja.md).

### Audio Input

Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -238,10 +238,10 @@ In the onnxdirectML version, you can switch the GPU ON/OFF.

#### AUDIO

Choose the type of audio device you want to use. For more information, please refer to the [document](./tutorial_device_mode.md).
Choose the type of audio device you want to use. For more information, please refer to the [document](./tutorial_device_mode_ja.md).

- Client: You can make use of the microphone input and speaker output with the GUI functions such as noise cancellation.
- Server: VCClient can directly control the microphone and speaker to minimize latency.
- Server: VC Client can directly control the microphone and speaker to minimize latency.

#### input

Expand Down
8 changes: 4 additions & 4 deletions tutorials/tutorial_rvc_en_latest.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
# Realtime Voice Changer Client for RVC Tutorial (v.1.5.3.13)

[Japanese/日本語](/tutorials/tutorial_rvc_ja_latest.md)
[Japanese/日本語](/tutorials/tutorial_rvc_ja_latest.md) [Korean/한국어](/tutorials/tutorial_rvc_ko_latest.md)

# Introduction

Expand Down Expand Up @@ -125,7 +125,7 @@ Icons are links.
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/7bc188db-3aae-43eb-98a1-34aacc16173d" width="32"> spanner | tools |
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/5db16acc-e901-40d2-8fc2-1fb9fd67f59c" width="32"> coffee | donation |

### claer setting
### clear setting

Initialize configuration.

Expand Down Expand Up @@ -267,10 +267,10 @@ Even if a GPU is not detected, gpu0 - gpu3 will still be displayed. If you speci

#### AUDIO

Choose the type of audio device you want to use. For more information, please refer to the [document](./tutorial_device_mode.md).
Choose the type of audio device you want to use. For more information, please refer to the [document](./tutorial_device_mode_ja.md).

- Client: You can make use of the microphone input and speaker output with the GUI functions such as noise cancellation.
- Server: VCClient can directly control the microphone and speaker to minimize latency.
- Server: VC Client can directly control the microphone and speaker to minimize latency.

#### input

Expand Down
2 changes: 1 addition & 1 deletion tutorials/tutorial_rvc_ja_1_5_3_1.md
Original file line number Diff line number Diff line change
Expand Up @@ -251,7 +251,7 @@ GPU を 2 枚以上持っている場合、ここで GPU を選べます。

client device mode と server device mode のどちらを使用するか選択します。音声変換が停止している時のみ変更できます。

それぞれのモードの詳細は[こちら](./tutorial_device_mode.md)をご覧ください。
それぞれのモードの詳細は[こちら](./tutorial_device_mode_ja.md)をご覧ください。

### AudioInput

Expand Down
2 changes: 1 addition & 1 deletion tutorials/tutorial_rvc_ja_1_5_3_3.md
Original file line number Diff line number Diff line change
Expand Up @@ -244,7 +244,7 @@ GPU を 2 枚以上持っている場合、ここで GPU を選べます。

client device mode と server device mode のどちらを使用するか選択します。音声変換が停止している時のみ変更できます。

それぞれのモードの詳細は[こちら](./tutorial_device_mode.md)をご覧ください。
それぞれのモードの詳細は[こちら](./tutorial_device_mode_ja.md)をご覧ください。

### AudioInput

Expand Down
4 changes: 2 additions & 2 deletions tutorials/tutorial_rvc_ja_1_5_3_7.md
Original file line number Diff line number Diff line change
Expand Up @@ -244,10 +244,10 @@ onnxdirectML 版では GPU の ON/OFF を切り替えることができます。

#### AUDIO

使用するオーディオデバイスのタイプを選びます。詳細は[こちらの文書](./tutorial_device_mode.md)をご確認ください。
使用するオーディオデバイスのタイプを選びます。詳細は[こちらの文書](./tutorial_device_mode_ja.md)をご確認ください。

- client: ノイズ抑制機能など GUI(chrome)の機能を活用してマイク入力、スピーカー出力を行うことができます。
- server: VCClient が直接マイクとスピーカーを操作します。遅延を抑えることができます。
- server: VC Client が直接マイクとスピーカーを操作します。遅延を抑えることができます。

#### input

Expand Down
8 changes: 4 additions & 4 deletions tutorials/tutorial_rvc_ja_latest.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
# Realtime Voice Changer Client for RVC チュートリアル(v.1.5.3.13)

[English](/tutorials/tutorial_rvc_en_latest.md)
[English](/tutorials/tutorial_rvc_en_latest.md) [Korean/한국어](/tutorials/tutorial_rvc_ko_latest.md)

# はじめに

Expand Down Expand Up @@ -126,7 +126,7 @@ A7. フォルダのパスに unicode が含まれるとエラーが出るよう
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/7bc188db-3aae-43eb-98a1-34aacc16173d" width="32"> スパナ | 各種便利ツールへのリンク |
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/5db16acc-e901-40d2-8fc2-1fb9fd67f59c" width="32"> コーヒー | 開発者へ**寄付**するためのリンク |

### claer setting
### clear setting

設定を初期化します。

Expand Down Expand Up @@ -271,10 +271,10 @@ gpu0 - gpu3 は GPU が検出されなくても表示されます。存在しな

#### AUDIO

使用するオーディオデバイスのタイプを選びます。詳細は[こちらの文書](./tutorial_device_mode.md)をご確認ください。
使用するオーディオデバイスのタイプを選びます。詳細は[こちらの文書](./tutorial_device_mode_ja.md)をご確認ください。

- client: ノイズ抑制機能など GUI(chrome)の機能を活用してマイク入力、スピーカー出力を行うことができます。
- server: VCClient が直接マイクとスピーカーを操作します。遅延を抑えることができます。
- server: VC Client が直接マイクとスピーカーを操作します。遅延を抑えることができます。

#### input

Expand Down
Loading

0 comments on commit a3160c1

Please sign in to comment.