Skip to content

Latest commit

 

History

History
119 lines (83 loc) · 9.38 KB

README_ru.md

File metadata and controls

119 lines (83 loc) · 9.38 KB

Японский Корейский Английский

Что нового!

  • Мы выпустили продукт-сестру - клиент Text To Speech.
    • Вы можете насладиться генерацией голоса через простой интерфейс.
    • Подробнее здесь.
  • Код тренировки Beatrice V2 теперь доступен!
  • v.2.0.70-beta (only for m1 mac)
    • HERE
    • new feature:
      • В версии VCClient для Mac на базе M1 теперь поддерживается Beatrice v2 beta.1.
  • v.2.0.69-beta (only for win)
    • HERE
    • Исправления ошибок:
      • Исправлена ошибка, из-за которой кнопка запуска не отображалась в случае некоторых исключений
      • Настроен выходной буфер для режима серверного устройства
      • Исправлена ошибка, при которой изменялась частота дискретизации при изменении настроек в режиме серверного устройства
      • Исправлена ошибка при использовании японского hubert
    • Прочее:
      • Добавлен фильтр API хоста (выделено) для режима серверного устройства
  • v.2.0.65-beta
    • HERE
    • new feature: We have supported Beatrice v2 beta.1, enabling even higher quality voice conversion.

Что такое VC Клиент

  1. Это клиентское ПО для выполнения преобразования голоса в реальном времени с использованием различных AI для преобразования голоса. Поддерживаемые AI:

  2. Распределение нагрузки между разными ПК Реализация преобразования голоса работает по схеме "сервер-клиент". Вы можете запустить сервер MMVC на отдельном ПК для минимизации влияния на другие ресурсоёмкие процессы, такие как стриминг.

image

  1. Кроссплатформенная совместимость Поддержка Windows, Mac (включая Apple Silicon M1), Linux и Google Colaboratory.

Как использовать

Это приложение для изменения голоса с использованием MMVC и so-vits-svc.

Есть два основных способа использования, в порядке сложности:

  • Использование готового исполняемого файла
  • Настройка окружения с Docker или Anaconda

(1) Использование готовых исполняемых файлов

  • Вы можете скачать и запустить исполняемые файлы.

  • Смотрите здесь для получения руководства. (устранение неполадок)

  • Теперь попробовать можно на Google Colaboratory (требуется аккаунт ngrok). Вы можете запустить его через кнопку "Открыть в Colab" в верхнем левом углу.

  • Мы предлагаем версии для Windows и Mac на hugging face

  • v2 для Windows

    • Пожалуйста, скачайте и используйте vcclient_win_std_xxx.zip. Преобразование голоса можно выполнять с использованием мощного процессора без GPU или с использованием DirectML для GPU (AMD, Nvidia). v2 поддерживает как torch, так и onnx.
    • Если у вас Nvidia GPU, скачайте vcclient_win_cuda_xxx.zip для более быстрого преобразования.
  • v2 для Mac (Apple Silicon)

    • Пожалуйста, скачайте и используйте vcclient_mac_xxx.zip.
  • v1

    • Для Windows с Nvidia GPU скачайте ONNX (cpu, cuda), PyTorch (cpu, cuda).
    • Для Windows с AMD/Intel GPU скачайте ONNX (cpu, DirectML) и PyTorch (cpu, cuda). AMD/Intel GPU поддерживаются только для ONNX моделей.
  • Для пользователей Windows: после распаковки zip-файла запустите соответствующий start_http.bat файл.

  • Для Mac: после распаковки zip-файла дважды щёлкните на startHttp.command. Если появится сообщение о невозможности проверки разработчика, нажмите Ctrl и повторно запустите.

  • Если подключаетесь удалённо, используйте .command (Mac) или .bat (Windows) файл с https вместо http.

  • Энкодер DDPS-SVC поддерживает только hubert-soft.

  • Скачать с hugging face

(2) Использование после настройки окружения с Docker или Anaconda

Клонируйте этот репозиторий и используйте его. Для Windows требуется настройка WSL2. Для Mac нужно настроить виртуальные среды Python, например Anaconda. Этот метод обеспечивает наивысшую скорость в большинстве случаев. Даже без GPU можно получить достаточную производительность на современном процессоре (смотрите раздел о производительности в реальном времени ниже).

Видео-инструкция по установке WSL2 и Docker

Видео-инструкция по установке WSL2 и Anaconda

Для запуска Docker смотрите start docker.

Для запуска на Anaconda venv смотрите руководство разработчика.

Для запуска на Linux с AMD GPU смотрите руководство.

Подпись программного обеспечения

Это ПО не подписано разработчиком. Появится предупреждение, но его можно запустить, нажав на иконку с удержанием клавиши Ctrl. Это связано с политикой безопасности Apple. Использование ПО на ваш риск.

image

m1_mac.mp4

Благодарности

Это ПО использует голосовые данные бесплатного материала персонажа "Цукуёми-тян", предоставленного CV. Юмесаки Рэй.

  • Корпус Цукуёми-тян (CV. Юмесаки Рэй)

https://tyc.rei-yumesaki.net/material/corpus/

Авторское право. Юмесаки Рэй, Все права защищены.