1. 什么是Mirror Chat？

Mirror Chat 是一个 AI 驱动的音频对话系统。该系统实现一个后端模型 API：请求方输入语言选择（支持中/英）和音频，API返回AI生成的回答音频，该音频克隆了请求方音频的发音人音色。

2. 系统架构

3. 安装方法

环境：Ubuntu 22.04，显存8G以上

各个组件以 API 的形式独立运行（可以运行在不同服务器中），可以在同一局域网中调用，也可以通过内网穿透的方式调用。

3.1. WeNet

参考 WeNet 的 Github 页面

克隆仓库

在MirrorChat目录下：

cd dependencies
git clone https://github.com/wenet-e2e/wenet.git

创建 Conda 环境

conda create -n wenet python=3.10
conda activate wenet

安装 CUDA，建议 12.1 版本以上

安装 torch 和 torchaudio，以及其他依赖包

pip install torch==2.2.2+cu121 torchaudio==2.2.2+cu121 -f https://download.pytorch.org/whl/torch_stable.html
pip install -r requirements.txt
pre-commit install  # for clean and tidy code

（可选）构建部署

# runtime build requires cmake 3.14 or above
cd runtime/libtorch
mkdir build && cd build && cmake -DGRAPH_TOOLS=ON .. && cmake --build .

运行

在 MirrorChat 目录下：
```
cd api/wenet
bash run_wenet.sh
```

3.2. xTTS

参考 xTTS 的 Github 页面

克隆仓库

在MirrorChat目录下：

cd dependencies
git clone https://github.com/coqui-ai/TTS

创建 Conda 环境

conda create -n xtts python=3.10
conda activate xtts

安装依赖包
```
pip install TTS
pip install -e .
```
运行

在 MirrorChat 目录下：
```
cd api/xtts
bash run_xtts.sh
```

当显存充足时，可以编辑 run_xtts.sh 在不同端口开启多个服务，并在 3.3. 问答TTS 的 main.py 文件中对应修改调用接口，可以提高并行度，提高响应效率。

3.3. 问答TTS

将上述模型运行起来后，在 MirrorChat 目录下：
```
cd api/tts
```

创建ChatGPT API的配置文件 chatgpt_api_config.py

touch chatgpt_api_config.py
vim chatgpt_api_config.py

并将 ChatGPT API 的配置以以下形式写入（支持多个 API，默认使用第1个 API，当前面的 API 无法使用，会自动使用后面的 API）：

chatgpt_apis = [
    {
        'url': "https://api.openai.com/v1/chat/completions",
        'key': "sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
    },
]

运行

在 MirrorChat/api/tts 目录下：
```
bash run_tts.sh
```

3.4. 对外接口

进入 MirrorChat/api/service 目录，运行对外接口服务

cd api/service
bash run_service.sh

3.5. 调用方法

你可以使用类似下面 python 代码的方式调用该接口：

import requests

def test_process_audio(api_url, audio_file_path, language):
    # api_url (str)：部署服务 API 的 URL
    # audio_file_path (str)：本地的提问音频文件地址
    # language (str)：支持 chinese 和 english
    url = f"{api_url}/process_audio"
    files = {'audio': open(audio_file_path, 'rb')}
    data = {'language': language}
    response = requests.post(url, files=files, data=data)
    
    if response.status_code == 200:
        output_audio_path = 'response_audio.wav'
        with open(output_audio_path, 'wb') as f:
            f.write(response.content)
        print(f"Response audio saved to {output_audio_path}")
    else:
        print(f"Error: {response.status_code}")
        print(response.json())

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
api		api
dependencies		dependencies
images		images
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

1. 什么是Mirror Chat？

2. 系统架构

3. 安装方法

3.1. WeNet

3.2. xTTS

3.3. 问答TTS

3.4. 对外接口

3.5. 调用方法

About

Releases

Packages

Contributors 2

Languages

typingbugs/MirrorChat

Folders and files

Latest commit

History

Repository files navigation

1. 什么是Mirror Chat？

2. 系统架构

3. 安装方法

3.1. WeNet

3.2. xTTS

3.3. 问答TTS

3.4. 对外接口

3.5. 调用方法

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages