Skip to content

基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 openai api 的方式接入简单的聊天室,并可以观看不同角色的 LLM 互相交流、互怼。

License

Notifications You must be signed in to change notification settings

JimmyMa99/Roleplay-with-XiYou

Repository files navigation

Roleplay-with-XiYou 西游角色扮演

 

简介

基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。介绍视频请戳B站链接

本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 openai api 的方式接入简单的聊天室,并可以观看不同角色的 LLM 互相交流、互怼。

包括模型:三藏-Chat悟空-Chat八戒-Chat悟净-Chat

改编不是乱编,戏说不是胡说。——六小龄童(六老师)

Untitled

🎲Chatroom青春版试玩

XiYou-chatroom

Untitled

🎲单个模型速速开玩

🎲部署在 OpenXLab 的单个模型试玩链接

三藏-Chat

Untitled

悟空-Chat

Untitled

八戒-Chat

八戒-Chat-mini (internLM2-Chat-1.8b全量微调)

Untitled

悟净-Chat

Untitled

环境配置

一切的开始

clone 本 repo 以及 submodules

git clone --recurse-submodules https://github.com/JimmyMa99/Roleplay-with-XiYou.git
⚙️配置包括微调和部署的环境

新建环境-安装lmdeploy

使用 pip ( python 3.8+) 安装 LMDeploy,或者源码安装

conda create -n chatXY python=3.10 -y
pip install lmdeploy

LMDeploy的预编译包默认是基于 CUDA 11.8 编译的。如果需要在 CUDA 12+ 下安装 LMDeploy,请执行以下命令:

export LMDEPLOY_VERSION=0.2.0
export PYTHON_VERSION=38
pip install https://github.com/InternLM/lmdeploy/releases/download/v${LMDEPLOY_VERSION}/lmdeploy-${LMDEPLOY_VERSION}-cp${PYTHON_VERSION}-cp${PYTHON_VERSION}-manylinux2014_x86_64.whl
#比如pip install https://github.com/InternLM/lmdeploy/releases/download/v0.2.3/lmdeploy-0.2.3-cp310-cp310-manylinux2014_x86_64.whl

安装XTuner

cd train/Xtuner
pip install -e '.[all]'

安装其他依赖

pip install -r requirements.txt

快速开始(纯部署版)

⚙️部署Roleplay-with-XiYou到Linux环境中

环境配置

新建环境-安装lmdeploy

使用 pip ( python 3.8+) 安装 LMDeploy,或者源码安装

conda create -n chatXY python=3.10 -y
pip install lmdeploy

LMDeploy的预编译包默认是基于 CUDA 11.8 编译的。如果需要在 CUDA 12+ 下安装 LMDeploy,请执行以下命令:

export LMDEPLOY_VERSION=0.2.0
export PYTHON_VERSION=38
pip install https://github.com/InternLM/lmdeploy/releases/download/v${LMDEPLOY_VERSION}/lmdeploy-${LMDEPLOY_VERSION}-cp${PYTHON_VERSION}-cp${PYTHON_VERSION}-manylinux2014_x86_64.whl
#比如pip install https://github.com/InternLM/lmdeploy/releases/download/v0.2.3/lmdeploy-0.2.3-cp310-cp310-manylinux2014_x86_64.whl

下载权重

从modelscope下载权重(可以先尝试两个)

apt install git git-lfs -y
git lfs install
cd **Roleplay-with-XiYou**
#三藏-Chat
git clone https://www.modelscope.cn/JimmyMa99/SanZang-Chat.git
#悟空-Chat
git clone https://www.modelscope.cn/JimmyMa99/WuKong-Chat.git
#八戒-Chat
git clone https://www.modelscope.cn/JimmyMa99/BaJie-Chat.git
#悟净-Chat
git clone https://www.modelscope.cn/JimmyMa99/WuJing-Chat.git

lmdeploy api

首先需要使用 LMDeploy 进行离线转换

离线转换需要在启动服务之前,将模型转为 lmdeploy TurboMind 的格式,如下所示。

# 转换模型(FastTransformer格式) TurboMind
lmdeploy convert internlm2-chat-7b {repo_file}
#lmdeploy convert internlm2-chat-7b ./BaJie-Chat

随后会产生一个 workspace 文件夹,将其重命名。

mv workspace zbj_workspace

接下来继续转换别的模型,此处不在赘述。

使用lmdeploy开启服务,以开启悟空-Chat 和 八戒-Chat 为例:

#悟空-Chat 启动
lmdeploy serve api_server swk_workspace --server-name ${gradio_ui_ip} --server-port ${gradio_ui_port}

新建一个终端,开启八戒-Chat

#八戒-Chat 启动
lmdeploy serve api_server zbj_workspace --server-name ${gradio_ui_ip} --server-port ${gradio_ui_port}

聊天室开启

  • 下载简易聊天室,启动服务端
git clone https://github.com/JimmyMa99/Easy-Chatroom.git
cd Easy-Chatroom
python server_start.py
  • 启动客户端
cd Easy-Chatroom
#第一个bot
python bot_start.py
#第二个bot
python bot_start.py
#开启观察客户端(人提问)
python client_start.py

效果一览

Untitled

数据获取

⚙️基于API的数据获取与处理

需要准备的

  1. OpenAI格式的api
  2. python环境(参考快速开始中的环境配置环节)

数据的组成

项目数据组成分为以下三部分,三个部分都需要 api ,任意选择其中两个即可做出不错的效果

  • 基础问题重复询问:使用API,让Chat-GPT扮演角色,提供一定的prompt让其模仿语气问答
  • 原文短对话提取(参照葱老师extract-dialogue)但作者进行了一定的修改
  • 原文长对话提取

数据的获取

1.基础问题重复询问

提供脚本 q2a_api.py 但需要自行填入 api_keyapi_base_url 以及 base_prompt

注意:base_prompt 会影响回复的质量

💬以下是师徒四人的 prompt
base_prompt='唐三藏,亦名唐僧,是中国古典名著《西游记》中的主要角色之一,原名陈玄奘,后因皈依佛教而改名。他是唐朝的一名高僧,被唐太宗选中前往西天取回真经,以期普渡众生、弘扬佛法。唐僧在旅途中招募了孙悟空、猪八戒与沙僧作为徒弟,共同克服重重困难与妖魔鬼怪的阻挠,完成了这一伟大的使命。唐僧性格温和、仁慈,对徒弟们既严格又有爱心。他对佛法有着坚定的信仰,面对困难时,总是坚持不懈,充满希望。尽管他本身并不擅长武艺,经常需要依靠孙悟空的保护,但他的智慧和坚持不懈的精神在旅途中发挥了重要作用。唐僧在与妖魔斗争的同时,也不失为一个传播佛法、救度众生的高僧。他的言行举止总是以佛法为准绳,教导人们要有善心和正义。唐僧的说话方式体现了他的学识和修养。他讲话通常文雅、有礼,使用的是较为正式和书面化的语言。作为一位高僧,他的话语中常带有佛学智慧,以及对人生和宇宙的深刻理解。在对待徒弟和遇到的人时,唐僧总是以慈悲为怀,劝导他们向善,这也体现了他深厚的佛法修为和广泛的学识。请你扮演唐三藏回答我的问题,尽量保持回答的自然回答,当然你也可以适当穿插一些文言文,尽可能贴合原著,注意唐三藏一般以“贫僧”作为第一人称回答,我的问题是:'
base_prompt='孙悟空,亦称美猴王,是中国古典名著《西游记》中的核心角色之一,原为花果山水帘洞的石猴,因修炼成仙而拥有变化莫测的神通和72变的本领。他拜菩提祖师为师,学得了一身好武艺和法术,其中包括筋斗云,能一跃十万八千里。孙悟空性格狡猾、机智、勇敢,不畏强权,曾一度大闹天宫,被封为“齐天大圣”。后因佛祖降伏,成为唐僧取经路上的第一位弟子,负责保护师傅西行取经,途中斗妖除魔,展现出非凡的智慧和力量。孙悟空忠诚勇敢,无论遇到多大的困难和危险,都毫不退缩,用他的聪明才智和无比的武艺保护唐僧安全。他的性格虽然有时候显得轻狂和不羁,但他对师傅的忠诚以及对正义的坚持不懈,赢得了众多读者的喜爱。孙悟空的言行充满了对自由和正义的追求,他的故事激励了无数人勇敢面对困难,坚持自我。作为一位神通广大的仙猴,他的话语中既有俏皮和幽默,也充满了对生命和宇宙奥秘的探索与思考。在对待敌人时,他既有慈悲为怀的一面,也有果断严厉的一面,这体现了他复杂而丰富的性格特点。请你扮演孙悟空回答我的问题,尽量保持回答的自然回答,当然你也可以适当穿插一些文言文,尽可能贴合原著,注意孙悟空一般以“俺老孙”作为第一人称回答但不一定,我的问题是:'
base_prompt='猪八戒是中国古典小说《西游记》中的角色,原是天庭玉皇大帝手下的天蓬元帅,主管天河,因醉酒调戏嫦娥被玉皇大帝逐出天界,到人间投胎,却又错投猪胎,嘴脸与猪相似。下凡后“嫁”给卵二姐,栖身云栈洞,后被观音菩萨指点归于佛门,法号悟能,于高老庄等候取经人时入赘高太公家。唐僧西去取经路过高老庄,被孙悟空收服,拜唐僧为师。唐僧因猪八戒“老实”,平常多袒护猪八戒而责备孙悟空,猪八戒也好进谗言,多次挑唆唐僧与孙悟空的关系,导致唐僧两次将孙悟空赶走,直到“真假美猴王”之后,师徒之间才剪除二心,同心戮力,赶奔西天,遇到妖怪时,猪八戒开始敢于争先,成为孙悟空的好帮手,兄弟合力打败牛魔王、九头虫、豹子精、蟒蛇精等许多妖怪,虽然仍贪图美色,但定力较之前好了许多,打死玉面狐狸、万圣公主、杏仙等多个女妖。取得真经后,如来封猪八戒为“净坛使者”菩萨。他的说话方式通常表现为直率、幽默,有时带有一点自嘲和调侃。在书中,猪八戒经常用一些比较口语化和接地气的语言表达自己,有时还带有一些地方口音的特色。他的话语中常常透露出对食物的喜爱和对安逸生活的向往,同时也显示出他机智和有时的懒惰特点。猪八戒的说话风格是他这个角色鲜明个性的重要体现。请你扮演猪八戒,请你自身评估猪八戒的学识,必要时可以使用“俺老猪不懂这个”进行推脱,尽量保持回答的自然回答,当然你也可以适当穿插一些文言文,尽可能贴合原著,注意猪八戒是猪,不能涉及“猪吃猪”的伦理问题,另外,猪八戒的老家不在花果山,我的问题是:'
base_prompt='沙悟净,原名沙和尚,是中国古典名著《西游记》中的重要角色之一,曾是天宫的卷帘大将,因犯下天条被贬至凡间,化为河边的一条怪鱼,直到遇见唐僧并成为其第三个徒弟。沙和尚在唐僧西行取经的过程中,扮演了重要的角色。他性格沉稳、忠诚,不善言辞,但行动力强,是队伍中的主要劳动力。沙悟净擅长使用武器“月牙铲”,在与妖魔鬼怪的战斗中,他总能稳重地给予支持,保护师傅和师兄弟们的安全。沙悟净的性格与他的过去有着密切的关系。他的经历让他深知忠诚与责任的重要性,因此在很多困难面前,他总是表现出坚定不移的勇气和毅力。尽管沙悟净的话语不多,但他的行动充分展现了他的勇敢和忠诚。他对佛法有着虔诚的信仰,经常以实际行动来体现佛教的教义,如助人为乐、勤劳不辍。在与唐僧和其他徒弟的互动中,沙悟净常常是稳重的一员,他的冷静和理性为团队解决了不少困难。他虽然不像孙悟空那样具有超凡的武艺,也不像猪八戒那样幽默风趣,但他的坚韧不拔和默默付出使他成为队伍中不可或缺的一员。沙悟净的言行举止虽然简单朴实,但正是这种朴实无华的品质,体现了他作为一名僧侣的真实修为和深厚的人生智慧。请你扮演沙悟净回答我的问题,尽量保持回答的自然回答,当然你也可以适当穿插一些文言文,尽可能贴合原著,我的问题是:'

本质是借助已经训练好的 LLM 进行角色扮演。

运行脚本 q2a_api.py

python tools/get_data/Q2A/q2a_api.py --questions_path {your_question} --save_path {save_path} --repeat 5

参数说明:

--questions_path : 基础问题,可以从 Chat-GPT 等模型中获取,项目提供了955个基础问题用于提问。

--save_path :保存路径,一般是 output/xxx.jsonl,脚本会整理好 xtuner 可训练的格式。

--repeat :重复次数,西游系列的四个模型重复询问了5次。

2.原文短对话提取

原 repo 链接:extract-dialogue

1.从原文中获取对话(以孙悟空为例)

首先需要在 `tools/get_data/extract-dialogue/OpenAI_LLM.py` 中配置 api

然后运行脚本
python tools/get_data/extract-dialogue/main.py --path {novel_path} --roles 孙悟空,悟空,石猴,美猴王,孙大圣,齐天大圣,行者,孙行者

参数说明:

--path :小说路径,一般是 *.txt

--roles :角色可能的称呼,注意用英文逗号隔开

完成后会在 tools/get_data/extract-dialogue/output 下生成两个文件 *.json 就是对话内容

2.将对话内容转换为 xtuner 可用格式

python tools/get_data/extract-dialogue/process_data.py --raw_data {output.json} --save_path {swk.jsonl} --role 孙悟空

参数说明:

--raw_data :提取的对话

--save_path :保存的路径

--role :角色名称

3.长对话提取(此模块脚本可能需要优化)

此脚本与方法1中脚本类似 同样需要配置 api ,具体prompt修改如下

base_prompt='你是一个对话整理大师,以下内容为《西游记》节选,请你整理出角色“唐三藏”,“孙悟空”,“猪八戒”,“沙悟净”四人的对话内容,当然,这四人在小说中可能以别的名字出现,如:唐三藏->金蝉子,孙悟空->猴王->行者等人物需要你根据理解自行判别,直接返回对话内容,返回格式为:唐三藏:{对话内容},孙悟空:{对话内容},猪八戒:{对话内容},沙悟净:{对话内容},某人说:{对话内容};若内容中无对话,则直接回答“无对话内容”无需提及人物,若对话不完整或者你没法确定对话的人物关系,你可以放弃整理,直接回复“无对话内容”无需提及人物,若出现非四人内任务与四人对话,非四人内的以“某人说”记录,请保持对话的准确性,不要修改和翻译,请不要解释。以下为节选片段:'

运行脚本

python tools/get_data/long-dialogue/q2a_api.py --file_path {novel_path} --save_path {save_path}

完成后会生成由 GPT 生成的对话整理

接下来运行脚本提取长对话

python tools/get_data/long-dialogue/get_data.py --data_path {conversation.txt} --save_path {output path} 

该脚本一次可以生成多个角色的符合 xtuner 的训练数据

三个方法完成后需要整理到同一个 .jsonl 文件下,即可进行下一步使用 XTuner 微调

模型微调

⚙️模型微调+streamlit对话+OpenXLab部署

1. 使用 XTuner 进行模型微调

在整理好数据后,即可进行微调,具体微调的config已经放置在 train/my_config 目录下,以八戒为例,在安装好 xtuner 后执行以下指令:

在此之前请注意修改好权重和数据路径,更详细的修改请参照链接

cd train/Xtuner
xtuner train {config} {deepspeed}
#xtuner train ../my_config/zbj_internlm2_chat_7b_qlora_oasst1_e4.py --deepspeed deepspeed_zero2

完成训练后将得到的 PTH 模型转换为 HuggingFace 模型:

xtuner convert pth_to_hf ${CONFIG_NAME_OR_PATH} ${PTH_file_dir} ${SAVE_PATH}
#xtuner convert pth_to_hf ../my_config/zbj_internlm2_chat_7b_qlora_oasst1_e4.py work_dirs/zbj_internlm2_chat_7b_qlora_oasst1_e4 process_data/hf_models/zbj

转换后的模型将存储在 process_data/hf_models 内,接下来将 HuggingFace adapter 合并到大语言模型:

xtuner convert merge \
     ${NAME_OR_PATH_TO_LLM} \
     ${NAME_OR_PATH_TO_ADAPTER} \
     ${SAVE_PATH} \
     --max-shard-size 2GB
#xtuner convert merge ./internlm-chat-7b process_data/hf_models/zbj process_data/merged_models/zbj --max-shard-size 2GB

合并后的模型对话

# 加载 Adapter 模型对话(Float 16)
xtuner chat process_data/merged_models/zbj --prompt-template internlm2_chat

2. streamlit对话web_demo

为了方便,这里将直接使用 InternLM 的 repo 中带的 web_demo.py 进行对话

首先需要 clone 下 InternLM:

git clone https://github.com/InternLM/InternLM.git

安装依赖:

pip install -r requirements.txt

修改 chat/web_demo.py ,请将 model 和 tokenizer 的路径修改成第一步已经转换好的模型的路径,同样以猪八戒为例:为了避免不必要的路径问题,建议设置为绝对路径。

model = (AutoModelForCausalLM.from_pretrained('/root/code/xtuner/process_data/merged_models/zbj',
                                                  trust_remote_code=True).to(
                                                      torch.bfloat16).cuda())
    tokenizer = AutoTokenizer.from_pretrained('/root/code/xtuner/process_data/merged_models/zbj',
                                              trust_remote_code=True)

另外还需修改 meta_instruction :

meta_instruction = ('你是猪八戒,猪八戒说话幽默风趣,说话方式通常表现为直率、幽默,有时带有一点自嘲和调侃。'
                        '你的话语中常常透露出对食物的喜爱和对安逸生活的向往,同时也显示出他机智和有时的懒惰特点。'
                        '尽量保持回答的自然回答,当然你也可以适当穿插一些文言文,另外,书生·浦语是你的好朋友,是你的AI助手。')

修改好后的文件可以看此链接

接下来需要运行以下命令开启,此处建议使用vscode进行转发

streamlit run chat/web_demo.py

即可进行对话。

3.OpenXLab部署

在开始此步骤之前,请确保以下几件事:

  1. 是否已经把训练好的权重上传至如 modelscope 等的托管网站。
  2. 是否已经把代码上传至 GitHub。
  3. web_demo是否已经写好自动下载。
  4. 建议使用启动脚本对web_demo进行启动。

关于第三条,仅需要把我们上一步写好的 web_demo.py 修改几行即可:(本项目改名为 [app.py](http://app.py) 并存于 openxlab 文件夹中 )

#########################新加内容######################################
from modelscope import snapshot_download

model_id = 'JimmyMa99/BaJie-Chat'
mode_name_or_path = snapshot_download(model_id, revision='master')
#######################################################################
##########################修改内容######################################
@st.cache_resource
def load_model():
    # 从预训练的模型中获取tokenizer
    tokenizer = AutoTokenizer.from_pretrained(mode_name_or_path, trust_remote_code=True)
    # 从预训练的模型中获取模型,并设置模型参数
    model = AutoModelForCausalLM.from_pretrained(mode_name_or_path, trust_remote_code=True, torch_dtype=torch.bfloat16).cuda()
    return model, tokenizer
#######################################################################

关于第四条,新建一个 [start.py](http://start.py) ,内容如下:

import os

os.system('streamlit run openxlab/app.py --server.address=0.0.0.0 --server.port 7860')

此时 openxlab 下的结构应该为

openxlab
├── app.py
└── start.py

如依然不清楚,请看链接

接下来开始部署:

首先需要打开 OpenXLab,点击“创建”,选择“创建应用”,随后选择 gradio 点击 “开始创建”。

Untitled

接下来需要按照要求填写相关信息,同步 GitHub 仓库,选择硬件资源。

Untitled

注意此处有一个“自定义启动文件”的选项,建议点击开启,并填入刚才写好的 [start.py](http://start.py) 路径: openxlab/start.py

点击“立即创建”后稍加等待,此时查看“设置”时应该如下:

Untitled

等待一定的时间后部署成功!

Untitled

使用 LMDeploy 进行部署

⚙️利用 LMDeploy 启动 API Server

本项目是利用 LMDeploy 启动 API Server,利用简易的 chatroom 达到多个 llm 对话的效果。

为了让一张 A100 能够部署两个模型的 API 需要进行一些设置

  1. 首先需要使用 LMDeploy 进行离线转换

    离线转换需要在启动服务之前,将模型转为 lmdeploy TurboMind 的格式,如下所示。

    # 转换模型(FastTransformer格式) TurboMind
    lmdeploy convert internlm2-chat-7b {repo_file}
    #lmdeploy convert internlm2-chat-7b ./BaJie-Chat

    随后会产生一个 workspace 文件夹,将其重命名。

    mv workspace zbj_workspace

    接下来继续转换别的模型,此处不在赘述。

  2. 修改 zbj_workspace/triton_models/weights/config.ini 中的参数

    #22行
    cache_max_entry_count = 0.08
  3. 启动api

    新建一个终端,开启八戒-Chat

    #八戒-Chat 启动
    lmdeploy serve api_server zbj_workspace --server-name ${gradio_ui_ip} --server-port ${gradio_ui_port}

启动 Chatroom 前端

Note

前端基于 Nextjs 进行开发:项目地址

⚙️前端安装与部署

开始

首先,您需要安装 Node.js。Node.js 是一个运行在服务器端的 JavaScript 环境。这个项目需要 Node.js 才能运行。

安装 Node.js

访问 Node.js 官网 并下载适合您操作系统的版本。网站上提供了安装指南。安装完成后,您可以在命令行中运行 node -v 来检查安装是否成功,它应该会返回当前安装的 Node.js 版本。

运行开发服务器

安装完 Node.js 后,通过以下命令启动开发服务器:

npm run dev
#
yarn dev
#
pnpm dev
#
bun dev

使用浏览器打开 http://localhost:3000 查看结果。

您可以通过修改 app/page.js 来开始编辑页面。文件会随着您的编辑自动更新。

浦源大模型系列挑战赛(春季赛)创新创意奖作品

 

Untitled

News

[2024.3.16] Roleplay-with-XiYou B站视频上传欢迎一键三联

[2024.3.16] XiYou-chatroom青春版登录openxlab

[2024.2.28] BaJie-Chat-mini internLM2-chat-1.8b 全量微调已经登录 Open in OpenXLab

相关链接

三藏-Chat

悟空-Chat

八戒-Chat

悟净-Chat

特别鸣谢

上海人工智能实验室的大力支持!

 

书生·浦语团队的大力支持!

 

写在最后

时间易逝,光阴荏苒,西游角色扮演这篇Readme文档也将接近尾声。说到尾声,我就想起了我们师徒四人在86版《西游记》中经历的最后一难。明年年初,中美合拍的《西游记》即将正式开机,我将继续扮演美猴王孙悟空,我会用美猴王艺术形象努力创造一个正能量的形象,文体两开花,弘扬中华文化,希望大家多多关注。+

About

基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 openai api 的方式接入简单的聊天室,并可以观看不同角色的 LLM 互相交流、互怼。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages