Skip to content

Latest commit

 

History

History
62 lines (38 loc) · 1.87 KB

README.md

File metadata and controls

62 lines (38 loc) · 1.87 KB

NL_image_tagger

NL_image_tagger 是一个基于本地多模态大语言模型对图片进行批量自然语言打标的项目


不同模型的配置需求

本项目支持多种模型,欢迎各位使用不同的模型测试效果以及配置需求,并将测试结果反馈到 issue 中,我会将您提供的数据加入 README,以下是几种示例模型:


使用教学

1. 安装依赖

推荐使用 Python 3.10.11

1.1. 安装 PyTorch

pytorch.org 获取适合自己的安装命令,示例如下:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124 --upgrade

1.2. 安装其余依赖

pip install huggingface_hub gradio transformers pillow tqdm --upgrade

2. 下载模型

(可选:更换模型)修改 downloadmodel.py 文件中 line 3repo_id="openbmb/MiniCPM-V-2_6-int4"

python downloadmodel.py

3. 启动主程序

python main.py

4.使用主程序进行打标

图片目录处输入需要打标的图片目录,并点击开始处理,程序就会自动开始标注

image image image