本项目支持多种模型,欢迎各位使用不同的模型测试效果以及配置需求,并将测试结果反馈到 issue 中,我会将您提供的数据加入 README,以下是几种示例模型:
-
- 需求:10G VRAM
- 测试结果:此模型在使用 RTX 4070 SUPER 12G 时的打标速度约为 10 秒/张
- 测试者:zzc0208
推荐使用 Python 3.10.11
在 pytorch.org 获取适合自己的安装命令,示例如下:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124 --upgrade
pip install huggingface_hub gradio transformers pillow tqdm --upgrade
(可选:更换模型)修改 downloadmodel.py
文件中 line 3
的 repo_id="openbmb/MiniCPM-V-2_6-int4"
python downloadmodel.py
python main.py
在图片目录
处输入需要打标的图片目录,并点击开始处理
,程序就会自动开始标注