入门使用

关于配置运行环境，请参考安装指南

训练/评估/推断

PaddleDetection提供了训练/评估/推断三个功能的使用脚本，支持通过不同可选参数实现特定功能

# 设置PYTHONPATH路径
export PYTHONPATH=$PYTHONPATH:.
# GPU训练 支持单卡，多卡训练，通过CUDA_VISIBLE_DEVICES指定卡号
export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
python tools/train.py -c configs/faster_rcnn_r50_1x.yml
# GPU评估
export CUDA_VISIBLE_DEVICES=0
python tools/eval.py -c configs/faster_rcnn_r50_1x.yml
# 推断
python tools/infer.py -c configs/faster_rcnn_r50_1x.yml --infer_img=demo/000000570688.jpg

可选参数列表

以下列表可以通过--help查看

FLAG	支持脚本	用途	默认值	备注
-c	ALL	指定配置文件	None	配置模块说明请参考配置模块
-o	ALL	设置配置文件里的参数内容	None	使用-o配置相较于-c选择的配置文件具有更高的优先级。例如：`-o use_gpu=False max_iter=10000`
-r/--resume_checkpoint	train	从某一检查点恢复训练	None	`-r output/faster_rcnn_r50_1x/10000`
--eval	train	是否边训练边测试	False
--output_eval	train/eval	编辑评测保存json路径	当前路径	`--output_eval ./json_result`
--fp16	train	是否使用混合精度训练模式	False	需使用GPU训练
--loss_scale	train	设置混合精度训练模式中损失值的缩放比例	8.0	需先开启`--fp16`后使用
--json_eval	eval	是否通过已存在的bbox.json或者mask.json进行评估	False	json文件路径在`--output_eval`中设置
--output_dir	infer	输出推断后可视化文件	`./output`	`--output_dir output`
--draw_threshold	infer	可视化时分数阈值	0.5	`--draw_threshold 0.7`
--infer_dir	infer	用于推断的图片文件夹路径	None
--infer_img	infer	用于推断的图片路径	None	相较于`--infer_dir`具有更高优先级
--use_tb	train/infer	是否使用tb-paddle记录数据，进而在TensorBoard中显示	False
--tb_log_dir	train/infer	指定 tb-paddle 记录数据的存储路径	train:`tb_log_dir/scalar` infer: `tb_log_dir/image`

使用示例

模型训练

边训练边测试
```
export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
python -u tools/train.py -c configs/faster_rcnn_r50_1x.yml --eval
```
在训练中交替执行评估, 评估在每个snapshot_iter时开始。每次评估后还会评出最佳mAP模型保存到best_model文件夹下。

如果验证集很大，测试将会比较耗时，建议减少评估次数，或训练完再进行评估。
Fine-tune其他任务

使用预训练模型fine-tune其他任务时，可采用如下两种方式：
1. 在YAML配置文件中设置finetune_exclude_pretrained_params
2. 在命令行中添加-o finetune_exclude_pretrained_params对预训练模型进行选择性加载。
```
export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
python -u tools/train.py -c configs/faster_rcnn_r50_1x.yml \
                       -o pretrain_weights=output/faster_rcnn_r50_1x/model_final \
                          finetune_exclude_pretrained_params=['cls_score','bbox_pred']
```
详细说明请参考迁移学习文档
使用Paddle OP组建的YOLOv3损失函数训练YOLOv3

为了便于用户重新设计修改YOLOv3的损失函数，我们也提供了不使用fluid.layer.yolov3_loss接口而是在python代码中使用Paddle OP的方式组建YOLOv3损失函数, 可通过如下命令用Paddle OP组建YOLOv3损失函数版本的YOLOv3模型：
```
export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
python -u tools/train.py -c configs/yolov3_darknet.yml \
                         -o use_fine_grained_loss=true
```
Paddle OP组建YOLOv3损失函数代码位于ppdet/modeling/losses/yolo_loss.py

提示:

CUDA_VISIBLE_DEVICES 参数可以指定不同的GPU。例如: export CUDA_VISIBLE_DEVICES=0,1,2,3. GPU计算规则可以参考 FAQ
若本地未找到数据集，将自动下载数据集并保存在~/.cache/paddle/dataset中。
预训练模型自动下载并保存在〜/.cache/paddle/weights中。
模型checkpoints默认保存在output中，可通过修改配置文件中save_dir进行配置。
RCNN系列模型CPU训练在PaddlePaddle 1.5.1及以下版本暂不支持。

混合精度训练

通过设置 --fp16 命令行选项可以启用混合精度训练。目前混合精度训练已经在Faster-FPN, Mask-FPN 及 Yolov3 上进行验证，几乎没有精度损失（小于0.2 mAP)。

建议使用多进程方式来进一步加速混合精度训练。示例如下。

python -m paddle.distributed.launch --selected_gpus 0,1,2,3,4,5,6,7 tools/train.py --fp16 -c configs/faster_rcnn_r50_fpn_1x.yml

如果训练过程中loss出现NaN，请尝试调节--loss_scale选项数值，细节请参看混合精度训练相关的Nvidia文档。

另外，请注意将配置文件中的 norm_type 由 affine_channel 改为 bn。

模型评估

指定权重和数据集路径

export CUDA_VISIBLE_DEVICES=0
python -u tools/eval.py -c configs/faster_rcnn_r50_1x.yml \
                      -o weights=https://paddlemodels.bj.bcebos.com/object_detection/faster_rcnn_r50_1x.tar \

评估模型可以为本地路径，例如output/faster_rcnn_r50_1x/model_final, 也可以是MODEL_ZOO中给出的模型链接。

通过json文件评估

export CUDA_VISIBLE_DEVICES=0
python -u tools/eval.py -c configs/faster_rcnn_r50_1x.yml \
           --json_eval \
           --output_eval evaluation/

json文件必须命名为bbox.json或者mask.json，放在evaluation/目录下。

提示:

R-CNN和SSD模型目前暂不支持多GPU评估，将在后续版本支持

模型推断

设置输出路径 && 设置推断阈值

export CUDA_VISIBLE_DEVICES=0
python -u tools/infer.py -c configs/faster_rcnn_r50_1x.yml \
                    --infer_img=demo/000000570688.jpg \
                    --output_dir=infer_output/ \
                    --draw_threshold=0.5 \
                    -o weights=output/faster_rcnn_r50_1x/model_final \

--draw_threshold 是个可选参数. 根据 NMS 的计算，不同阈值会产生不同的结果。如果用户需要对自定义路径的模型进行推断，可以设置-o weights指定模型路径。

FAQ

Q: 为什么我使用单GPU训练loss会出NaN?
A: 默认学习率是适配多GPU训练(8x GPU)，若使用单GPU训练，须对应调整学习率（例如，除以8）。计算规则表如下所示，它们是等价的，表中变化节点即为piecewise decay里的boundaries:

GPU数	学习率	最大轮数	变化节点
2	0.0025	720000	[480000, 640000]
4	0.005	360000	[240000, 320000]
8	0.01	180000	[120000, 160000]

Q: 如何减少GPU显存使用率?
A: 可通过设置环境变量FLAGS_conv_workspace_size_limit为较小的值来减少显存消耗，并且不会影响训练速度。以Mask-RCNN（R50）为例，设置export FLAGS_conv_workspace_size_limit = 512， batch size可以达到每GPU 4 (Tesla V100 16GB)。

Q: 如何修改数据预处理?
A: 可在配置文件中设置 sample_transform。注意需要在配置文件中加入完整预处理 例如RCNN模型中DecodeImage, NormalizeImage and Permute。

Q: affine_channel和batch norm是什么关系?
A: 在RCNN系列模型加载预训练模型初始化，有时候会固定住batch norm的参数, 使用预训练模型中的全局均值和方式，并且batch norm的scale和bias参数不更新，已发布的大多ResNet系列的RCNN模型采用这种方式。这种情况下可以在config中设置norm_type为bn或affine_channel, freeze_norm为true (默认为true)，两种方式等价。affne_channel的计算方式为scale * x + bias。只不过设置affine_channel时，内部对batch norm的参数自动做了融合。如果训练使用的affine_channel，用保存的模型做初始化，训练其他任务时，既可使用affine_channel, 也可使用batch norm, 参数均可正确加载。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

GETTING_STARTED_cn.md

GETTING_STARTED_cn.md

入门使用

训练/评估/推断

可选参数列表

使用示例

模型训练

混合精度训练

模型评估

模型推断

FAQ

Files

GETTING_STARTED_cn.md

Latest commit

History

GETTING_STARTED_cn.md

File metadata and controls

入门使用

训练/评估/推断

可选参数列表

使用示例

模型训练

混合精度训练

模型评估

模型推断

FAQ