From cd26ae3e451b5e5f6fbd07b1624d2736752e642b Mon Sep 17 00:00:00 2001
From: Ming-Yang Liu <eric612kimo@yahoo.com.tw>
Date: Fri, 21 Sep 2018 14:50:37 +0800
Subject: [PATCH] Add pytorch darknet to caffe code and demo script

---
 README.md                                  |   50 -
 demo_darknet_yolov3.sh                     |    1 +
 examples/ssd/ssd_detect.cpp                |   26 +-
 models/darknet_yolov3/README.md            |   29 +
 models/darknet_yolov3/darknet2caffe.py     |  466 +++
 models/darknet_yolov3/tiny-yolov3.prototxt |  607 ++++
 models/darknet_yolov3/yolov3-tiny.cfg      |  182 ++
 models/darknet_yolov3/yolov3.cfg           |  788 +++++
 models/darknet_yolov3/yolov3.prototxt      | 3271 ++++++++++++++++++++
 9 files changed, 5368 insertions(+), 52 deletions(-)
 create mode 100644 demo_darknet_yolov3.sh
 create mode 100644 models/darknet_yolov3/README.md
 create mode 100644 models/darknet_yolov3/darknet2caffe.py
 create mode 100644 models/darknet_yolov3/tiny-yolov3.prototxt
 create mode 100644 models/darknet_yolov3/yolov3-tiny.cfg
 create mode 100644 models/darknet_yolov3/yolov3.cfg
 create mode 100644 models/darknet_yolov3/yolov3.prototxt

diff --git a/README.md b/README.md
index 56bb9ac..c9eb85f 100644
--- a/README.md
+++ b/README.md
@@ -80,56 +80,6 @@ If load success , you can see the image window like this
 
 ![alt tag](00002.jpg)
 
-### Vehicle Dection 
-
-[![IMAGE ALT TEXT HERE](https://img.youtube.com/vi/oagXgyQHuNA/0.jpg)](https://www.youtube.com/watch?v=oagXgyQHuNA)
-
-#### CLASS NAME
-
-```
-char* CLASSES2[6] = { "__background__","bicycle", "car", "motorbike", "person","cones" };
-```
-
-[model](models/vehicle)
-
-## Maintenance
-
-I'll appreciate  if you can help me to 
-
-1. Miragrate to [modivius neural compute stick](https://github.com/eric612/YoloV2-MobileNet-NCS)
-2. Mobilenet upgrade to v2 or model tunning
-
-## Caffe 
-
-[![Build Status](https://travis-ci.org/BVLC/caffe.svg?branch=master)](https://travis-ci.org/BVLC/caffe)
-[![License](https://img.shields.io/badge/license-BSD-blue.svg)](LICENSE)
-
-Caffe is a deep learning framework made with expression, speed, and modularity in mind.
-It is developed by Berkeley AI Research ([BAIR](http://bair.berkeley.edu))/The Berkeley Vision and Learning Center (BVLC) and community contributors.
-
-Check out the [project site](http://caffe.berkeleyvision.org) for all the details like
-
-- [DIY Deep Learning for Vision with Caffe](https://docs.google.com/presentation/d/1UeKXVgRvvxg9OUdh_UiC5G71UMscNPlvArsWER41PsU/edit#slide=id.p)
-- [Tutorial Documentation](http://caffe.berkeleyvision.org/tutorial/)
-- [BAIR reference models](http://caffe.berkeleyvision.org/model_zoo.html) and the [community model zoo](https://github.com/BVLC/caffe/wiki/Model-Zoo)
-- [Installation instructions](http://caffe.berkeleyvision.org/installation.html)
-
-and step-by-step examples.
-
-## Custom distributions
-
- - [Intel Caffe](https://github.com/BVLC/caffe/tree/intel) (Optimized for CPU and support for multi-node), in particular Xeon processors (HSW, BDW, SKX, Xeon Phi).
-- [OpenCL Caffe](https://github.com/BVLC/caffe/tree/opencl) e.g. for AMD or Intel devices.
-- [Windows Caffe](https://github.com/BVLC/caffe/tree/windows)
-
-## Community
-
-[![Join the chat at https://gitter.im/BVLC/caffe](https://badges.gitter.im/Join%20Chat.svg)](https://gitter.im/BVLC/caffe?utm_source=badge&utm_medium=badge&utm_campaign=pr-badge&utm_content=badge)
-
-Please join the [caffe-users group](https://groups.google.com/forum/#!forum/caffe-users) or [gitter chat](https://gitter.im/BVLC/caffe) to ask questions and talk about methods and models.
-Framework development discussions and thorough bug reports are collected on [Issues](https://github.com/BVLC/caffe/issues).
-
-Happy brewing!
 
 ## License and Citation
 
diff --git a/demo_darknet_yolov3.sh b/demo_darknet_yolov3.sh
new file mode 100644
index 0000000..204fcaa
--- /dev/null
+++ b/demo_darknet_yolov3.sh
@@ -0,0 +1 @@
+./examples/ssd/ssd_detect models/darknet_yolov3/yolov3.prototxt models/darknet_yolov3/yolov3.caffemodel -file_type image -wait_time 1500 -mean_value 0.0,0.0,0.0 -normalize_value 0.0039215 -confidence_threshold 0.2
\ No newline at end of file
diff --git a/examples/ssd/ssd_detect.cpp b/examples/ssd/ssd_detect.cpp
index 1ca7a02..a405fba 100644
--- a/examples/ssd/ssd_detect.cpp
+++ b/examples/ssd/ssd_detect.cpp
@@ -34,8 +34,30 @@
 //char* CLASSES[6] = { "__background__",
 //"bicyle", "car", "motorbike", "person","cones"
 //};
-char* CLASSES[5] = { "__background__",
-"big car","car", "motorbike","person"
+//char* CLASSES[5] = { "__background__",
+//"big car","car", "motorbike","person"
+//};
+char* CLASSES[81] = { "__background__",
+"person", "bicycle", "car", "motorcycle",
+"airplane", "bus", "train", "truck", "boat",
+"traffic light", "fire hydrant", "stop sign", "parking meter",
+"bench", "bird", "cat",
+"dog", "horse", "sheep", "cow" 
+"elephant", "bear", "zebra", "giraffe" ,
+"backpack", "umbrella", "handbag", "tie" ,
+"suitcase", "frisbee", "skis", "snowboard" ,
+"sports ball", "kite", "baseball bat", "baseball glove" ,
+"skateboard", "surfboard", "tennis racket", "bottle" ,
+"wine glass", "cup", "fork", "knife" ,
+"spoon", "bowl", "banana", "apple" ,
+"sandwich", "orange", "broccoli", "carrot" ,
+"hot dog", "pizza", "donut", "cake" ,
+"chair", "sofa", "potted plant", "bed" ,
+"dining table", "toilet", "tv", "laptop" ,
+"mouse", "remote", "keyboard", "cell phone" ,
+"microwave", "oven", "toaster", "sink" ,
+"refrigerator", "book", "clock", "vase" ,
+"scissors", "teddy bear", "hair drier", "toothbrush" ,
 };
 #else
 char* CLASSES[21] = { "__background__",
diff --git a/models/darknet_yolov3/README.md b/models/darknet_yolov3/README.md
new file mode 100644
index 0000000..915e543
--- /dev/null
+++ b/models/darknet_yolov3/README.md
@@ -0,0 +1,29 @@
+# Pytorch darknet to caffe 
+
+Modify from [pytorch-caffe-darknet-convert](https://github.com/marvis/pytorch-caffe-darknet-convert),[object_detetction_tools](https://github.com/BingzheWu/object_detetction_tools)
+
+## Modified items :
+
+1. yolov3 output layer
+2. when pooling layer stide =1 , size =2 , assign size = 1
+3. upsample layer 
+
+## Usage : 
+
+1. Download weights from original darknet web
+2. Unmark custom_class in examples\ssd\ssd_detect.cpp
+3. Remake project
+ 
+```
+> python darknet2caffe.py yolov3.cfg yolov3.weights yolov3.prototxt yolov3.caffemodel
+> cd $caffe_root
+> sh demo_darknet_yolov3.sh
+```
+
+
+## To do list :
+
+1. verify accuracy and compare result
+2. retrain
+
+I'm not sure the result was same as darknet now , contribution is welcome
\ No newline at end of file
diff --git a/models/darknet_yolov3/darknet2caffe.py b/models/darknet_yolov3/darknet2caffe.py
new file mode 100644
index 0000000..d026bef
--- /dev/null
+++ b/models/darknet_yolov3/darknet2caffe.py
@@ -0,0 +1,466 @@
+import sys
+#sys.path.append('~/MobileNet-YOLO/caffe/python')
+import caffe
+import numpy as np
+from collections import OrderedDict
+from cfg import *
+from prototxt import *
+
+def darknet2caffe(cfgfile, weightfile, protofile, caffemodel):
+    net_info = cfg2prototxt(cfgfile)
+    save_prototxt(net_info , protofile, region=False)
+
+    net = caffe.Net(protofile, caffe.TEST)
+    params = net.params
+
+    blocks = parse_cfg(cfgfile)
+    fp = open(weightfile, "rb")  
+    header = np.fromfile(fp, dtype = np.int32, count = 5)  
+    buf = np.fromfile(fp, dtype = np.float32)
+    fp.close()
+
+    layers = []
+    layer_id = 1
+    start = 0
+    for block in blocks:
+        if start >= buf.size:
+            break
+
+        if block['type'] == 'net':
+            continue
+        elif block['type'] == 'convolutional':
+            batch_normalize = int(block['batch_normalize'])
+            if 'name' in block.keys():  
+                conv_layer_name = block['name']
+                bn_layer_name = '%s-bn' % block['name']
+                scale_layer_name = '%s-scale' % block['name']
+            else:
+                conv_layer_name = 'layer%d-conv' % layer_id
+                bn_layer_name = 'layer%d-bn' % layer_id
+                scale_layer_name = 'layer%d-scale' % layer_id
+
+            if batch_normalize:
+                start = load_conv_bn2caffe(buf, start, params[conv_layer_name], params[bn_layer_name], params[scale_layer_name])
+            else:
+                start = load_conv2caffe(buf, start, params[conv_layer_name])
+            layer_id = layer_id+1
+        elif block['type'] == 'connected':
+            if 'name' in block.keys():  
+                fc_layer_name = block['name']
+            else:
+                fc_layer_name = 'layer%d-fc' % layer_id
+            start = load_fc2caffe(buf, start, params[fc_layer_name])
+            layer_id = layer_id+1
+        elif block['type'] == 'maxpool':
+            layer_id = layer_id+1
+        elif block['type'] == 'avgpool':
+            layer_id = layer_id+1
+        elif block['type'] == 'region':
+            layer_id = layer_id + 1
+        elif block['type'] == 'route':
+            layer_id = layer_id + 1
+        elif block['type'] == 'shortcut':
+            layer_id = layer_id + 1
+        elif block['type'] == 'softmax':
+            layer_id = layer_id + 1  
+        elif block['type'] == 'cost':  
+            layer_id = layer_id + 1  
+        elif block['type'] == 'upsample':  
+            layer_id = layer_id + 1
+        elif block['type'] == 'yolo':
+            layer_id = layer_id + 1
+        else:
+            print('unknow layer type %s ' % block['type'])
+            layer_id = layer_id + 1
+    print('save prototxt to %s' % protofile)
+    save_prototxt(net_info , protofile, region=True)
+    print('save caffemodel to %s' % caffemodel)
+    net.save(caffemodel)
+
+def load_conv2caffe(buf, start, conv_param):
+    weight = conv_param[0].data
+    bias = conv_param[1].data
+    conv_param[1].data[...] = np.reshape(buf[start:start+bias.size], bias.shape);   start = start + bias.size
+    conv_param[0].data[...] = np.reshape(buf[start:start+weight.size], weight.shape); start = start + weight.size
+    return start
+
+def load_fc2caffe(buf, start, fc_param):
+    weight = fc_param[0].data
+    bias = fc_param[1].data
+    fc_param[1].data[...] = np.reshape(buf[start:start+bias.size], bias.shape);   start = start + bias.size
+    fc_param[0].data[...] = np.reshape(buf[start:start+weight.size], weight.shape); start = start + weight.size
+    return start
+
+
+def load_conv_bn2caffe(buf, start, conv_param, bn_param, scale_param):
+    conv_weight = conv_param[0].data
+    running_mean = bn_param[0].data
+    running_var = bn_param[1].data
+    scale_weight = scale_param[0].data
+    scale_bias = scale_param[1].data
+
+    scale_param[1].data[...] = np.reshape(buf[start:start+scale_bias.size], scale_bias.shape); start = start + scale_bias.size
+    scale_param[0].data[...] = np.reshape(buf[start:start+scale_weight.size], scale_weight.shape); start = start + scale_weight.size
+    bn_param[0].data[...] = np.reshape(buf[start:start+running_mean.size], running_mean.shape); start = start + running_mean.size
+    bn_param[1].data[...] = np.reshape(buf[start:start+running_var.size], running_var.shape); start = start + running_var.size
+    bn_param[2].data[...] = np.array([1.0])
+    conv_param[0].data[...] = np.reshape(buf[start:start+conv_weight.size], conv_weight.shape); start = start + conv_weight.size
+    return start
+
+def cfg2prototxt(cfgfile):
+    blocks = parse_cfg(cfgfile)
+
+    layers = []
+    props = OrderedDict() 
+    bottom = 'data'
+    layer_id = 1
+    topnames = dict()
+    yolo_count = 0
+    mask = []
+    bottom_yolo = []
+    anchors_scale = []
+    scale = 1
+    num_out = 0 
+    for block in blocks:
+        if block['type'] == 'net':
+            props['name'] = 'Darkent2Caffe'
+            props['input'] = 'data'
+            props['input_dim'] = ['1']
+            props['input_dim'].append(block['channels'])
+            props['input_dim'].append(block['height'])
+            props['input_dim'].append(block['width'])
+            continue
+        elif block['type'] == 'convolutional':
+            conv_layer = OrderedDict()
+            conv_layer['bottom'] = bottom
+            if block.has_key('name'):
+                conv_layer['top'] = block['name']
+                conv_layer['name'] = block['name']
+            else:
+                conv_layer['top'] = 'layer%d-conv' % layer_id
+                conv_layer['name'] = 'layer%d-conv' % layer_id
+            conv_layer['type'] = 'Convolution'
+            convolution_param = OrderedDict()
+            convolution_param['num_output'] = block['filters']
+            convolution_param['kernel_size'] = block['size']
+            if block['pad'] == '1':
+                convolution_param['pad'] = str(int(convolution_param['kernel_size'])/2)
+                convolution_param['pad'] = str(int(1))
+            if block['size'] == '1':
+                convolution_param['pad'] = 0
+            convolution_param['stride'] = block['stride']
+            if int(block['stride'])==2:
+                scale = scale * 2
+            if block['batch_normalize'] == '1':
+                convolution_param['bias_term'] = 'false'
+            else:
+                convolution_param['bias_term'] = 'true'
+            conv_layer['convolution_param'] = convolution_param
+            layers.append(conv_layer)
+            bottom = conv_layer['top']
+            num_out = int(block['filters'])
+            if block['batch_normalize'] == '1':
+                bn_layer = OrderedDict()
+                bn_layer['bottom'] = bottom
+                bn_layer['top'] = bottom
+                if block.has_key('name'):
+                    bn_layer['name'] = '%s-bn' % block['name']
+                else:
+                    bn_layer['name'] = 'layer%d-bn' % layer_id
+                bn_layer['type'] = 'BatchNorm'
+                batch_norm_param = OrderedDict()
+                batch_norm_param['use_global_stats'] = 'true'
+                bn_layer['batch_norm_param'] = batch_norm_param
+                layers.append(bn_layer)
+
+                scale_layer = OrderedDict()
+                scale_layer['bottom'] = bottom
+                scale_layer['top'] = bottom
+                if block.has_key('name'):
+                    scale_layer['name'] = '%s-scale' % block['name']
+                else:
+                    scale_layer['name'] = 'layer%d-scale' % layer_id
+                scale_layer['type'] = 'Scale'
+                scale_param = OrderedDict()
+                scale_param['bias_term'] = 'true'
+                scale_layer['scale_param'] = scale_param
+                layers.append(scale_layer)
+
+            if block['activation'] != 'linear':
+                relu_layer = OrderedDict()
+                relu_layer['bottom'] = bottom
+                relu_layer['top'] = bottom
+                if block.has_key('name'):
+                    relu_layer['name'] = '%s-act' % block['name']
+                else:
+                    relu_layer['name'] = 'layer%d-act' % layer_id
+                relu_layer['type'] = 'ReLU'
+                if block['activation'] == 'leaky':
+                    relu_param = OrderedDict()
+                    relu_param['negative_slope'] = '0.1'
+                    relu_layer['relu_param'] = relu_param
+                layers.append(relu_layer)
+            topnames[layer_id] = bottom
+            layer_id = layer_id+1
+        elif block['type'] == 'maxpool':
+            max_layer = OrderedDict()
+            max_layer['bottom'] = bottom
+            if block.has_key('name'):
+                max_layer['top'] = block['name']
+                max_layer['name'] = block['name']
+            else:
+                max_layer['top'] = 'layer%d-maxpool' % layer_id
+                max_layer['name'] = 'layer%d-maxpool' % layer_id
+            max_layer['type'] = 'Pooling'
+            pooling_param = OrderedDict()
+            pooling_param['kernel_size'] = block['size']
+            pooling_param['stride'] = block['stride']
+
+            pooling_param['pool'] = 'MAX'
+            if block.has_key('pad') and int(block['pad']) == 1:
+                pooling_param['pad'] = str((int(block['size'])-1)/2)
+            #if int(block['stride']) == 1 :
+            #    pooling_param['pad'] = 0
+            max_layer['pooling_param'] = pooling_param
+            layers.append(max_layer)
+            bottom = max_layer['top']
+            topnames[layer_id] = bottom
+            if int(block['stride']) == 2 :
+                scale = scale * 2
+            layer_id = layer_id+1
+        elif block['type'] == 'avgpool':
+            avg_layer = OrderedDict()
+            avg_layer['bottom'] = bottom
+            if block.has_key('name'):
+                avg_layer['top'] = block['name']
+                avg_layer['name'] = block['name']
+            else:
+                avg_layer['top'] = 'layer%d-avgpool' % layer_id
+                avg_layer['name'] = 'layer%d-avgpool' % layer_id
+            avg_layer['type'] = 'Pooling'
+            pooling_param = OrderedDict()
+            pooling_param['kernel_size'] = 7
+            pooling_param['stride'] = 1
+            pooling_param['pool'] = 'AVE'
+            avg_layer['pooling_param'] = pooling_param
+            layers.append(avg_layer)
+            bottom = avg_layer['top']
+            topnames[layer_id] = bottom
+            layer_id = layer_id+1
+        elif block['type'] == 'region':
+            if True:
+                region_layer = OrderedDict()
+                region_layer['bottom'] = bottom
+                if block.has_key('name'):
+                    region_layer['top'] = block['name']
+                    region_layer['name'] = block['name']
+                else:
+                    region_layer['top'] = 'layer%d-region' % layer_id
+                    region_layer['name'] = 'layer%d-region' % layer_id
+                region_layer['type'] = 'Region'
+                region_param = OrderedDict()
+                region_param['anchors'] = block['anchors'].strip()
+                region_param['classes'] = block['classes']
+                region_param['num'] = block['num']
+                region_layer['region_param'] = region_param
+                layers.append(region_layer)
+                bottom = region_layer['top']
+            topnames[layer_id] = bottom
+            layer_id = layer_id + 1
+        elif block['type'] == 'route':
+            route_layer = OrderedDict()
+            layer_name = str(block['layers']).split(',')
+            bottom_layer_dim = len(layer_name)
+            if (bottom_layer_dim == 1):
+                prev_layer_id = layer_id + int(block['layers'])
+                bottom = topnames[prev_layer_id]
+                #topnames[layer_id] = bottom
+                route_layer['bottom'] = bottom
+            if (bottom_layer_dim == 2):
+                layer_name = [layer_id + int(idx) if int(idx) < 0 else int(idx) + 1 for idx in layer_name ]
+                prev_layer_id1 = int(layer_name[0])
+                prev_layer_id2 = int(layer_name[1])
+                bottom1 = topnames[prev_layer_id1]
+                bottom2 = topnames[prev_layer_id2]
+                route_layer['bottom'] = [bottom1, bottom2]
+            if 'name' in block.keys():
+                route_layer['top'] = block['name']
+                route_layer['name'] = block['name']
+            else:
+                route_layer['top'] = 'layer%d-route' % layer_id
+                route_layer['name'] = 'layer%d-route' % layer_id
+            route_layer['type'] = 'Concat'
+            layers.append(route_layer)
+            bottom = route_layer['top']
+            topnames[layer_id] = bottom
+            layer_id = layer_id + 1
+        elif block['type'] == 'upsample':
+            upsample_layer = OrderedDict()
+            upsample_layer['bottom'] = bottom
+            if 'name' in block.keys():
+                upsample_layer['top'] = block['name']
+                upsample_layer['name'] = block['name']
+            else:
+                upsample_layer['top'] = 'layer%d-upsample' % layer_id
+                upsample_layer['name'] = 'layer%d-upsample' % layer_id
+            upsample_layer['type'] = 'Deconvolution'
+            convolution_param = OrderedDict()
+            convolution_param['stride'] = block['stride']
+            convolution_param['kernel_size'] = 4
+            prev_layer_id = layer_id - 4 
+            convolution_param['num_output'] = num_out
+            convolution_param['group'] = num_out
+            convolution_param['pad'] = 1
+            weight_filler = OrderedDict()
+            weight_filler['type'] = 'bilinear'
+            convolution_param['bias_term'] = 'false'
+            convolution_param['weight_filler'] = weight_filler
+            upsample_layer['convolution_param'] = convolution_param
+            layers.append(upsample_layer)
+            bottom = upsample_layer['top']
+            topnames[layer_id] = bottom
+            scale = scale /2
+            layer_id = layer_id + 1         
+        elif block['type'] == 'yolo':
+            
+            anchor_len = len(block['anchors'].split(','))/2
+            for i in block['mask'].split(',') :
+                mask.append(i)
+            #bottom_layer_dim = bottom['num_output']
+            #print(scale) 
+            #print(anchor_len)
+            anchors_scale.append(scale)
+            if len(mask)<anchor_len :
+                yolo_layer = OrderedDict()
+                yolo_layer['bottom'] = bottom
+                yolo_layer['type'] = 'Concat'
+                if 'name' in block.keys():
+                    yolo_layer['top'] = block['name']
+                    yolo_layer['name'] = block['name']
+                else:
+                    yolo_layer['top'] = 'layer%d-yolo' % layer_id
+                    yolo_layer['name'] = 'layer%d-yolo' % layer_id
+                layers.append(yolo_layer)
+                bottom = yolo_layer['top']
+                topnames[layer_id] = bottom
+                layer_id = layer_id + 1 
+                bottom_yolo.append(yolo_layer['top'])
+            else :
+                yolo_layer = OrderedDict()
+                bottom_yolo.append(bottom)
+                yolo_layer['bottom'] = bottom_yolo
+                yolo_layer['type'] = 'Yolov3DetectionOutput'
+                if 'name' in block.keys():
+                    yolo_layer['top'] = block['name']
+                    yolo_layer['name'] = block['name']
+                else:
+                    yolo_layer['top'] = 'layer%d-yolo' % layer_id
+                    yolo_layer['name'] = 'layer%d-yolo' % layer_id
+                yolov3_detection_output_param = OrderedDict()
+                yolov3_detection_output_param['nms_threshold']=0.45
+                yolov3_detection_output_param['num_classes']=block['classes']
+                yolov3_detection_output_param['biases'] = block['anchors'].split(',')
+                yolov3_detection_output_param['mask'] = mask
+                yolov3_detection_output_param['mask_group_num'] = yolo_count+1
+                yolov3_detection_output_param['anchors_scale'] = anchors_scale
+                yolo_layer['yolov3_detection_output_param'] = yolov3_detection_output_param
+                layers.append(yolo_layer)
+                bottom = yolo_layer['top']
+                topnames[layer_id] = bottom
+                layer_id = layer_id + 1    
+            yolo_count = yolo_count + 1
+        elif block['type'] == 'shortcut':
+            prev_layer_id1 = layer_id + int(block['from'])
+            prev_layer_id2 = layer_id - 1
+            bottom1 = topnames[prev_layer_id1]
+            bottom2= topnames[prev_layer_id2]
+            shortcut_layer = OrderedDict()
+            shortcut_layer['bottom'] = [bottom1, bottom2]
+            if block.has_key('name'):
+                shortcut_layer['top'] = block['name']
+                shortcut_layer['name'] = block['name']
+            else:
+                shortcut_layer['top'] = 'layer%d-shortcut' % layer_id
+                shortcut_layer['name'] = 'layer%d-shortcut' % layer_id
+            shortcut_layer['type'] = 'Eltwise'
+            eltwise_param = OrderedDict()
+            eltwise_param['operation'] = 'SUM'
+            shortcut_layer['eltwise_param'] = eltwise_param
+            layers.append(shortcut_layer)
+            bottom = shortcut_layer['top']
+ 
+            if block['activation'] != 'linear':
+                relu_layer = OrderedDict()
+                relu_layer['bottom'] = bottom
+                relu_layer['top'] = bottom
+                if block.has_key('name'):
+                    relu_layer['name'] = '%s-act' % block['name']
+                else:
+                    relu_layer['name'] = 'layer%d-act' % layer_id
+                relu_layer['type'] = 'ReLU'
+                if block['activation'] == 'leaky':
+                    relu_param = OrderedDict()
+                    relu_param['negative_slope'] = '0.1'
+                    relu_layer['relu_param'] = relu_param
+                layers.append(relu_layer)
+            topnames[layer_id] = bottom
+            layer_id = layer_id+1                
+        elif block['type'] == 'connected':
+            fc_layer = OrderedDict()
+            fc_layer['bottom'] = bottom
+            if block.has_key('name'):
+                fc_layer['top'] = block['name']
+                fc_layer['name'] = block['name']
+            else:
+                fc_layer['top'] = 'layer%d-fc' % layer_id
+                fc_layer['name'] = 'layer%d-fc' % layer_id
+            fc_layer['type'] = 'InnerProduct'
+            fc_param = OrderedDict()
+            fc_param['num_output'] = int(block['output'])
+            fc_layer['inner_product_param'] = fc_param
+            layers.append(fc_layer)
+            bottom = fc_layer['top']
+
+            if block['activation'] != 'linear':
+                relu_layer = OrderedDict()
+                relu_layer['bottom'] = bottom
+                relu_layer['top'] = bottom
+                if block.has_key('name'):
+                    relu_layer['name'] = '%s-act' % block['name']
+                else:
+                    relu_layer['name'] = 'layer%d-act' % layer_id
+                relu_layer['type'] = 'ReLU'
+                if block['activation'] == 'leaky':
+                    relu_param = OrderedDict()
+                    relu_param['negative_slope'] = '0.1'
+                    relu_layer['relu_param'] = relu_param
+                layers.append(relu_layer)
+            topnames[layer_id] = bottom
+            layer_id = layer_id+1
+        else:
+            print('unknow layer type %s ' % block['type'])
+            topnames[layer_id] = bottom
+            layer_id = layer_id + 1
+
+    net_info = OrderedDict()
+    net_info['props'] = props
+    net_info['layers'] = layers
+    return net_info
+
+if __name__ == '__main__':
+    import sys
+    if len(sys.argv) != 5:
+        print('try:')
+        print('python darknet2caffe.py tiny-yolo-voc.cfg tiny-yolo-voc.weights tiny-yolo-voc.prototxt tiny-yolo-voc.caffemodel')
+        print('')
+        print('please add name field for each block to avoid generated name')
+        exit()
+
+    cfgfile = sys.argv[1]
+    #net_info = cfg2prototxt(cfgfile)
+    #print_prototxt(net_info)
+    #save_prototxt(net_info, 'tmp.prototxt')
+    weightfile = sys.argv[2]
+    protofile = sys.argv[3]
+    caffemodel = sys.argv[4]
+    darknet2caffe(cfgfile, weightfile, protofile, caffemodel)
diff --git a/models/darknet_yolov3/tiny-yolov3.prototxt b/models/darknet_yolov3/tiny-yolov3.prototxt
new file mode 100644
index 0000000..ee17bc2
--- /dev/null
+++ b/models/darknet_yolov3/tiny-yolov3.prototxt
@@ -0,0 +1,607 @@
+name: "Darkent2Caffe"
+input: "data"
+input_dim: 1
+input_dim: 3
+input_dim: 416
+input_dim: 416
+
+layer {
+    bottom: "data"
+    top: "layer1-conv"
+    name: "layer1-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 16
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer1-conv"
+    top: "layer1-conv"
+    name: "layer1-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer1-conv"
+    top: "layer1-conv"
+    name: "layer1-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer1-conv"
+    top: "layer1-conv"
+    name: "layer1-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer1-conv"
+    top: "layer2-maxpool"
+    name: "layer2-maxpool"
+    type: "Pooling"
+    pooling_param {
+        kernel_size: 2
+        stride: 2
+        pool: MAX
+    }
+}
+layer {
+    bottom: "layer2-maxpool"
+    top: "layer3-conv"
+    name: "layer3-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 32
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer3-conv"
+    top: "layer3-conv"
+    name: "layer3-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer3-conv"
+    top: "layer3-conv"
+    name: "layer3-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer3-conv"
+    top: "layer3-conv"
+    name: "layer3-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer3-conv"
+    top: "layer4-maxpool"
+    name: "layer4-maxpool"
+    type: "Pooling"
+    pooling_param {
+        kernel_size: 2
+        stride: 2
+        pool: MAX
+    }
+}
+layer {
+    bottom: "layer4-maxpool"
+    top: "layer5-conv"
+    name: "layer5-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 64
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer5-conv"
+    top: "layer5-conv"
+    name: "layer5-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer5-conv"
+    top: "layer5-conv"
+    name: "layer5-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer5-conv"
+    top: "layer5-conv"
+    name: "layer5-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer5-conv"
+    top: "layer6-maxpool"
+    name: "layer6-maxpool"
+    type: "Pooling"
+    pooling_param {
+        kernel_size: 2
+        stride: 2
+        pool: MAX
+    }
+}
+layer {
+    bottom: "layer6-maxpool"
+    top: "layer7-conv"
+    name: "layer7-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer7-conv"
+    top: "layer7-conv"
+    name: "layer7-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer7-conv"
+    top: "layer7-conv"
+    name: "layer7-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer7-conv"
+    top: "layer7-conv"
+    name: "layer7-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer7-conv"
+    top: "layer8-maxpool"
+    name: "layer8-maxpool"
+    type: "Pooling"
+    pooling_param {
+        kernel_size: 2
+        stride: 2
+        pool: MAX
+    }
+}
+layer {
+    bottom: "layer8-maxpool"
+    top: "layer9-conv"
+    name: "layer9-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer9-conv"
+    top: "layer9-conv"
+    name: "layer9-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer9-conv"
+    top: "layer9-conv"
+    name: "layer9-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer9-conv"
+    top: "layer9-conv"
+    name: "layer9-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer9-conv"
+    top: "layer10-maxpool"
+    name: "layer10-maxpool"
+    type: "Pooling"
+    pooling_param {
+        kernel_size: 2
+        stride: 2
+        pool: MAX
+    }
+}
+layer {
+    bottom: "layer10-maxpool"
+    top: "layer11-conv"
+    name: "layer11-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer11-conv"
+    top: "layer11-conv"
+    name: "layer11-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer11-conv"
+    top: "layer11-conv"
+    name: "layer11-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer11-conv"
+    top: "layer11-conv"
+    name: "layer11-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer11-conv"
+    top: "layer12-maxpool"
+    name: "layer12-maxpool"
+    type: "Pooling"
+    pooling_param {
+        kernel_size: 1
+        stride: 1
+        pool: MAX
+    }
+}
+layer {
+    bottom: "layer12-maxpool"
+    top: "layer13-conv"
+    name: "layer13-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 1024
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer13-conv"
+    top: "layer13-conv"
+    name: "layer13-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer13-conv"
+    top: "layer13-conv"
+    name: "layer13-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer13-conv"
+    top: "layer13-conv"
+    name: "layer13-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer13-conv"
+    top: "layer14-conv"
+    name: "layer14-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer14-conv"
+    top: "layer14-conv"
+    name: "layer14-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer14-conv"
+    top: "layer14-conv"
+    name: "layer14-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer14-conv"
+    top: "layer14-conv"
+    name: "layer14-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer14-conv"
+    top: "layer15-conv"
+    name: "layer15-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer15-conv"
+    top: "layer15-conv"
+    name: "layer15-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer15-conv"
+    top: "layer15-conv"
+    name: "layer15-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer15-conv"
+    top: "layer15-conv"
+    name: "layer15-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer15-conv"
+    top: "layer16-conv"
+    name: "layer16-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 255
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer16-conv"
+    type: "Concat"
+    top: "layer17-yolo"
+    name: "layer17-yolo"
+}
+layer {
+    bottom: "layer14-conv"
+    top: "layer18-route"
+    name: "layer18-route"
+    type: "Concat"
+}
+layer {
+    bottom: "layer18-route"
+    top: "layer19-conv"
+    name: "layer19-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer19-conv"
+    top: "layer19-conv"
+    name: "layer19-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer19-conv"
+    top: "layer19-conv"
+    name: "layer19-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer19-conv"
+    top: "layer19-conv"
+    name: "layer19-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer19-conv"
+    top: "layer20-upsample"
+    name: "layer20-upsample"
+    type: "Deconvolution"
+    convolution_param {
+        stride: 2
+        kernel_size: 4
+        num_output: 128
+        group: 128
+        pad: 1
+        bias_term: false
+        weight_filler {
+            type: "bilinear"
+        }
+    }
+}
+layer {
+    bottom: "layer20-upsample"
+    bottom: "layer9-conv"
+    top: "layer21-route"
+    name: "layer21-route"
+    type: "Concat"
+}
+layer {
+    bottom: "layer21-route"
+    top: "layer22-conv"
+    name: "layer22-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer22-conv"
+    top: "layer22-conv"
+    name: "layer22-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer22-conv"
+    top: "layer22-conv"
+    name: "layer22-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer22-conv"
+    top: "layer22-conv"
+    name: "layer22-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer22-conv"
+    top: "layer23-conv"
+    name: "layer23-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 255
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer17-yolo"
+    bottom: "layer23-conv"
+    type: "Yolov3DetectionOutput"
+    top: "layer24-yolo"
+    name: "layer24-yolo"
+    yolov3_detection_output_param {
+        nms_threshold: 0.45
+        num_classes: 80
+        biases: 10
+        biases: 14
+        biases: 23
+        biases: 27
+        biases: 37
+        biases: 58
+        biases: 81
+        biases: 82
+        biases: 135
+        biases: 169
+        biases: 344
+        biases: 319
+        mask: 3
+        mask: 4
+        mask: 5
+        mask: 0
+        mask: 1
+        mask: 2
+        mask_group_num: 2
+        anchors_scale: 32
+        anchors_scale: 16
+    }
+}
diff --git a/models/darknet_yolov3/yolov3-tiny.cfg b/models/darknet_yolov3/yolov3-tiny.cfg
new file mode 100644
index 0000000..ab52dd6
--- /dev/null
+++ b/models/darknet_yolov3/yolov3-tiny.cfg
@@ -0,0 +1,182 @@
+[net]
+# Testing
+batch=1
+subdivisions=1
+# Training
+# batch=64
+# subdivisions=2
+width=416
+height=416
+channels=3
+momentum=0.9
+decay=0.0005
+angle=0
+saturation = 1.5
+exposure = 1.5
+hue=.1
+
+learning_rate=0.001
+burn_in=1000
+max_batches = 500200
+policy=steps
+steps=400000,450000
+scales=.1,.1
+
+[convolutional]
+batch_normalize=1
+filters=16
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[maxpool]
+size=2
+stride=2
+
+[convolutional]
+batch_normalize=1
+filters=32
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[maxpool]
+size=2
+stride=2
+
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[maxpool]
+size=2
+stride=2
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[maxpool]
+size=2
+stride=2
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[maxpool]
+size=2
+stride=2
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[maxpool]
+size=1
+stride=1
+
+[convolutional]
+batch_normalize=1
+filters=1024
+size=3
+stride=1
+pad=1
+activation=leaky
+
+###########
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+
+
+
+[yolo]
+mask = 3,4,5
+anchors = 10,14,23,27,37,58,81,82,135,169,344,319
+classes=80
+num=6
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+
+[route]
+layers = -4
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[upsample]
+stride=2
+
+[route]
+layers = -1, 8
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+
+[yolo]
+mask = 0,1,2
+anchors = 10,14,23,27,37,58,81,82,135,169,344,319
+classes=80
+num=6
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
\ No newline at end of file
diff --git a/models/darknet_yolov3/yolov3.cfg b/models/darknet_yolov3/yolov3.cfg
new file mode 100644
index 0000000..7e9e819
--- /dev/null
+++ b/models/darknet_yolov3/yolov3.cfg
@@ -0,0 +1,788 @@
+[net]
+# Testing
+# batch=1
+# subdivisions=1
+# Training
+batch=64
+subdivisions=16
+width=608
+height=608
+channels=3
+momentum=0.9
+decay=0.0005
+angle=0
+saturation = 1.5
+exposure = 1.5
+hue=.1
+
+learning_rate=0.001
+burn_in=1000
+max_batches = 500200
+policy=steps
+steps=400000,450000
+scales=.1,.1
+
+[convolutional]
+batch_normalize=1
+filters=32
+size=3
+stride=1
+pad=1
+activation=leaky
+
+# Downsample
+
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=2
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=32
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+# Downsample
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=2
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+# Downsample
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=2
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+# Downsample
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=2
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+# Downsample
+
+[convolutional]
+batch_normalize=1
+filters=1024
+size=3
+stride=2
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=1024
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=1024
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=1024
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=1024
+size=3
+stride=1
+pad=1
+activation=leaky
+
+[shortcut]
+from=-3
+activation=linear
+
+######################
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1024
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1024
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1024
+activation=leaky
+
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+
+
+[yolo]
+mask = 6,7,8
+anchors = 10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+
+
+[route]
+layers = -4
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[upsample]
+stride=2
+
+[route]
+layers = -1, 61
+
+
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=leaky
+
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+
+
+[yolo]
+mask = 3,4,5
+anchors = 10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+
+
+
+[route]
+layers = -4
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[upsample]
+stride=2
+
+[route]
+layers = -1, 36
+
+
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=leaky
+
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=leaky
+
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+
+
+[yolo]
+mask = 0,1,2
+anchors = 10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
diff --git a/models/darknet_yolov3/yolov3.prototxt b/models/darknet_yolov3/yolov3.prototxt
new file mode 100644
index 0000000..5915271
--- /dev/null
+++ b/models/darknet_yolov3/yolov3.prototxt
@@ -0,0 +1,3271 @@
+name: "Darkent2Caffe"
+input: "data"
+input_dim: 1
+input_dim: 3
+input_dim: 608
+input_dim: 608
+
+layer {
+    bottom: "data"
+    top: "layer1-conv"
+    name: "layer1-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 32
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer1-conv"
+    top: "layer1-conv"
+    name: "layer1-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer1-conv"
+    top: "layer1-conv"
+    name: "layer1-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer1-conv"
+    top: "layer1-conv"
+    name: "layer1-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer1-conv"
+    top: "layer2-conv"
+    name: "layer2-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 64
+        kernel_size: 3
+        pad: 1
+        stride: 2
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer2-conv"
+    top: "layer2-conv"
+    name: "layer2-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer2-conv"
+    top: "layer2-conv"
+    name: "layer2-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer2-conv"
+    top: "layer2-conv"
+    name: "layer2-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer2-conv"
+    top: "layer3-conv"
+    name: "layer3-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 32
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer3-conv"
+    top: "layer3-conv"
+    name: "layer3-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer3-conv"
+    top: "layer3-conv"
+    name: "layer3-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer3-conv"
+    top: "layer3-conv"
+    name: "layer3-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer3-conv"
+    top: "layer4-conv"
+    name: "layer4-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 64
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer4-conv"
+    top: "layer4-conv"
+    name: "layer4-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer4-conv"
+    top: "layer4-conv"
+    name: "layer4-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer4-conv"
+    top: "layer4-conv"
+    name: "layer4-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer2-conv"
+    bottom: "layer4-conv"
+    top: "layer5-shortcut"
+    name: "layer5-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer5-shortcut"
+    top: "layer6-conv"
+    name: "layer6-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 3
+        pad: 1
+        stride: 2
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer6-conv"
+    top: "layer6-conv"
+    name: "layer6-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer6-conv"
+    top: "layer6-conv"
+    name: "layer6-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer6-conv"
+    top: "layer6-conv"
+    name: "layer6-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer6-conv"
+    top: "layer7-conv"
+    name: "layer7-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 64
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer7-conv"
+    top: "layer7-conv"
+    name: "layer7-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer7-conv"
+    top: "layer7-conv"
+    name: "layer7-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer7-conv"
+    top: "layer7-conv"
+    name: "layer7-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer7-conv"
+    top: "layer8-conv"
+    name: "layer8-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer8-conv"
+    top: "layer8-conv"
+    name: "layer8-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer8-conv"
+    top: "layer8-conv"
+    name: "layer8-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer8-conv"
+    top: "layer8-conv"
+    name: "layer8-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer6-conv"
+    bottom: "layer8-conv"
+    top: "layer9-shortcut"
+    name: "layer9-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer9-shortcut"
+    top: "layer10-conv"
+    name: "layer10-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 64
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer10-conv"
+    top: "layer10-conv"
+    name: "layer10-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer10-conv"
+    top: "layer10-conv"
+    name: "layer10-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer10-conv"
+    top: "layer10-conv"
+    name: "layer10-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer10-conv"
+    top: "layer11-conv"
+    name: "layer11-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer11-conv"
+    top: "layer11-conv"
+    name: "layer11-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer11-conv"
+    top: "layer11-conv"
+    name: "layer11-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer11-conv"
+    top: "layer11-conv"
+    name: "layer11-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer9-shortcut"
+    bottom: "layer11-conv"
+    top: "layer12-shortcut"
+    name: "layer12-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer12-shortcut"
+    top: "layer13-conv"
+    name: "layer13-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 2
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer13-conv"
+    top: "layer13-conv"
+    name: "layer13-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer13-conv"
+    top: "layer13-conv"
+    name: "layer13-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer13-conv"
+    top: "layer13-conv"
+    name: "layer13-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer13-conv"
+    top: "layer14-conv"
+    name: "layer14-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer14-conv"
+    top: "layer14-conv"
+    name: "layer14-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer14-conv"
+    top: "layer14-conv"
+    name: "layer14-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer14-conv"
+    top: "layer14-conv"
+    name: "layer14-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer14-conv"
+    top: "layer15-conv"
+    name: "layer15-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer15-conv"
+    top: "layer15-conv"
+    name: "layer15-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer15-conv"
+    top: "layer15-conv"
+    name: "layer15-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer15-conv"
+    top: "layer15-conv"
+    name: "layer15-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer13-conv"
+    bottom: "layer15-conv"
+    top: "layer16-shortcut"
+    name: "layer16-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer16-shortcut"
+    top: "layer17-conv"
+    name: "layer17-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer17-conv"
+    top: "layer17-conv"
+    name: "layer17-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer17-conv"
+    top: "layer17-conv"
+    name: "layer17-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer17-conv"
+    top: "layer17-conv"
+    name: "layer17-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer17-conv"
+    top: "layer18-conv"
+    name: "layer18-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer18-conv"
+    top: "layer18-conv"
+    name: "layer18-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer18-conv"
+    top: "layer18-conv"
+    name: "layer18-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer18-conv"
+    top: "layer18-conv"
+    name: "layer18-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer16-shortcut"
+    bottom: "layer18-conv"
+    top: "layer19-shortcut"
+    name: "layer19-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer19-shortcut"
+    top: "layer20-conv"
+    name: "layer20-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer20-conv"
+    top: "layer20-conv"
+    name: "layer20-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer20-conv"
+    top: "layer20-conv"
+    name: "layer20-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer20-conv"
+    top: "layer20-conv"
+    name: "layer20-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer20-conv"
+    top: "layer21-conv"
+    name: "layer21-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer21-conv"
+    top: "layer21-conv"
+    name: "layer21-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer21-conv"
+    top: "layer21-conv"
+    name: "layer21-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer21-conv"
+    top: "layer21-conv"
+    name: "layer21-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer19-shortcut"
+    bottom: "layer21-conv"
+    top: "layer22-shortcut"
+    name: "layer22-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer22-shortcut"
+    top: "layer23-conv"
+    name: "layer23-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer23-conv"
+    top: "layer23-conv"
+    name: "layer23-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer23-conv"
+    top: "layer23-conv"
+    name: "layer23-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer23-conv"
+    top: "layer23-conv"
+    name: "layer23-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer23-conv"
+    top: "layer24-conv"
+    name: "layer24-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer24-conv"
+    top: "layer24-conv"
+    name: "layer24-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer24-conv"
+    top: "layer24-conv"
+    name: "layer24-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer24-conv"
+    top: "layer24-conv"
+    name: "layer24-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer22-shortcut"
+    bottom: "layer24-conv"
+    top: "layer25-shortcut"
+    name: "layer25-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer25-shortcut"
+    top: "layer26-conv"
+    name: "layer26-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer26-conv"
+    top: "layer26-conv"
+    name: "layer26-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer26-conv"
+    top: "layer26-conv"
+    name: "layer26-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer26-conv"
+    top: "layer26-conv"
+    name: "layer26-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer26-conv"
+    top: "layer27-conv"
+    name: "layer27-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer27-conv"
+    top: "layer27-conv"
+    name: "layer27-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer27-conv"
+    top: "layer27-conv"
+    name: "layer27-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer27-conv"
+    top: "layer27-conv"
+    name: "layer27-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer25-shortcut"
+    bottom: "layer27-conv"
+    top: "layer28-shortcut"
+    name: "layer28-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer28-shortcut"
+    top: "layer29-conv"
+    name: "layer29-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer29-conv"
+    top: "layer29-conv"
+    name: "layer29-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer29-conv"
+    top: "layer29-conv"
+    name: "layer29-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer29-conv"
+    top: "layer29-conv"
+    name: "layer29-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer29-conv"
+    top: "layer30-conv"
+    name: "layer30-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer30-conv"
+    top: "layer30-conv"
+    name: "layer30-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer30-conv"
+    top: "layer30-conv"
+    name: "layer30-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer30-conv"
+    top: "layer30-conv"
+    name: "layer30-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer28-shortcut"
+    bottom: "layer30-conv"
+    top: "layer31-shortcut"
+    name: "layer31-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer31-shortcut"
+    top: "layer32-conv"
+    name: "layer32-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer32-conv"
+    top: "layer32-conv"
+    name: "layer32-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer32-conv"
+    top: "layer32-conv"
+    name: "layer32-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer32-conv"
+    top: "layer32-conv"
+    name: "layer32-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer32-conv"
+    top: "layer33-conv"
+    name: "layer33-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer33-conv"
+    top: "layer33-conv"
+    name: "layer33-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer33-conv"
+    top: "layer33-conv"
+    name: "layer33-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer33-conv"
+    top: "layer33-conv"
+    name: "layer33-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer31-shortcut"
+    bottom: "layer33-conv"
+    top: "layer34-shortcut"
+    name: "layer34-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer34-shortcut"
+    top: "layer35-conv"
+    name: "layer35-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer35-conv"
+    top: "layer35-conv"
+    name: "layer35-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer35-conv"
+    top: "layer35-conv"
+    name: "layer35-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer35-conv"
+    top: "layer35-conv"
+    name: "layer35-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer35-conv"
+    top: "layer36-conv"
+    name: "layer36-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer36-conv"
+    top: "layer36-conv"
+    name: "layer36-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer36-conv"
+    top: "layer36-conv"
+    name: "layer36-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer36-conv"
+    top: "layer36-conv"
+    name: "layer36-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer34-shortcut"
+    bottom: "layer36-conv"
+    top: "layer37-shortcut"
+    name: "layer37-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer37-shortcut"
+    top: "layer38-conv"
+    name: "layer38-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 2
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer38-conv"
+    top: "layer38-conv"
+    name: "layer38-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer38-conv"
+    top: "layer38-conv"
+    name: "layer38-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer38-conv"
+    top: "layer38-conv"
+    name: "layer38-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer38-conv"
+    top: "layer39-conv"
+    name: "layer39-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer39-conv"
+    top: "layer39-conv"
+    name: "layer39-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer39-conv"
+    top: "layer39-conv"
+    name: "layer39-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer39-conv"
+    top: "layer39-conv"
+    name: "layer39-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer39-conv"
+    top: "layer40-conv"
+    name: "layer40-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer40-conv"
+    top: "layer40-conv"
+    name: "layer40-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer40-conv"
+    top: "layer40-conv"
+    name: "layer40-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer40-conv"
+    top: "layer40-conv"
+    name: "layer40-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer38-conv"
+    bottom: "layer40-conv"
+    top: "layer41-shortcut"
+    name: "layer41-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer41-shortcut"
+    top: "layer42-conv"
+    name: "layer42-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer42-conv"
+    top: "layer42-conv"
+    name: "layer42-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer42-conv"
+    top: "layer42-conv"
+    name: "layer42-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer42-conv"
+    top: "layer42-conv"
+    name: "layer42-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer42-conv"
+    top: "layer43-conv"
+    name: "layer43-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer43-conv"
+    top: "layer43-conv"
+    name: "layer43-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer43-conv"
+    top: "layer43-conv"
+    name: "layer43-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer43-conv"
+    top: "layer43-conv"
+    name: "layer43-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer41-shortcut"
+    bottom: "layer43-conv"
+    top: "layer44-shortcut"
+    name: "layer44-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer44-shortcut"
+    top: "layer45-conv"
+    name: "layer45-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer45-conv"
+    top: "layer45-conv"
+    name: "layer45-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer45-conv"
+    top: "layer45-conv"
+    name: "layer45-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer45-conv"
+    top: "layer45-conv"
+    name: "layer45-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer45-conv"
+    top: "layer46-conv"
+    name: "layer46-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer46-conv"
+    top: "layer46-conv"
+    name: "layer46-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer46-conv"
+    top: "layer46-conv"
+    name: "layer46-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer46-conv"
+    top: "layer46-conv"
+    name: "layer46-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer44-shortcut"
+    bottom: "layer46-conv"
+    top: "layer47-shortcut"
+    name: "layer47-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer47-shortcut"
+    top: "layer48-conv"
+    name: "layer48-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer48-conv"
+    top: "layer48-conv"
+    name: "layer48-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer48-conv"
+    top: "layer48-conv"
+    name: "layer48-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer48-conv"
+    top: "layer48-conv"
+    name: "layer48-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer48-conv"
+    top: "layer49-conv"
+    name: "layer49-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer49-conv"
+    top: "layer49-conv"
+    name: "layer49-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer49-conv"
+    top: "layer49-conv"
+    name: "layer49-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer49-conv"
+    top: "layer49-conv"
+    name: "layer49-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer47-shortcut"
+    bottom: "layer49-conv"
+    top: "layer50-shortcut"
+    name: "layer50-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer50-shortcut"
+    top: "layer51-conv"
+    name: "layer51-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer51-conv"
+    top: "layer51-conv"
+    name: "layer51-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer51-conv"
+    top: "layer51-conv"
+    name: "layer51-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer51-conv"
+    top: "layer51-conv"
+    name: "layer51-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer51-conv"
+    top: "layer52-conv"
+    name: "layer52-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer52-conv"
+    top: "layer52-conv"
+    name: "layer52-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer52-conv"
+    top: "layer52-conv"
+    name: "layer52-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer52-conv"
+    top: "layer52-conv"
+    name: "layer52-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer50-shortcut"
+    bottom: "layer52-conv"
+    top: "layer53-shortcut"
+    name: "layer53-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer53-shortcut"
+    top: "layer54-conv"
+    name: "layer54-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer54-conv"
+    top: "layer54-conv"
+    name: "layer54-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer54-conv"
+    top: "layer54-conv"
+    name: "layer54-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer54-conv"
+    top: "layer54-conv"
+    name: "layer54-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer54-conv"
+    top: "layer55-conv"
+    name: "layer55-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer55-conv"
+    top: "layer55-conv"
+    name: "layer55-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer55-conv"
+    top: "layer55-conv"
+    name: "layer55-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer55-conv"
+    top: "layer55-conv"
+    name: "layer55-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer53-shortcut"
+    bottom: "layer55-conv"
+    top: "layer56-shortcut"
+    name: "layer56-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer56-shortcut"
+    top: "layer57-conv"
+    name: "layer57-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer57-conv"
+    top: "layer57-conv"
+    name: "layer57-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer57-conv"
+    top: "layer57-conv"
+    name: "layer57-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer57-conv"
+    top: "layer57-conv"
+    name: "layer57-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer57-conv"
+    top: "layer58-conv"
+    name: "layer58-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer58-conv"
+    top: "layer58-conv"
+    name: "layer58-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer58-conv"
+    top: "layer58-conv"
+    name: "layer58-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer58-conv"
+    top: "layer58-conv"
+    name: "layer58-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer56-shortcut"
+    bottom: "layer58-conv"
+    top: "layer59-shortcut"
+    name: "layer59-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer59-shortcut"
+    top: "layer60-conv"
+    name: "layer60-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer60-conv"
+    top: "layer60-conv"
+    name: "layer60-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer60-conv"
+    top: "layer60-conv"
+    name: "layer60-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer60-conv"
+    top: "layer60-conv"
+    name: "layer60-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer60-conv"
+    top: "layer61-conv"
+    name: "layer61-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer61-conv"
+    top: "layer61-conv"
+    name: "layer61-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer61-conv"
+    top: "layer61-conv"
+    name: "layer61-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer61-conv"
+    top: "layer61-conv"
+    name: "layer61-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer59-shortcut"
+    bottom: "layer61-conv"
+    top: "layer62-shortcut"
+    name: "layer62-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer62-shortcut"
+    top: "layer63-conv"
+    name: "layer63-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 1024
+        kernel_size: 3
+        pad: 1
+        stride: 2
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer63-conv"
+    top: "layer63-conv"
+    name: "layer63-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer63-conv"
+    top: "layer63-conv"
+    name: "layer63-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer63-conv"
+    top: "layer63-conv"
+    name: "layer63-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer63-conv"
+    top: "layer64-conv"
+    name: "layer64-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer64-conv"
+    top: "layer64-conv"
+    name: "layer64-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer64-conv"
+    top: "layer64-conv"
+    name: "layer64-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer64-conv"
+    top: "layer64-conv"
+    name: "layer64-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer64-conv"
+    top: "layer65-conv"
+    name: "layer65-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 1024
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer65-conv"
+    top: "layer65-conv"
+    name: "layer65-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer65-conv"
+    top: "layer65-conv"
+    name: "layer65-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer65-conv"
+    top: "layer65-conv"
+    name: "layer65-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer63-conv"
+    bottom: "layer65-conv"
+    top: "layer66-shortcut"
+    name: "layer66-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer66-shortcut"
+    top: "layer67-conv"
+    name: "layer67-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer67-conv"
+    top: "layer67-conv"
+    name: "layer67-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer67-conv"
+    top: "layer67-conv"
+    name: "layer67-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer67-conv"
+    top: "layer67-conv"
+    name: "layer67-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer67-conv"
+    top: "layer68-conv"
+    name: "layer68-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 1024
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer68-conv"
+    top: "layer68-conv"
+    name: "layer68-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer68-conv"
+    top: "layer68-conv"
+    name: "layer68-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer68-conv"
+    top: "layer68-conv"
+    name: "layer68-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer66-shortcut"
+    bottom: "layer68-conv"
+    top: "layer69-shortcut"
+    name: "layer69-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer69-shortcut"
+    top: "layer70-conv"
+    name: "layer70-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer70-conv"
+    top: "layer70-conv"
+    name: "layer70-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer70-conv"
+    top: "layer70-conv"
+    name: "layer70-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer70-conv"
+    top: "layer70-conv"
+    name: "layer70-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer70-conv"
+    top: "layer71-conv"
+    name: "layer71-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 1024
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer71-conv"
+    top: "layer71-conv"
+    name: "layer71-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer71-conv"
+    top: "layer71-conv"
+    name: "layer71-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer71-conv"
+    top: "layer71-conv"
+    name: "layer71-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer69-shortcut"
+    bottom: "layer71-conv"
+    top: "layer72-shortcut"
+    name: "layer72-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer72-shortcut"
+    top: "layer73-conv"
+    name: "layer73-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer73-conv"
+    top: "layer73-conv"
+    name: "layer73-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer73-conv"
+    top: "layer73-conv"
+    name: "layer73-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer73-conv"
+    top: "layer73-conv"
+    name: "layer73-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer73-conv"
+    top: "layer74-conv"
+    name: "layer74-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 1024
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer74-conv"
+    top: "layer74-conv"
+    name: "layer74-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer74-conv"
+    top: "layer74-conv"
+    name: "layer74-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer74-conv"
+    top: "layer74-conv"
+    name: "layer74-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer72-shortcut"
+    bottom: "layer74-conv"
+    top: "layer75-shortcut"
+    name: "layer75-shortcut"
+    type: "Eltwise"
+    eltwise_param {
+        operation: SUM
+    }
+}
+layer {
+    bottom: "layer75-shortcut"
+    top: "layer76-conv"
+    name: "layer76-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer76-conv"
+    top: "layer76-conv"
+    name: "layer76-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer76-conv"
+    top: "layer76-conv"
+    name: "layer76-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer76-conv"
+    top: "layer76-conv"
+    name: "layer76-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer76-conv"
+    top: "layer77-conv"
+    name: "layer77-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 1024
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer77-conv"
+    top: "layer77-conv"
+    name: "layer77-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer77-conv"
+    top: "layer77-conv"
+    name: "layer77-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer77-conv"
+    top: "layer77-conv"
+    name: "layer77-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer77-conv"
+    top: "layer78-conv"
+    name: "layer78-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer78-conv"
+    top: "layer78-conv"
+    name: "layer78-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer78-conv"
+    top: "layer78-conv"
+    name: "layer78-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer78-conv"
+    top: "layer78-conv"
+    name: "layer78-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer78-conv"
+    top: "layer79-conv"
+    name: "layer79-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 1024
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer79-conv"
+    top: "layer79-conv"
+    name: "layer79-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer79-conv"
+    top: "layer79-conv"
+    name: "layer79-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer79-conv"
+    top: "layer79-conv"
+    name: "layer79-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer79-conv"
+    top: "layer80-conv"
+    name: "layer80-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer80-conv"
+    top: "layer80-conv"
+    name: "layer80-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer80-conv"
+    top: "layer80-conv"
+    name: "layer80-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer80-conv"
+    top: "layer80-conv"
+    name: "layer80-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer80-conv"
+    top: "layer81-conv"
+    name: "layer81-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 1024
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer81-conv"
+    top: "layer81-conv"
+    name: "layer81-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer81-conv"
+    top: "layer81-conv"
+    name: "layer81-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer81-conv"
+    top: "layer81-conv"
+    name: "layer81-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer81-conv"
+    top: "layer82-conv"
+    name: "layer82-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 255
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer82-conv"
+    type: "Concat"
+    top: "layer83-yolo"
+    name: "layer83-yolo"
+}
+layer {
+    bottom: "layer80-conv"
+    top: "layer84-route"
+    name: "layer84-route"
+    type: "Concat"
+}
+layer {
+    bottom: "layer84-route"
+    top: "layer85-conv"
+    name: "layer85-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer85-conv"
+    top: "layer85-conv"
+    name: "layer85-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer85-conv"
+    top: "layer85-conv"
+    name: "layer85-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer85-conv"
+    top: "layer85-conv"
+    name: "layer85-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer85-conv"
+    top: "layer86-upsample"
+    name: "layer86-upsample"
+    type: "Deconvolution"
+    convolution_param {
+        stride: 2
+        kernel_size: 4
+        num_output: 256
+        group: 256
+        pad: 1
+        bias_term: false
+        weight_filler {
+            type: "bilinear"
+        }
+    }
+}
+layer {
+    bottom: "layer86-upsample"
+    bottom: "layer62-shortcut"
+    top: "layer87-route"
+    name: "layer87-route"
+    type: "Concat"
+}
+layer {
+    bottom: "layer87-route"
+    top: "layer88-conv"
+    name: "layer88-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer88-conv"
+    top: "layer88-conv"
+    name: "layer88-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer88-conv"
+    top: "layer88-conv"
+    name: "layer88-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer88-conv"
+    top: "layer88-conv"
+    name: "layer88-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer88-conv"
+    top: "layer89-conv"
+    name: "layer89-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer89-conv"
+    top: "layer89-conv"
+    name: "layer89-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer89-conv"
+    top: "layer89-conv"
+    name: "layer89-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer89-conv"
+    top: "layer89-conv"
+    name: "layer89-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer89-conv"
+    top: "layer90-conv"
+    name: "layer90-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer90-conv"
+    top: "layer90-conv"
+    name: "layer90-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer90-conv"
+    top: "layer90-conv"
+    name: "layer90-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer90-conv"
+    top: "layer90-conv"
+    name: "layer90-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer90-conv"
+    top: "layer91-conv"
+    name: "layer91-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer91-conv"
+    top: "layer91-conv"
+    name: "layer91-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer91-conv"
+    top: "layer91-conv"
+    name: "layer91-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer91-conv"
+    top: "layer91-conv"
+    name: "layer91-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer91-conv"
+    top: "layer92-conv"
+    name: "layer92-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer92-conv"
+    top: "layer92-conv"
+    name: "layer92-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer92-conv"
+    top: "layer92-conv"
+    name: "layer92-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer92-conv"
+    top: "layer92-conv"
+    name: "layer92-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer92-conv"
+    top: "layer93-conv"
+    name: "layer93-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 512
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer93-conv"
+    top: "layer93-conv"
+    name: "layer93-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer93-conv"
+    top: "layer93-conv"
+    name: "layer93-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer93-conv"
+    top: "layer93-conv"
+    name: "layer93-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer93-conv"
+    top: "layer94-conv"
+    name: "layer94-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 255
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer94-conv"
+    type: "Concat"
+    top: "layer95-yolo"
+    name: "layer95-yolo"
+}
+layer {
+    bottom: "layer92-conv"
+    top: "layer96-route"
+    name: "layer96-route"
+    type: "Concat"
+}
+layer {
+    bottom: "layer96-route"
+    top: "layer97-conv"
+    name: "layer97-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer97-conv"
+    top: "layer97-conv"
+    name: "layer97-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer97-conv"
+    top: "layer97-conv"
+    name: "layer97-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer97-conv"
+    top: "layer97-conv"
+    name: "layer97-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer97-conv"
+    top: "layer98-upsample"
+    name: "layer98-upsample"
+    type: "Deconvolution"
+    convolution_param {
+        stride: 2
+        kernel_size: 4
+        num_output: 128
+        group: 128
+        pad: 1
+        bias_term: false
+        weight_filler {
+            type: "bilinear"
+        }
+    }
+}
+layer {
+    bottom: "layer98-upsample"
+    bottom: "layer37-shortcut"
+    top: "layer99-route"
+    name: "layer99-route"
+    type: "Concat"
+}
+layer {
+    bottom: "layer99-route"
+    top: "layer100-conv"
+    name: "layer100-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer100-conv"
+    top: "layer100-conv"
+    name: "layer100-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer100-conv"
+    top: "layer100-conv"
+    name: "layer100-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer100-conv"
+    top: "layer100-conv"
+    name: "layer100-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer100-conv"
+    top: "layer101-conv"
+    name: "layer101-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer101-conv"
+    top: "layer101-conv"
+    name: "layer101-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer101-conv"
+    top: "layer101-conv"
+    name: "layer101-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer101-conv"
+    top: "layer101-conv"
+    name: "layer101-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer101-conv"
+    top: "layer102-conv"
+    name: "layer102-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer102-conv"
+    top: "layer102-conv"
+    name: "layer102-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer102-conv"
+    top: "layer102-conv"
+    name: "layer102-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer102-conv"
+    top: "layer102-conv"
+    name: "layer102-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer102-conv"
+    top: "layer103-conv"
+    name: "layer103-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer103-conv"
+    top: "layer103-conv"
+    name: "layer103-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer103-conv"
+    top: "layer103-conv"
+    name: "layer103-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer103-conv"
+    top: "layer103-conv"
+    name: "layer103-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer103-conv"
+    top: "layer104-conv"
+    name: "layer104-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 128
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer104-conv"
+    top: "layer104-conv"
+    name: "layer104-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer104-conv"
+    top: "layer104-conv"
+    name: "layer104-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer104-conv"
+    top: "layer104-conv"
+    name: "layer104-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer104-conv"
+    top: "layer105-conv"
+    name: "layer105-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 256
+        kernel_size: 3
+        pad: 1
+        stride: 1
+        bias_term: false
+    }
+}
+layer {
+    bottom: "layer105-conv"
+    top: "layer105-conv"
+    name: "layer105-bn"
+    type: "BatchNorm"
+    batch_norm_param {
+        use_global_stats: true
+    }
+}
+layer {
+    bottom: "layer105-conv"
+    top: "layer105-conv"
+    name: "layer105-scale"
+    type: "Scale"
+    scale_param {
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer105-conv"
+    top: "layer105-conv"
+    name: "layer105-act"
+    type: "ReLU"
+    relu_param {
+        negative_slope: 0.1
+    }
+}
+layer {
+    bottom: "layer105-conv"
+    top: "layer106-conv"
+    name: "layer106-conv"
+    type: "Convolution"
+    convolution_param {
+        num_output: 255
+        kernel_size: 1
+        pad: 0
+        stride: 1
+        bias_term: true
+    }
+}
+layer {
+    bottom: "layer83-yolo"
+    bottom: "layer95-yolo"
+    bottom: "layer106-conv"
+    type: "Yolov3DetectionOutput"
+    top: "layer107-yolo"
+    name: "layer107-yolo"
+    yolov3_detection_output_param {
+        nms_threshold: 0.45
+        num_classes: 80
+        biases: 10
+        biases: 13
+        biases: 16
+        biases: 30
+        biases: 33
+        biases: 23
+        biases: 30
+        biases: 61
+        biases: 62
+        biases: 45
+        biases: 59
+        biases: 119
+        biases: 116
+        biases: 90
+        biases: 156
+        biases: 198
+        biases: 373
+        biases: 326
+        mask: 6
+        mask: 7
+        mask: 8
+        mask: 3
+        mask: 4
+        mask: 5
+        mask: 0
+        mask: 1
+        mask: 2
+        mask_group_num: 3
+        anchors_scale: 32
+        anchors_scale: 16
+        anchors_scale: 8
+    }
+}