image-demo.py

import sys
import cv2
import numpy as np
import traceback
# keras 放在这里太尼玛重要了，否则会导致load_model加载不成功，报h5py Invalid high library version bound的错误，
# 此错误与下面 darknet.python.darknet 的引入有关
import keras   

import darknet.python.darknet as dn

from src.label 				import Label, lwrite, dknet_label_conversion
from os.path 				import splitext, basename, isdir
from os 					import makedirs
from src.utils 				import crop_region, image_files_from_folder, im2single, nms
from darknet.python.darknet import detect, load_image, nparray_to_image

from src.keras_utils 			import load_model, detect_lp
from src.label 					import Shape, writeShapes
from src.drawing_utils			import draw_label, draw_losangle, write2img


YELLOW = (  0,255,255)
RED    = (  0,  0,255) 


if __name__ == '__main__':

	try:
		print('Start demo \t')
	
		input_image_path  = '/home/yaokun/data/03016.jpg'#sys.argv[1]
		input_image = input_image_path.encode('ascii')
		output_dir = '/home/yaokun/tmp'#sys.argv[2]

		bname = basename(splitext(input_image_path)[0])


		# vehicle detect 
		vehicle_threshold = .5

		vehicle_weights = 'data/vehicle-detector/yolo-voc.weights'  #.encode('ascii')
		vehicle_netcfg  = 'data/vehicle-detector/yolo-voc.cfg'#.encode('ascii').encode('ascii')
		vehicle_dataset = 'data/vehicle-detector/voc.data'#.encode('ascii')
		vehicle_weights = vehicle_weights.encode('ascii')
		vehicle_netcfg = vehicle_netcfg.encode('ascii')
		vehicle_dataset = vehicle_dataset.encode('ascii')

		vehicle_net  = dn.load_net(vehicle_netcfg, vehicle_weights, 0)
		vehicle_meta = dn.load_meta(vehicle_dataset)

        # lp detect
		lp_threshold = .5

		wpod_net_path = 'data/lp-detector/bak/wpod-net_update1.h5'
		print(wpod_net_path)
		#wpod_net_path = wpod_net_path.encode('ascii')
		wpod_net = load_model(wpod_net_path)

        # ocr
		ocr_threshold = .4

		ocr_weights = 'data/ocr/ocr-net.weights'
		ocr_netcfg  = 'data/ocr/ocr-net.cfg'
		ocr_dataset = 'data/ocr/ocr-net.data'
		ocr_weights = ocr_weights.encode('ascii')
		ocr_netcfg = ocr_netcfg.encode('ascii')
		ocr_dataset = ocr_dataset.encode('ascii')

		ocr_net  = dn.load_net(ocr_netcfg, ocr_weights, 0)
		ocr_meta = dn.load_meta(ocr_dataset)


		if not isdir(output_dir):
			makedirs(output_dir)

		print('Searching for vehicles using YOLO...')

		image = load_image(input_image,0, 0)

		R,_ = detect(vehicle_net, vehicle_meta, image ,thresh=vehicle_threshold, is_imgpath=False)
		#print(R)

		R = [r for r in R if r[0] in [b'car',b'bus']]

		print('\t\t%d cars found' % len(R))

		if len(R):

			Iorig = cv2.imread(input_image_path)  # 原始图片
			WH = np.array(Iorig.shape[1::-1],dtype=float)
			Lcars = []

			for i,r in enumerate(R):

				cx,cy,w,h = (np.array(r[2])/np.concatenate( (WH,WH) )).tolist()
				tl = np.array([cx - w/2., cy - h/2.])
				br = np.array([cx + w/2., cy + h/2.])
				label = Label(0,tl,br)
				print(label.wh())
				print(label.tl())
				Icar = crop_region(Iorig,label) # 截取车辆区域 Icar 车辆 label 车辆坐标信息
				Icar = Icar.astype('uint8')

				Lcars.append(label)
				draw_label(Iorig,label,color=YELLOW,thickness=3)

				# lp detector
				print('Searching for license plates using WPOD-NET')

				ratio = float(max(Icar.shape[:2]))/min(Icar.shape[:2])
				side  = int(ratio*288.)
				bound_dim = min(side + (side%(2**4)),608)
				print("\t\tBound dim: %d, ratio: %f" % (bound_dim,ratio))

 
				Llp,LlpImgs,elapse = detect_lp(wpod_net,im2single(Icar),bound_dim,2**4,(240,80),lp_threshold)
				print('\tld detection used %d s time' % elapse)

				if len(LlpImgs):
					# 检测的车牌图像信息
					Ilp = LlpImgs[0]
					Ilp = cv2.cvtColor(Ilp, cv2.COLOR_BGR2GRAY)
					Ilp = cv2.cvtColor(Ilp, cv2.COLOR_GRAY2BGR)

					s = Shape(Llp[0].pts) # 车牌坐标信息

					#cv2.imwrite('%s/%s_lp.png' % (output_dir,bname),Ilp*255.)
					#writeShapes('%s/%s_lp.txt' % (output_dir,bname),[s])
					lpts = Llp[0].pts*label.wh().reshape(2,1) + label.tl().reshape(2,1)
					lptspx = lpts*np.array(Iorig.shape[1::-1],dtype=float).reshape(2,1)
					draw_losangle(Iorig,lptspx,RED,3)

					Ilp = Ilp*255.
					Ilp = Ilp.astype('uint8') # 十分重要，不做这个转换，就无法识别
					'''
					cv2.imshow("img", Ilp)
					cv2.waitKey(3000)
					cv2.imwrite('%s/%s_new_lp.png' % (output_dir,bname),Ilp)	
					'''
					dk_image = nparray_to_image(Ilp)
					
					R2,(width,height) = detect(ocr_net, ocr_meta, dk_image ,thresh=ocr_threshold, nms=None, is_imgpath=False)
					print(width,height)

					if len(R2):

						L = dknet_label_conversion(R2,width,height)
						L = nms(L,.45)

						L.sort(key=lambda x: x.tl()[0])
						lp_str = ''.join([chr(l.cl()) for l in L]) # ocr识别出的车牌字符串

						#with open('%s/%s_str.txt' % (output_dir,bname),'w') as f:
						#	f.write(lp_str + '\n')

						print('\t\tLP: %s' % lp_str)
						label_lp = Label(0,tl=lpts.min(1),br=lpts.max(1))
						write2img(Iorig,label_lp,lp_str)

					else:

						print('No characters found')

		cv2.imshow("test", Iorig)
		cv2.waitKey(3000)
			
		cv2.imwrite('%s/%s_output.png' % (output_dir,bname),Iorig)	
		#lwrite('%s/%s_cars.txt' % (output_dir,bname),Lcars)

	except:
		traceback.print_exc()
		sys.exit(1)

	sys.exit(0)