train.py

import numpy as np
import tensorflow as tf
import keras
import os
import time
import pickle

from keras.optimizers import Adam
from keras.models import load_model

from keras.callbacks import ModelCheckpoint, CSVLogger

from fully_conv_model_for_lidar_2 import fcn_model
from util_func import *


def list_of_data(data_dir):
	list_of_lidar = []
	list_of_gtbox = []
	for f in os.listdir(data_dir):
		path = os.path.join(data_dir, f)
		lidar_path = os.path.join(path, 'lidar')
		gtbox_path = os.path.join(path, 'gt_boxes3d')
		num_files = len(os.listdir(lidar_path))

		lidar = [os.path.join(lidar_path, 'lidar_'+str(i)+'.npy') for i in range(num_files) ]
		gtbox = [os.path.join(gtbox_path, 'gt_boxes3d_'+str(i)+'.npy') for i in range(num_files) ]
		list_of_lidar += lidar
		list_of_gtbox += gtbox
	return list_of_lidar, list_of_gtbox

def undersample_data(list_of_lidar, list_of_gtbox, car_index={}, percent_noncar = 0.1):
	
	size_noncar = int(0.1*len(car_index[0]))
	ind_0 = list(np.random.choice(car_index[0], size=size_noncar, replace=False))
	for i in range(1, len(car_index)):
		ind_0 += car_index[i]
	new_list_of_lidar = [list_of_lidar[i] for i in ind_0]
	new_list_of_gtbox = [list_of_gtbox[i] for i in ind_0]

	return new_list_of_lidar, new_list_of_gtbox

def data_generator(list_of_lidar, list_of_gtbox, car_index = None, undersample = False, percent_noncar = 0.1):
	'''
	input: list_of_lidar, list_of_gtbox
	output: generator of lidar and gtbox
	'''
	if undersample:
		new_list_of_lidar, new_list_of_gtbox = undersample_data(list_of_lidar, list_of_gtbox, car_index, percent_noncar)
	else:
		new_list_of_lidar, new_list_of_gtbox = list_of_lidar, list_of_gtbox

	n_sample = len(new_list_of_lidar)
	next_epoch = True

	while True:
		if next_epoch:
			ind = 0
			indices = np.arange(n_sample)
			np.random.shuffle(indices)
			yield new_list_of_lidar[indices[ind]], new_list_of_gtbox[indices[ind]]
			next_epoch = False
		else:
			yield new_list_of_lidar[indices[ind]], new_list_of_gtbox[indices[ind]]
			ind += 1
			if ind >= n_sample:
				next_epoch = True
				

def train_batch_generator(list_of_lidar, list_of_gtbox, batch_size = 1, data_augmentation = True, width = 256, height = 64,
						car_index = None, undersample = False, percent_noncar = 0.1):

	offset_range = 5*np.pi/180
	ind = 0
	for lidar_file, box_file in data_generator(list_of_lidar, list_of_gtbox, car_index, undersample , percent_noncar):
		lidar = np.load(lidar_file)
		gt_box = np.load(box_file)

		if ind == 0:
			batch_sample = np.zeros((batch_size, height, width, 2))
			batch_label = np.zeros((batch_size, height, width, 8))

		if data_augmentation:
			# Randomly flip the frame
			flip = np.random.randint(2)
			#flip = 1
			offset = np.random.uniform(low=-offset_range, high=offset_range)
			#offset = 0
			lidar, gt_box = augmentation(offset, flip, lidar, gt_box)


		view, box = cylindrical_projection_for_training(lidar, gt_box)

		batch_sample[ind] = view
		batch_label[ind] = box

		ind += 1

		if ind == batch_size:
			yield batch_sample, batch_label

			ind = 0

def my_loss(y_true, y_pred):

	seg_true,reg_true = tf.split(y_true, [1, 7], 3)
	seg_pred,reg_pred = tf.split(y_pred, [1, 7], 3)

	#ratio = 20*h*w/tf.reduce_sum(seg_true)
	#weight1 = ((ratio-1)*seg_true + 1)/ratio

	seg_loss = -tf.reduce_mean(tf.multiply(seg_true,tf.log(seg_pred+1e-8)) + tf.multiply(1-seg_true,tf.log(1-seg_pred+1e-8)))
	#seg_loss = -tf.reduce_mean(
	#    tf.multiply(tf.multiply(seg_true,tf.log(seg_pred)) + tf.multiply(1-seg_true,tf.log(1-seg_pred)), weight1))

	diff = tf.reduce_mean(tf.squared_difference(reg_true, reg_pred), axis=3, keep_dims=True)
	reg_loss = tf.reduce_mean(tf.multiply(seg_true,diff))

	#total_loss = reg_loss
	#total_loss = seg_loss
	total_loss = seg_loss + reg_loss
	return total_loss 


if __name__ == '__main__':

	depth_mean = 10.0574
	height_mean = -0.9536
	depth_var = 146.011
	height_var = 0.76245


	mean_tensor, std_tensor = get_mean_std_tensor(depth_mean, height_mean, depth_var, height_var, input_shape = (64,256,2))

	data_dir = './extract_kiti/'

	list_of_lidar, list_of_gtbox = list_of_data(data_dir)


	#test on just one sample
	# list_of_lidar = [list_of_lidar[108]]
	# list_of_gtbox = [list_of_gtbox[108]]

	# list_of_lidar = list_of_lidar[:32]
	# list_of_gtbox = list_of_gtbox[:32]


	batch_size = 16
	pickle_index_file = './saved_model/numcar_ind.pickle'
	undersample = True
	percent_noncar = 0.097

	with open(pickle_index_file, 'rb') as f:
		car_index = pickle.load(f, encoding='latin1')
	
	if undersample:
		num_frame = int(len(car_index[0])*percent_noncar)
		for i in range(1, len(car_index)):
			num_frame += len(car_index[i])
	else:
		num_frame = len(list_of_lidar)
	
	steps_per_epoch = int(num_frame/batch_size)
	

	# model = fcn_model(mean_tensor, std_tensor, input_shape = (64,256,2), summary = True)
	# opt = Adam(lr=1e-4)
	# #keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08, decay=0.0)
	# model.compile(optimizer=opt, loss=my_loss)
	

	from keras.utils.generic_utils import get_custom_objects
	get_custom_objects().update({"my_loss": my_loss})
	
	model = load_model('saved_model/model_May_24_epoch_03.h5')


	checkpointer = ModelCheckpoint('saved_model/model_May_25_{epoch:02d}.h5')
	logger = CSVLogger(filename='saved_model/history.csv')

	print('Start training - batch_size : {0} - num_frame : {1} - steps_per_epoch : {2}'.format(batch_size,num_frame,steps_per_epoch))
	start = time.time()

	model.fit_generator(generator=train_batch_generator(list_of_lidar, list_of_gtbox, batch_size = batch_size, data_augmentation = True, width = 256, height = 64,
						car_index = car_index, undersample = undersample, percent_noncar = percent_noncar),
                       steps_per_epoch=steps_per_epoch,
                       epochs=5,
                       callbacks=[checkpointer, logger])

	print('End training - during time: {0} minutes'.format( int((time.time() - start)/60) ))
	#model.save("saved_model/model_2.h5")

	# model_json = model.to_json()
	# with open("saved_model/model.json", "w") as json_file:
	# 	json_file.write(model_json)
	# 	# serialize weights to HDF5
	# model.save_weights("saved_model/model.h5")
	# print("Saved model to disk")