Working on adapted networks

8180f189 · Tiago de Freitas Pereira · 10d7aea0 · 8180f189
Commit 8180f189 authored 7 years ago by Tiago de Freitas Pereira
--- a/bob/learn/tensorflow/test/test_cnn_trainable_variables_select.py
+++ b/bob/learn/tensorflow/test/test_cnn_trainable_variables_select.py
+#!/usr/bin/env python
+# vim: set fileencoding=utf-8 :
+# @author: Tiago de Freitas Pereira <tiago.pereira@idiap.ch>
+
+import numpy
+from bob.learn.tensorflow.utils import load_mnist
+import tensorflow as tf
+import os
+from bob.learn.tensorflow.loss import MeanSoftMaxLoss
+from bob.learn.tensorflow.datashuffler import TFRecord
+from bob.learn.tensorflow.trainers import Trainer, constant
+
+
+batch_size = 16
+validation_batch_size = 400
+iterations = 200
+seed = 10
+
+directory = "./temp/trainable_variables/"
+step1_path = os.path.join(directory, "step1")
+step2_path = os.path.join(directory, "step2")
+
+slim = tf.contrib.slim
+
+
+def base_network(train_data_shuffler, reuse=False, get_embedding=False):
+
+    if isinstance(train_data_shuffler, tf.Tensor):
+        inputs = train_data_shuffler
+    else:
+        inputs = train_data_shuffler("data", from_queue=False)
+
+    # Creating a random network
+    initializer = tf.contrib.layers.xavier_initializer(seed=seed)
+    graph = slim.conv2d(inputs, 10, [3, 3], activation_fn=tf.nn.relu, stride=1, scope='conv1',
+                        weights_initializer=initializer, reuse=reuse)
+    graph = slim.max_pool2d(graph, [4, 4], scope='pool1')
+    graph = slim.flatten(graph, scope='flatten1')
+    graph = slim.fully_connected(graph, 30, activation_fn=None, scope='fc1',
+                                 weights_initializer=initializer, reuse=reuse)
+
+    if get_embedding:
+        graph = graph
+    else:
+        graph = slim.fully_connected(graph, 10, activation_fn=None, scope='logits',
+                                     weights_initializer=initializer, reuse=reuse)
+    
+    return graph
+
+
+def amendment_network(graph, reuse=False, get_embedding=False):
+
+    initializer = tf.contrib.layers.xavier_initializer(seed=seed)
+    graph = slim.fully_connected(graph, 30, activation_fn=None, scope='fc2',
+                                 weights_initializer=initializer, reuse=reuse)
+
+    graph = slim.fully_connected(graph, 30, activation_fn=None, scope='fc3',
+                                 weights_initializer=initializer, reuse=reuse)
+
+    if get_embedding:
+        graph = tf.nn.l2_normalize(graph, dim=1, name="embedding")
+    else:
+        graph = slim.fully_connected(graph, 10, activation_fn=None, scope='logits',
+                                     weights_initializer=initializer, reuse=reuse)
+    
+    return graph
+
+def test_trainable_variables():
+
+    tf.reset_default_graph()
+
+    train_data, train_labels, validation_data, validation_labels = load_mnist()
+    train_data = train_data.astype("float32") *  0.00390625
+    validation_data = validation_data.astype("float32") *  0.00390625    
+
+    def _bytes_feature(value):
+        return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))
+
+    def _int64_feature(value):
+        return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))
+
+    def create_tf_record(tfrecords_filename, data, labels):
+        writer = tf.python_io.TFRecordWriter(tfrecords_filename)
+
+        #for i in range(train_data.shape[0]):
+        for i in range(6000):
+            img = data[i]
+            img_raw = img.tostring()
+            
+            feature = {'train/data': _bytes_feature(img_raw),
+                       'train/label': _int64_feature(labels[i])}
+            
+            example = tf.train.Example(features=tf.train.Features(feature=feature))
+            writer.write(example.SerializeToString())
+        writer.close()
+
+
+    # 1 - Create
+    # 2 - Initialize
+    # 3 - Minimize with certain variables 
+    # 4 - Load the last checkpoint
+
+
+
+    ######## BASE NETWORK #########    
+
+    tfrecords_filename = "mnist_train.tfrecords"    
+    #create_tf_record(tfrecords_filename, train_data, train_labels)
+    filename_queue = tf.train.string_input_producer([tfrecords_filename], num_epochs=1, name="input")
+
+    # Doing the first training
+    train_data_shuffler  = TFRecord(filename_queue=filename_queue,
+                                    batch_size=batch_size)
+    
+    graph = base_network(train_data_shuffler)
+    loss = MeanSoftMaxLoss(add_regularization_losses=False)
+
+    trainer = Trainer(train_data_shuffler,
+                  iterations=iterations, #It is supper fast
+                  analizer=None,
+                  temp_dir=step1_path)
+
+    learning_rate = constant(0.01, name="regular_lr")
+    trainer.create_network_from_scratch(graph=graph,
+                                        loss=loss,
+                                        learning_rate=learning_rate,
+                                        optimizer=tf.train.GradientDescentOptimizer(learning_rate),
+                                        )
+    trainer.train()
+    
+    conv1_trained = tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES, scope='conv1')[0].eval(session=trainer.session)[0]
+
+    del trainer
+    del filename_queue
+    del train_data_shuffler
+    tf.reset_default_graph()
+    
+    
+    ##### Creating an amendment network
+
+    filename_queue = tf.train.string_input_producer([tfrecords_filename], num_epochs=1, name="input")
+    train_data_shuffler  = TFRecord(filename_queue=filename_queue,
+                                    batch_size=batch_size)
+    
+    graph = base_network(train_data_shuffler, get_embedding=True)
+    graph = amendment_network(graph)
+    loss = MeanSoftMaxLoss(add_regularization_losses=False)
+
+    trainer = Trainer(train_data_shuffler,
+                  iterations=iterations, #It is supper fast
+                  analizer=None,
+                  temp_dir=step2_path)
+
+
+    learning_rate = constant(0.01, name="regular_lr")
+    trainer.create_network_from_scratch(graph=graph,
+                                        loss=loss,
+                                        learning_rate=learning_rate,
+                                        optimizer=tf.train.GradientDescentOptimizer(learning_rate),
+                                        )
+
+    conv1_before_load = tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES, scope='conv1')[0].eval(session=trainer.session)[0]
+
+    var_list =  tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES, scope='conv1') + \
+                tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES, scope='fc1')
+                 
+    saver = tf.train.Saver(var_list)
+    saver.restore(trainer.session, os.path.join(step1_path, "model.ckp"))
+
+    conv1_restored = tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES, scope='conv1')[0].eval(session=trainer.session)[0]
+
+    trainer.train()
+    
+    
+
+    #var_list = tf.get_collection(tf.GraphKeys.VARIABLES, scope='fc1') + tf.get_collection(tf.GraphKeys.VARIABLES, scope='logits')
+    #optimizer = tf.train.GradientDescentOptimizer(0.01).minimize(loss, global_step=global_step, var_list=var_list)
+    #print("Go ...")
+    
+    """
+    last_iteration = numpy.sum(tf.trainable_variables()[0].eval(session=session)[0])
+    for i in range(10):
+        _, l  = session.run([optimizer, loss])
+
+        current_iteration = numpy.sum(tf.trainable_variables()[0].eval(session=session)[0])
+        print numpy.abs(current_iteration - last_iteration)
+        current_iteration = last_iteration        
+        print l
+    
+    thread_pool.request_stop()
+    """        
+    #x = 0
+