Merge branch 'pytorch' into dsprites

Conflicts: notebooks/visualize_model_weights.ipynb train_model.py utils/dataset_utils.py
dpaiton · Sep 8, 2020 · 2722ab3 · 2722ab3
2 parents 71993c6 + 8ae8e65
commit 2722ab3
Show file tree

Hide file tree

Showing 62 changed files with 6,458 additions and 1,764 deletions.
diff --git a/.gitignore b/.gitignore
@@ -1,3 +1,6 @@
+*.npz
+*.pkl
+
 # Memristor data
 memristor_data/
 

diff --git a/README.md b/README.md
@@ -1,6 +1,8 @@
 # DeepSparseCoding
 Code for testing hierarchical Sparse Coding models
 
+Test with `pytest`
+
 ## Required Packages
 System:
 Some plots use latex, and require these packages

diff --git a/adversarial_analysis.py b/adversarial_analysis.py
@@ -0,0 +1,123 @@
+import os
+import sys
+
+ROOT_DIR = os.getcwd()
+while 'DeepSparseCoding' in ROOT_DIR:
+    ROOT_DIR = os.path.dirname(ROOT_DIR)
+if ROOT_DIR not in sys.path: sys.path.append(ROOT_DIR)
+
+import numpy as np
+import proplot as plot
+import torch
+
+from DeepSparseCoding.utils.file_utils import Logger
+import DeepSparseCoding.utils.loaders as loaders
+import DeepSparseCoding.utils.run_utils as run_utils
+import DeepSparseCoding.utils.dataset_utils as dataset_utils
+import DeepSparseCoding.utils.run_utils as ru
+import DeepSparseCoding.utils.plot_functions as pf
+
+import eagerpy as ep
+from foolbox import PyTorchModel, accuracy, samples
+import foolbox.attacks as fa
+
+
+log_files = [
+    os.path.join(*[ROOT_DIR, 'Torch_projects', 'mlp_768_mnist', 'logfiles', 'mlp_768_mnist_v0.log']),
+    os.path.join(*[ROOT_DIR, 'Torch_projects', 'lca_768_mlp_mnist', 'logfiles', 'lca_768_mlp_mnist_v0.log'])
+    ]
+
+cp_latest_filenames = [
+    os.path.join(*[ROOT_DIR,'Torch_projects', 'mlp_768_mnist', 'checkpoints', 'mlp_768_mnist_latest_checkpoint_v0.pt']),
+    os.path.join(*[ROOT_DIR, 'Torch_projects', 'lca_768_mlp_mnist', 'checkpoints', 'lca_768_mlp_mnist_latest_checkpoint_v0.pt'])
+    ]
+
+attack_params = {
+    'linfPGD': {
+        'abs_stepsize':0.01,
+        'steps':5000
+    }
+}
+
+attacks = [
+    #fa.FGSM(),
+    fa.LinfPGD(**attack_params['linfPGD']),
+    #fa.LinfBasicIterativeAttack(),
+    #fa.LinfAdditiveUniformNoiseAttack(),
+    #fa.LinfDeepFoolAttack(),
+]
+
+epsilons = [ # allowed perturbation size
+    0.0,
+    0.05,
+    0.1,
+    0.15,
+    0.2,
+    0.25,
+    0.3,
+    0.35,
+    #0.4,
+    0.5,
+    #0.8,
+    1.0
+]
+
+num_models = len(log_files)
+for model_index in range(num_models):
+    logger = Logger(log_files[model_index], overwrite=False)
+    log_text = logger.load_file()
+    params = logger.read_params(log_text)[-1]
+    params.cp_latest_filename = cp_latest_filenames[model_index]
+    train_loader, val_loader, test_loader, data_params = dataset_utils.load_dataset(params)
+    for key, value in data_params.items():
+        setattr(params, key, value)
+    model = loaders.load_model(params.model_type)
+    model.setup(params, logger)
+    model.params.analysis_out_dir = os.path.join(
+        *[model.params.model_out_dir, 'analysis', model.params.version])
+    model.params.analysis_save_dir = os.path.join(model.params.analysis_out_dir, 'savefiles')
+    if not os.path.exists(model.params.analysis_save_dir):
+        os.makedirs(model.params.analysis_save_dir)
+    model.to(params.device)
+    model.load_checkpoint()
+    fmodel = PyTorchModel(model.eval(), bounds=(0, 1))
+    print('\n', '~' * 79)
+    num_batches =  len(test_loader.dataset) // model.params.batch_size
+    attack_success = np.zeros(
+            (len(attacks), len(epsilons), num_batches, model.params.batch_size), dtype=np.bool)
+    for batch_index, (data, target) in enumerate(test_loader):
+        data = model.preprocess_data(data.to(model.params.device))
+        target = target.to(model.params.device)
+        images, labels = ep.astensors(*(data, target))
+        del data; del target
+        print(f'Model type: {model.params.model_type} [{model_index+1} out of {len(log_files)}]')
+        print(f'Batch {batch_index+1} out of {num_batches}')
+        print(f'accuracy {accuracy(fmodel, images, labels)}')
+        for attack_index, attack in enumerate(attacks):
+            advs, inputs, success = attack(fmodel, images, labels, epsilons=epsilons)
+            assert success.shape == (len(epsilons), len(images))
+            success_ = success.numpy()
+            assert success_.dtype == np.bool
+            attack_success[attack_index, :, batch_index, :] = success_
+            print('\n', attack)
+            print('  ', 1.0 - success_.mean(axis=-1).round(2))
+            np.savez('tmp_perturbations.npz', data=advs[0].numpy())
+            np.savez('tmp_images.npz', data=images.numpy())
+            np.savez('tmp_inputs.npz', data=inputs[0].numpy())
+            import IPython; IPython.embed(); raise SystemExit
+        robust_accuracy = 1.0 - attack_success[:, :, batch_index, :].max(axis=0).mean(axis=-1)
+        print('\n', '-' * 79, '\n')
+        print('worst case (best attack per-sample)')
+        print('  ', robust_accuracy.round(2))
+        print('-' * 79)
+    attack_success = attack_success.reshape(
+        (len(attacks), len(epsilons), num_batches*model.params.batch_size))
+    attack_types = [str(type(attack)).split('.')[-1][:-2] for attack in attacks]
+    output_filename = os.path.join(model.params.analysis_save_dir,
+        f'linf_adversarial_analysis.npz')
+    out_dict = {
+        'adversarial_analysis':attack_success,
+        'attack_types':attack_types,
+        'epsilons':epsilons,
+        'attack_params':attack_params}
+    np.savez(output_filename, data=out_dict)
diff --git a/datasets/synthetic.py b/datasets/synthetic.py
@@ -0,0 +1,106 @@
+import os
+import sys
+
+import numpy as np
+from scipy.stats import norm
+from PIL import Image
+import torch
+import torchvision
+
+ROOT_DIR = os.path.dirname(os.getcwd())
+if ROOT_DIR not in sys.path: sys.path.append(ROOT_DIR)
+
+import DeepSparseCoding.utils.data_processing as dp
+
+class SyntheticImages(torchvision.datasets.vision.VisionDataset):
+    """Synthetic dataset of square images with pixel values drawn from a specified distribution
+    Inputs:
+        epoch_size [int] Number of datapoints in the dataset
+        data_edge_size [int] Length of the edge of a square datapoint.
+        dist_type [str] one of {'gaussian', 'laplacian', 'hierarchical_sparse'}
+        rand_state [np.random.RandomState()] a numpy random state to generate data from
+        num_classes [int, optional] number of classes for random supervised labels
+        transform [callable, optional] A function/transform that  takes in an PIL image
+            and returns a transformed version. E.g, ``transforms.RandomCrop``
+        target_transform (callable, optional): A function/transform that takes in the
+            target and transforms it.
+    """
+
+    @property
+    def train_labels(self):
+        warnings.warn("train_labels has been renamed targets")
+        return self.targets
+
+    @property
+    def test_labels(self):
+        warnings.warn("test_labels has been renamed targets")
+        return self.targets
+
+    @property
+    def train_data(self):
+        warnings.warn("train_data has been renamed data")
+        return self.data
+
+    @property
+    def test_data(self):
+        warnings.warn("test_data has been renamed data")
+        return self.data
+
+    def __init__(self, epoch_size, data_edge_size, dist_type, rand_state, num_classes=None,
+        transform=None, target_transform=None):
+        root = './' # no need for a root directory because the data is never on disc
+        if(target_transform):
+            assert num_classes is not None, (
+                'Num classes must be specified if target_transform is not None.')
+        super(SyntheticImages, self).__init__(root, transform=transform,
+            target_transform=target_transform) # transforms get set to member variables
+        self.data = torch.tensor(
+            self.generate_synthetic_data(epoch_size, data_edge_size, dist_type, rand_state))
+        if(num_classes):
+            self.targets = self.generate_labels(epoch_size, num_classes, rand_state)
+        else:
+            self.targets = -1 * torch.ones(len(self.data))
+
+    def __getitem__(self, index):
+        """
+        Inputs:
+            index (int): Index
+        Outputs:
+            tuple: (image, target) where target is index of the target class.
+        """
+        img = self.data[index]
+        target = self.targets[index]
+        # doing this so that it is consistent with all other datasets
+        # to return a PIL Image
+        img = Image.fromarray(np.squeeze(img.numpy()), mode='L')
+        if self.transform is not None:
+            img = self.transform(img)
+        if self.target_transform is not None:
+            target = self.target_transform(target)
+        return img, target
+
+    def __len__(self):
+        return len(self.data)
+
+    def generate_synthetic_data(self, epoch_size, data_edge_size, dist_type, rand_state):
+        """
+        Function for generating synthetic data of shape [epoch_size, num_edge, num_edge]
+        Inputs:
+            dist_type [str] one of {'gaussian', 'laplacian'},
+                otherwise returns zeros
+            epoch_size [int] number of datapoints in an epoch
+            data_edge_size [int] size of the edge of the square synthetic image
+        """
+        data_shape = (epoch_size, data_edge_size, data_edge_size, 1)
+        if dist_type == 'gaussian':
+            data = rand_state.normal(loc=0.0, scale=1.0, size=data_shape)
+        elif dist_type == 'laplacian':
+            data = rand_state.laplace(loc=0.0, scale=1.0, size=data_shape)
+        else:
+            assert False, (f'Data dist_type must be "gaussian" or "laplace", not {dist_type}')
+        return data
+
+    def generate_labels(self, epoch_size, num_classes, rand_state):
+        labels = torch.tensor(rand_state.randint(num_classes, size=epoch_size))
+        #labels = dp.dense_to_one_hot(labels, num_classes)
+        return labels
diff --git a/models/base_model.py b/models/base_model.py
@@ -20,8 +20,6 @@ def setup(self, params, logger=None):
             self.log_params()
         else:
             self.logger = logger
-        self.setup_module(params)
-        self.setup_optimizer()
 
     def load_params(self, params):
         """

diff --git a/models/ensemble_model.py b/models/ensemble_model.py
@@ -6,20 +6,26 @@
 
 
 class EnsembleModel(BaseModel, EnsembleModule):
+    def setup(self, params, logger=None):
+        """
+        Setup required model components
+        """
+        super(EnsembleModel, self).setup(params, logger)
+        self.setup_module(params)
+        self.setup_optimizer()
+
     def setup_module(self, params):
         for subparams in params.ensemble_params:
             subparams.epoch_size = params.epoch_size
             subparams.batches_per_epoch = params.batches_per_epoch
             subparams.num_batches = params.num_batches
-            subparams.num_val_images = params.num_val_images
-            subparams.num_test_images = params.num_test_images
+            #subparams.num_val_images = params.num_val_images
+            #subparams.num_test_images = params.num_test_images
             subparams.data_shape = params.data_shape
         super(EnsembleModel, self).setup_ensemble_module(params)
         self.submodel_classes = []
         for submodel_params in self.params.ensemble_params:
-            self.submodel_classes.append(loaders.load_model_class(
-            submodel_params.model_type,
-            self.params.lib_root_dir))
+            self.submodel_classes.append(loaders.load_model_class(submodel_params.model_type))
 
     def setup_optimizer(self):
         for module in self:

diff --git a/models/lca_model.py b/models/lca_model.py
@@ -7,6 +7,11 @@
 
 
 class LcaModel(BaseModel, LcaModule):
+    def setup(self, params, logger=None):
+        super(LcaModel, self).setup(params, logger)
+        self.setup_module(params)
+        self.setup_optimizer()
+
     def get_total_loss(self, input_tuple):
         input_tensor, input_labels = input_tuple
         latents = self.get_encodings(input_tensor)

diff --git a/models/mlp_model.py b/models/mlp_model.py
@@ -1,14 +1,23 @@
 import numpy as np
-import torch.nn.functional as F
+
+import torch
+#import torch.nn.functional as F
 
 from DeepSparseCoding.models.base_model import BaseModel
 from DeepSparseCoding.modules.mlp_module import MlpModule
 
 class MlpModel(BaseModel, MlpModule):
+    def setup(self, params, logger=None):
+        super(MlpModel, self).setup(params, logger)
+        self.setup_module(params)
+        self.setup_optimizer()
+
     def get_total_loss(self, input_tuple):
         input_tensor, input_label = input_tuple
         pred = self.forward(input_tensor)
-        return F.nll_loss(pred, input_label)
+        #return F.nll_loss(pred, input_label)
+        self.loss_fn = torch.nn.CrossEntropyLoss()
+        return self.loss_fn(pred, input_label)
 
     def generate_update_dict(self, input_data, input_labels=None, batch_step=0, update_dict=None):
         if update_dict is None:
@@ -19,7 +28,8 @@ def generate_update_dict(self, input_data, input_labels=None, batch_step=0, upda
             'batch_step':batch_step,
             'train_progress':np.round(batch_step/self.params.num_batches, 3)}
         pred = self.forward(input_data)
-        total_loss = F.nll_loss(pred, input_labels)
+        #total_loss = F.nll_loss(pred, input_labels)
+        total_loss = self.loss_fn(pred, input_labels)
         pred = pred.max(1, keepdim=True)[1]
         correct = pred.eq(input_labels.view_as(pred)).sum().item()
         stat_dict['loss'] = total_loss.item()

diff --git a/modules/ensemble_module.py b/modules/ensemble_module.py
@@ -10,7 +10,7 @@ def __init__(self): # do not do Sequential's init
     def setup_ensemble_module(self, params):
         self.params = params
         for subparams in params.ensemble_params:
-            submodule = loaders.load_module(subparams.model_type, params.lib_root_dir)
+            submodule = loaders.load_module(subparams.model_type)
             submodule.setup_module(subparams)
             self.add_module(subparams.model_type, submodule)
 

diff --git a/modules/mlp_module.py b/modules/mlp_module.py
@@ -31,7 +31,7 @@ def preprocess_data(self, input_tensor):
     def forward(self, x):
         for dropout, act_func, layer in zip(self.dropout, self.act_funcs, self.layers):
             x = dropout(act_func(layer(x)))
-        x = F.log_softmax(x, dim=1)
+        #x = F.log_softmax(x, dim=1)
         return x
 
     def get_encodings(self, input_tensor):