test multiple activations

loveunk · loveunk · commit de30e87b0d0d · 2020-04-07T20:36:46.000+08:00
diff --git a/.gitignore b/.gitignore
@@ -1,7 +1,11 @@
+__pycache__
 .idea
 *.h5
 .ipynb_checkpoints
+.vscode
 tensorflow/introduction-to-tensorflow-for-AI-ML-DL/h-or-s/
 tensorflow/introduction-to-tensorflow-for-AI-ML-DL/*.zip
 tensorflow/introduction-to-tensorflow-for-AI-ML-DL/cats-v-dogs
-tensorflow/introduction-to-tensorflow-for-AI-ML-DL/sign-language-mnist
+tensorflow/introduction-to-tensorflow-for-AI-ML-DL/sign-language-mnist
+pytorch/samples/data
+pytorch/samples/runs
diff --git a/pytorch/samples/MnistClassification.py b/pytorch/samples/MnistClassification.py
@@ -2,26 +2,41 @@
 import torch.nn as nn
 import torch.nn.functional as F
 from torchvision import datasets, transforms
+from torch.utils.tensorboard import SummaryWriter
+# from DynamicRELU import DYReLU2
+
+tensorboard_on = False
+if tensorboard_on:
+    writer = SummaryWriter()
+
 
 class MyConvNet(nn.Module):
-    def __init__(self):
+    def __init__(self, relu, relustr, **kwargs):
         super(MyConvNet, self).__init__()
         self.conv1 = nn.Conv2d(1, 20, 5, 1)
         self.conv2 = nn.Conv2d(20, 50, 5, 1)
         self.fc1 = nn.Linear(4*4*50, 500)
         self.fc2 = nn.Linear(500, 10)
-    
+        if relustr == 'dyrelu':
+            self.relu1 = relu(20, 20)
+            self.relu2 = relu(50, 50)
+            self.relu3 = relu(500, 500)
+        else:
+            self.relu1 = relu()
+            self.relu2 = relu()
+            self.relu3 = relu()
+
     def forward(self, x):
-        x = self.conv1(x)           # 28x28 -> 24x24
-        x = F.relu(x)               # 24x24
-        x = F.max_pool2d(x, 2, 2)   # 24x24 -> 12x12
-        x = self.conv2(x)           # 12x12 -> 8x8
-        x = F.relu(x)               # 8x8
-        x = F.max_pool2d(x, 2, 2)   # 8x8 -> 4x4
-        x = torch.flatten(x, 1)
-        x = self.fc1(x)
-        x = F.relu(x)
-        x = self.fc2(x)
+        x = self.conv1(x)           # 28x28x1 -> 24x24x20
+        x = self.relu1(x)           # 24x24x20
+        x = F.max_pool2d(x, 2, 2)   # 24x24x20 -> 12x12x20
+        x = self.conv2(x)           # 12x12x20 -> 8x8x50
+        x = self.relu2(x)           # 8x8x50
+        x = F.max_pool2d(x, 2, 2)   # 8x8x50 -> 4x4x50
+        x = torch.flatten(x, 1)     # 4x4x50 -> 4*4*50
+        x = self.fc1(x)             # 4*4*50 -> 500
+        # x = self.relu3(x)           # 500 -> 500
+        x = self.fc2(x)             # 500 -> 10
         return F.log_softmax(x, dim=1)
 
 
@@ -38,12 +53,16 @@ def train(model, device, train_loader, optimizer, epoch):
         loss.backward()
         optimizer.step()
 
-        if batch_idx % 100 == 0:
-            print("Train epoch: {}, iteration: {}, Loss: {}".format(
-                epoch, batch_idx, loss.item()
-            ))
+        if tensorboard_on:
+            writer.add_scalar('Loss/train',
+                              loss.item(),
+                              epoch * len(train_loader) + batch_idx)
+
+    # if batch_idx % 100 == 0:
+    print("Epoch: {}, train loss: {}, ".format(epoch, loss.item()), end='')
+
 
-def test(model, device, test_loader):
+def test(model, device, test_loader, epoch):
     model.eval()
     total_loss = 0
     correct = 0.
@@ -57,40 +76,67 @@ def test(model, device, test_loader):
 
     total_loss /= len(test_loader.dataset)
     acc = correct / len(test_loader.dataset) * 100.
-    print("Test loss: {}, accuracy: {}".format(total_loss, acc))
+    print("test loss: {}, accuracy: {}".format(total_loss, acc))
+
+    if tensorboard_on:
+        writer.add_scalar('Loss/test', total_loss, epoch)
+        writer.add_scalar('Accuracy/test', acc, epoch)
+
 
 def main():
-    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
-    batch_size = 32
+    batch_size = 128
+    lr = 0.01
+    momentum = 0.9
+    epochs = 15
+    schd_step = 7
+    relus = {'relu': nn.ReLU,
+             'lrelu': nn.LeakyReLU,
+             'rrelu': nn.RReLU,
+             'prelu': nn.PReLU,
+             'relu6': nn.ReLU6,
+             'elu': nn.ELU,
+             'selu': nn.SELU,
+             # dyrelu': DYReLU2
+            }
+    relu_kwargs = [{}, {}, {}, {}, {}, {}, {}, {}]
 
-    kwargs = {'num_workers': 1, 'pin_memory': True} if torch.cuda.is_available() else {}
+    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
+    kwargs = {'num_workers': 1, 'pin_memory': True} \
+        if torch.cuda.is_available() else {}
     train_dataloader = torch.utils.data.DataLoader(
-        datasets.MNIST('./data', train=True, download=True,
-                        transform=transforms.Compose([
-                            transforms.ToTensor(),
-                            transforms.Normalize((0.1307,), (0.3081,))
-                        ])),
+        datasets.MNIST(
+            './data', train=True, download=True,
+            transform=transforms.Compose([
+                transforms.ToTensor(),
+                transforms.Normalize((0.1307,), (0.3081,))
+            ])),
         batch_size=batch_size, shuffle=True, **kwargs)
     test_dataloader = torch.utils.data.DataLoader(
-        datasets.MNIST('./data', train=False, download=True,
-                        transform=transforms.Compose([
-                            transforms.ToTensor(),
-                            transforms.Normalize((0.1307,), (0.3081,))
-                        ])),
+        datasets.MNIST(
+            './data', train=False, download=True,
+            transform=transforms.Compose([
+                transforms.ToTensor(),
+                transforms.Normalize((0.1307,), (0.3081,))
+            ])),
         batch_size=batch_size, shuffle=True, **kwargs)
 
-    lr = 1e-2
-    momentum = 0.5
-    epochs = 10
+    for i, (relustr, relu) in enumerate(relus.items()):
+        print('--------------------- {} ---------------------'.format(relustr))
+        model = MyConvNet(relu, relustr, **relu_kwargs[i]).to(device)
+        optimizer = torch.optim.SGD(
+            model.parameters(), lr=lr, momentum=momentum)
+        scheduler = torch.optim.lr_scheduler.StepLR(optimizer, schd_step)
 
-    model = MyConvNet().to(device)
-    optimizer = torch.optim.SGD(model.parameters(), lr=lr, momentum=momentum)
+        for epoch in range(epochs):
+            train(model, device, train_dataloader, optimizer, epoch)
+            test(model, device, test_dataloader, epoch)
+            scheduler.step()
 
-    for epoch in range(epochs):
-        train(model, device, train_dataloader, optimizer, epoch)
-        test(model, device, test_dataloader)
+        # torch.save(model.state_dict(), 'mnist_cnn.pt')
 
-    torch.save(model.state_dict(), 'mnist_cnn.pt')
 
 if __name__ == '__main__':
     main()
+
+    if tensorboard_on:
+        writer.close()
diff --git a/pytorch/samples/ResNetFinetune.py b/pytorch/samples/ResNetFinetune.py
@@ -2,11 +2,14 @@
 from torchvision import models, datasets, transforms
 import copy
 
+
 def set_parameter_requires_grad(model, feature_extract):
     for param in model.parameters():
         param.requires_grad = feature_extract
 
-def initialize_model(model_name, num_classes, feature_extract, use_pretrained=True):
+
+def initialize_model(model_name, num_classes, feature_extract,
+                     use_pretrained=True):
     if model_name == 'resnet':
         model_ft = models.resnet18(pretrained=use_pretrained)
         set_parameter_requires_grad(model_ft, feature_extract)
@@ -17,29 +20,34 @@ def initialize_model(model_name, num_classes, feature_extract, use_pretrained=Tr
     else:
         raise NotImplementedError
 
+
 def dataloader(batch_size):
-    kwargs = {'num_workers': 1, 'pin_memory': True} if torch.cuda.is_available() else {}
+    kwargs = {'num_workers': 1, 'pin_memory': True} \
+             if torch.cuda.is_available() else {}
 
     train_loader = torch.utils.data.DataLoader(
         datasets.MNIST('./data', train=True, download=True,
-                        transform=transforms.Compose([
-                            transforms.ToTensor(),
-                            transforms.Normalize((0.1307,), (0.3081,))
-                        ])),
+                       transform=transforms.Compose([
+                           transforms.ToTensor(),
+                           transforms.Normalize((0.1307,), (0.3081,))
+                       ])),
         batch_size=batch_size, shuffle=True, **kwargs)
     test_loader = torch.utils.data.DataLoader(
         datasets.MNIST('./data', train=False, download=True,
-                        transform=transforms.Compose([
-                            transforms.ToTensor(),
-                            transforms.Normalize((0.1307,), (0.3081,))
-                        ])),
+                       transform=transforms.Compose([
+                           transforms.ToTensor(),
+                           transforms.Normalize((0.1307,), (0.3081,))
+                       ])),
         batch_size=batch_size, shuffle=True, **kwargs)
 
-    return {'train':train_loader, 'test':test_loader}
+    return {'train': train_loader, 'test': test_loader}
 
-def train_model(model, epochs, batch_size, loss_fn, optimizer, device, dataloaders):
+
+def train_model(model, epochs, batch_size, loss_fn, optimizer, device,
+                dataloaders):
     val_acc_history = []
     best_model_wts = copy.deepcopy(model.state_dict())
+    best_acc = 0
 
     for epoch in range(epochs):
         for phase in ['train', 'test']:
@@ -52,7 +60,7 @@ def train_model(model, epochs, batch_size, loss_fn, optimizer, device, dataloade
             for data, target in dataloaders[phase]:
                 data, targets = data.to(device), target.to(device)
                 # resnet accepts images with 3 channels
-                data = data.repeat(1,3,1,1)
+                data = data.repeat(1, 3, 1, 1)
 
                 with torch.autograd.set_grad_enabled(phase == 'train'):
                     outputs = model(data)
@@ -64,12 +72,14 @@ def train_model(model, epochs, batch_size, loss_fn, optimizer, device, dataloade
                     loss.backward()
                     optimizer.step()
                 running_loss += loss.item() * data.size(0)
-                running_corrects += torch.sum(preds.cpu().view(-1) == targets.cpu().view(-1))
+                cnt = torch.sum(preds.cpu().view(-1) == targets.cpu().view(-1))
+                running_corrects += cnt
 
             epoch_loss = running_loss / len(dataloaders[phase].dataset)
-            epoch_acc  = running_corrects / len(dataloaders[phase].dataset)
+            epoch_acc = running_corrects / len(dataloaders[phase].dataset)
 
-            print('Epoch: {}, phase: {}, loss: {}, acc: {}'.format(epoch, phase, epoch_loss, epoch_acc))
+            print('Epoch: {}, phase: {}, loss: {}, acc: {}'.format(
+                epoch, phase, epoch_loss, epoch_acc))
 
             if phase == 'val' and epoch_acc > best_acc:
                 best_acc = epoch_acc
@@ -79,6 +89,7 @@ def train_model(model, epochs, batch_size, loss_fn, optimizer, device, dataloade
     model.load_state_dict(best_model_wts)
     return model, val_acc_history
 
+
 def main():
     classes = 10
     epochs = 10
@@ -91,12 +102,15 @@ def main():
     # print(model_ft.fc.weight.requires_grad)
 
     dataloaders = dataloader(batch_size)
-    optimizer = torch.optim.SGD(filter(lambda p: p.requires_grad, 
-                                       model_ft.parameters()), lr=0.01, momentum=0.9)
+    optimizer = torch.optim.SGD(filter(lambda p: p.requires_grad,
+                                       model_ft.parameters()),
+                                lr=0.01,
+                                momentum=0.9)
     loss_fn = torch.nn.CrossEntropyLoss()
 
-    train_model(model_ft.to(device), epochs, batch_size, 
+    train_model(model_ft.to(device), epochs, batch_size,
                 loss_fn, optimizer, device, dataloaders)
 
+
 if __name__ == "__main__":
-    main()
+    main()
diff --git a/pytorch/samples/TwoLayerFCSample.py b/pytorch/samples/TwoLayerFCSample.py
@@ -8,21 +8,24 @@
 x = torch.randn(N, D_in).cuda()
 y = torch.randn(N, D_out).cuda()
 
+
 class TwoLayerNet(torch.nn.Module):
     def __init__(self, D_in, H, D_out):
         super(TwoLayerNet, self).__init__()
         self.l1 = torch.nn.Linear(D_in, H)
         self.l2 = torch.nn.ReLU()
         self.l3 = torch.nn.Linear(H, D_out)
-    
+
     def forward(self, x):
         x = self.l1(x)
         x = self.l2(x)
         x = self.l3(x)
         return x
 
-#torch.nn.init.normal_(model[0].weight)
-#torch.nn.init.normal_(model[2].weight)
+# torch.nn.init.normal_(model[0].weight)
+# torch.nn.init.normal_(model[2].weight)
+
+
 model = TwoLayerNet(D_in, H, D_out).cuda()
 
 loss_fn = torch.nn.MSELoss(reduction="sum")
@@ -42,4 +45,3 @@ def forward(self, x):
 
     # update weights
     optimizer.step()
-