sandgate-dev
diff --git a/‎p186_grid_search.py
Lines changed: 23 additions & 21 deletions b/‎p186_grid_search.py
Lines changed: 23 additions & 21 deletions
diff --git a/‎p189_nested_cross_validation.py
Lines changed: 32 additions & 32 deletions b/‎p189_nested_cross_validation.py
Lines changed: 32 additions & 32 deletions
diff --git a/‎p193_model_precision_recall.py
Lines changed: 34 additions & 32 deletions b/‎p193_model_precision_recall.py
Lines changed: 34 additions & 32 deletions
@@ -16,34 +16,36 @@
 from sklearn.grid_search import GridSearchCV
 from sklearn.svm import SVC
 
-y_train, X_train, y_test,  X_test, labels  = ocr_utils.load_E13B(chars_to_train = (48,51) , test_size=0.3, columns=(9,17), random_state=0) 
+if __name__ == '__main__':	
 
-pipe_svc = Pipeline([('scl', StandardScaler()),
-            ('clf', SVC(random_state=1))])
+    y_train, X_train, y_test,  X_test, labels  = ocr_utils.load_E13B(chars_to_train = (48,51) , test_size=0.3, columns=(9,17), random_state=0) 
 
-param_range = [0.0001, 0.001, 0.01, 0.1, 1.0, 10.0, 100.0, 1000.0]
+    pipe_svc = Pipeline([('scl', StandardScaler()),
+                ('clf', SVC(random_state=1))])
 
-param_grid = [{'clf__C': param_range, 
-               'clf__kernel': ['linear']},
-                 {'clf__C': param_range, 
-                  'clf__gamma': param_range, 
-                  'clf__kernel': ['rbf']}]
+    param_range = [0.0001, 0.001, 0.01, 0.1, 1.0, 10.0, 100.0, 1000.0]
 
-gs = GridSearchCV(estimator=pipe_svc, 
-                  param_grid=param_grid, 
-                  scoring='accuracy', 
-                  cv=10,
-                  n_jobs=-1)
-gs = gs.fit(X_train, y_train)
+    param_grid = [{'clf__C': param_range, 
+                   'clf__kernel': ['linear']},
+                     {'clf__C': param_range, 
+                      'clf__gamma': param_range, 
+                      'clf__kernel': ['rbf']}]
 
-print('Support Vector Machine Grid Search best score: {}'.format(gs.best_score_))
-print('Support Vector Machine Grid Search best params: {}'.format(gs.best_params_))
+    gs = GridSearchCV(estimator=pipe_svc, 
+                      param_grid=param_grid, 
+                      scoring='accuracy', 
+                      cv=10,
+                      n_jobs=-1)
+    gs = gs.fit(X_train, y_train)
 
-clf = gs.best_estimator_
-clf.fit(X_train, y_train)
-print('Support Vector Machine Test accuracy: %.3f' % clf.score(X_test, y_test))
+    print('Support Vector Machine Grid Search best score: {}'.format(gs.best_score_))
+    print('Support Vector Machine Grid Search best params: {}'.format(gs.best_params_))
 
-print ('\n########################### No Errors ####################################')
+    clf = gs.best_estimator_
+    clf.fit(X_train, y_train)
+    print('Support Vector Machine Test accuracy: %.3f' % clf.score(X_test, y_test))
+
+    print ('\n########################### No Errors ####################################')
 
 
 
@@ -36,47 +36,47 @@
 from sklearn.cross_validation import cross_val_score
 from sklearn.grid_search import GridSearchCV
 from sklearn.svm import SVC
+if __name__ == '__main__':
+        y_train, X_train, y_test,  X_test, labels  = ocr_utils.load_E13B(chars_to_train = (48,51) , test_size=0.3, columns=(9,17), random_state=0) 
 
-y_train, X_train, y_test,  X_test, labels  = ocr_utils.load_E13B(chars_to_train = (48,51) , test_size=0.3, columns=(9,17), random_state=0) 
 
+        pipe_svc = Pipeline([('scl', StandardScaler()),
+                    ('clf', SVC(random_state=1))])
 
-pipe_svc = Pipeline([('scl', StandardScaler()),
-            ('clf', SVC(random_state=1))])
+        c_gamma_range = [0.01, 0.1, 1.0, 10.0]
+         
+        param_grid = [{'clf__C': c_gamma_range, 
+                       'clf__kernel': ['linear']},
+                         {'clf__C': c_gamma_range, 
+                          'clf__gamma': c_gamma_range, 
+                          'clf__kernel': ['rbf'],}]
 
-c_gamma_range = [0.01, 0.1, 1.0, 10.0]
- 
-param_grid = [{'clf__C': c_gamma_range, 
-               'clf__kernel': ['linear']},
-                 {'clf__C': c_gamma_range, 
-                  'clf__gamma': c_gamma_range, 
-                  'clf__kernel': ['rbf'],}]
+        gs = GridSearchCV(estimator=pipe_svc, 
+                                    param_grid=param_grid, 
+                                    scoring='accuracy', 
+                                    cv=5,
+                                    n_jobs=-1)
 
-gs = GridSearchCV(estimator=pipe_svc, 
-                            param_grid=param_grid, 
-                            scoring='accuracy', 
-                            cv=5,
-                            n_jobs=-1)
 
+        scores = cross_val_score(gs, X_train, y_train, scoring='accuracy', cv=5)
+        print('\nSupport Vector Cross Validation accuracy: %.3f +/- %.3f' % (np.mean(scores), np.std(scores)))
 
-scores = cross_val_score(gs, X_train, y_train, scoring='accuracy', cv=5)
-print('\nSupport Vector Cross Validation accuracy: %.3f +/- %.3f' % (np.mean(scores), np.std(scores)))
+        gs = gs.fit(X_train, y_train)
+        print('Support Vector Machine Grid Search best score: {}'.format(gs.best_score_))
+        print('Support Vector Machine Grid Search best params: {}\n'.format(gs.best_params_))
 
-gs = gs.fit(X_train, y_train)
-print('Support Vector Machine Grid Search best score: {}'.format(gs.best_score_))
-print('Support Vector Machine Grid Search best params: {}\n'.format(gs.best_params_))
+        from sklearn.tree import DecisionTreeClassifier
+        gs = GridSearchCV(estimator=DecisionTreeClassifier(random_state=0), 
+                                    param_grid=[{'max_depth': [1, 2, 3, 4, 5, 6, 7, None]}], 
+                                    scoring='accuracy', 
+                                    cv=5)
 
-from sklearn.tree import DecisionTreeClassifier
-gs = GridSearchCV(estimator=DecisionTreeClassifier(random_state=0), 
-                            param_grid=[{'max_depth': [1, 2, 3, 4, 5, 6, 7, None]}], 
-                            scoring='accuracy', 
-                            cv=5)
 
+        scores = cross_val_score(gs, X_train, y_train, scoring='accuracy', cv=5)
+        print('Decision Tree Cross Validation accuracy: %.3f +/- %.3f' % (np.mean(scores), np.std(scores)))
 
-scores = cross_val_score(gs, X_train, y_train, scoring='accuracy', cv=5)
-print('Decision Tree Cross Validation accuracy: %.3f +/- %.3f' % (np.mean(scores), np.std(scores)))
+        gs = gs.fit(X_train, y_train)
+        print('Decision Tree Grid Search best score: {}'.format(gs.best_score_))
+        print('Decision Tree Grid Search best params: {}'.format(gs.best_params_))
 
-gs = gs.fit(X_train, y_train)
-print('Decision Tree Grid Search best score: {}'.format(gs.best_score_))
-print('Decision Tree Grid Search best params: {}'.format(gs.best_params_))
-
-print ('\n########################### No Errors ####################################')
+        print ('\n########################### No Errors ####################################')
@@ -30,45 +30,47 @@
 from sklearn.grid_search import GridSearchCV
 from sklearn.metrics import make_scorer,precision_score, recall_score, f1_score
 from sklearn.cross_validation import train_test_split
-y, X, y_test,  X_test, labels  = ocr_utils.load_E13B(chars_to_train = (48,51) , columns=(9,17), random_state=0) 
 
-X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=1)
+if __name__ == '__main__':
+    y, X, y_test,  X_test, labels  = ocr_utils.load_E13B(chars_to_train = (48,51) , columns=(9,17), random_state=0) 
 
-pipe_svc = Pipeline([('scl', StandardScaler()),
-            ('clf', SVC(random_state=1))])
+    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=1)
 
-param_range = [0.0001, 0.001, 0.01, 0.1, 1.0, 10.0, 100.0, 1000.0]
+    pipe_svc = Pipeline([('scl', StandardScaler()),
+                ('clf', SVC(random_state=1))])
 
-param_grid = [{'clf__C': param_range, 
-               'clf__kernel': ['linear']},
-                 {'clf__C': param_range, 
-                  'clf__gamma': param_range, 
-                  'clf__kernel': ['rbf']}]
-pipe_svc.fit(X_train, y_train)
-y_pred = pipe_svc.predict(X_test)
+    param_range = [0.0001, 0.001, 0.01, 0.1, 1.0, 10.0, 100.0, 1000.0]
 
-pos_label=y_train[0]
-print('Precision: %.3f' % precision_score(y_true=y_test, y_pred=y_pred, pos_label=pos_label))
-print('Recall: %.3f' % recall_score(y_true=y_test, y_pred=y_pred, pos_label=pos_label))
-print('F1: %.3f' % f1_score(y_true=y_test, y_pred=y_pred, pos_label=pos_label))
+    param_grid = [{'clf__C': param_range, 
+                   'clf__kernel': ['linear']},
+                     {'clf__C': param_range, 
+                      'clf__gamma': param_range, 
+                      'clf__kernel': ['rbf']}]
+    pipe_svc.fit(X_train, y_train)
+    y_pred = pipe_svc.predict(X_test)
 
-scorer = make_scorer(f1_score, pos_label=pos_label)
+    pos_label=y_train[0]
+    print('Precision: %.3f' % precision_score(y_true=y_test, y_pred=y_pred, pos_label=pos_label))
+    print('Recall: %.3f' % recall_score(y_true=y_test, y_pred=y_pred, pos_label=pos_label))
+    print('F1: %.3f' % f1_score(y_true=y_test, y_pred=y_pred, pos_label=pos_label))
 
-c_gamma_range = [0.01, 0.1, 1.0, 10.0]
+    scorer = make_scorer(f1_score, pos_label=pos_label)
 
-param_grid = [{'clf__C': c_gamma_range, 
-               'clf__kernel': ['linear']},
-                 {'clf__C': c_gamma_range, 
-                  'clf__gamma': c_gamma_range, 
-                  'clf__kernel': ['rbf'],}]
+    c_gamma_range = [0.01, 0.1, 1.0, 10.0]
 
-gs = GridSearchCV(estimator=pipe_svc, 
-                                param_grid=param_grid, 
-                                scoring=scorer, 
-                                cv=10,
-                                n_jobs=-1)
-gs = gs.fit(X_train, y_train)
-print('\nGrid Search f1 scoring best score: {}'.format(gs.best_score_))
-print('Grid Search f1 scoring best params: {}'.format(gs.best_params_))
+    param_grid = [{'clf__C': c_gamma_range, 
+                   'clf__kernel': ['linear']},
+                     {'clf__C': c_gamma_range, 
+                      'clf__gamma': c_gamma_range, 
+                      'clf__kernel': ['rbf'],}]
 
-print ('\n########################### No Errors ####################################')
+    gs = GridSearchCV(estimator=pipe_svc, 
+                                    param_grid=param_grid, 
+                                    scoring=scorer, 
+                                    cv=10,
+                                    n_jobs=-1)
+    gs = gs.fit(X_train, y_train)
+    print('\nGrid Search f1 scoring best score: {}'.format(gs.best_score_))
+    print('Grid Search f1 scoring best params: {}'.format(gs.best_params_))
+
+    print ('\n########################### No Errors ####################################')