From 88508a0d07a05ee3b01648454a07ad125988d003 Mon Sep 17 00:00:00 2001
From: Daniel Ledda <ledda@cip.ifi.lmu.de>
Date: Sat, 11 Jul 2020 12:02:22 +0200
Subject: [PATCH] Added generic pytorch implementation for multi layer linear
 NN.

---
 .idea/MNIST.iml                               |   2 +-
 .idea/inspectionProfiles/Project_Default.xml  |  12 ++++
 .idea/misc.xml                                |   2 +-
 GenericTorchMlpNetwork.py                     |  50 +++++++++++++++++
 multiclass_perceptron.py => MlpNetwork.py     |  12 ++--
 .../GenericTorchMlpNetwork.cpython-38.pyc     | Bin 0 -> 2627 bytes
 __pycache__/MlpNetwork.cpython-38.pyc         | Bin 0 -> 4945 bytes
 __pycache__/custom_types.cpython-38.pyc       | Bin 0 -> 912 bytes
 __pycache__/import_data.cpython-38.pyc        | Bin 0 -> 3592 bytes
 __pycache__/mlp_network.cpython-38.pyc        | Bin 0 -> 4983 bytes
 .../multiclass_perceptron.cpython-36.pyc      | Bin 4897 -> 0 bytes
 custom_types.py                               |  22 ++++++++
 import_data.py                                |  35 ++++++++----
 main.py                                       |  53 ++++++++++++++++--
 mlp_network.py                                |  13 ++---
 15 files changed, 171 insertions(+), 30 deletions(-)
 create mode 100644 .idea/inspectionProfiles/Project_Default.xml
 create mode 100644 GenericTorchMlpNetwork.py
 rename multiclass_perceptron.py => MlpNetwork.py (85%)
 create mode 100644 __pycache__/GenericTorchMlpNetwork.cpython-38.pyc
 create mode 100644 __pycache__/MlpNetwork.cpython-38.pyc
 create mode 100644 __pycache__/custom_types.cpython-38.pyc
 create mode 100644 __pycache__/import_data.cpython-38.pyc
 create mode 100644 __pycache__/mlp_network.cpython-38.pyc
 delete mode 100644 __pycache__/multiclass_perceptron.cpython-36.pyc
 create mode 100644 custom_types.py
diff --git a/.idea/MNIST.iml b/.idea/MNIST.iml
index 85c7612..3772c7c 100644
--- a/.idea/MNIST.iml
+++ b/.idea/MNIST.iml
@@ -4,7 +4,7 @@
     <content url="file://$MODULE_DIR$">
       <excludeFolder url="file://$MODULE_DIR$/venv" />
     </content>
-    <orderEntry type="inheritedJdk" />
+    <orderEntry type="jdk" jdkName="Python 3.8 (perceptron_ffnn)" jdkType="Python SDK" />
     <orderEntry type="sourceFolder" forTests="false" />
   </component>
   <component name="TestRunnerService">
diff --git a/.idea/inspectionProfiles/Project_Default.xml b/.idea/inspectionProfiles/Project_Default.xml
new file mode 100644
index 0000000..cc52ec8
--- /dev/null
+++ b/.idea/inspectionProfiles/Project_Default.xml
@@ -0,0 +1,12 @@
+<component name="InspectionProjectProfileManager">
+  <profile version="1.0">
+    <option name="myName" value="Project Default" />
+    <inspection_tool class="PyUnresolvedReferencesInspection" enabled="true" level="WARNING" enabled_by_default="true">
+      <option name="ignoredIdentifiers">
+        <list>
+          <option value="Uebung1.anagramme.CaseAgnosticWord" />
+        </list>
+      </option>
+    </inspection_tool>
+  </profile>
+</component>
\ No newline at end of file
diff --git a/.idea/misc.xml b/.idea/misc.xml
index 207156a..c38566b 100644
--- a/.idea/misc.xml
+++ b/.idea/misc.xml
@@ -3,5 +3,5 @@
   <component name="JavaScriptSettings">
     <option name="languageLevel" value="ES6" />
   </component>
-  <component name="ProjectRootManager" version="2" project-jdk-name="Python 3.6 (Perceptron)" project-jdk-type="Python SDK" />
+  <component name="ProjectRootManager" version="2" project-jdk-name="Python 3.8 (perceptron_ffnn)" project-jdk-type="Python SDK" />
 </project>
\ No newline at end of file
diff --git a/GenericTorchMlpNetwork.py b/GenericTorchMlpNetwork.py
new file mode 100644
index 0000000..6145330
--- /dev/null
+++ b/GenericTorchMlpNetwork.py
@@ -0,0 +1,50 @@
+import torch
+import torch.nn as nn
+from typing import List, Generator
+from custom_types import TrainingBatch, EvaluationResults, DEVICE
+from tqdm import tqdm
+
+
+class GenericTorchMlpClassifier(nn.Module):
+    def __init__(self, dims_per_layer: List[int], learning_rate: float):
+        super(GenericTorchMlpClassifier, self).__init__()
+        self.layers = []
+        for i, layer_dims in enumerate(dims_per_layer[1:], 1):
+            self.layers.append(nn.Linear(dims_per_layer[i - 1], layer_dims))
+        self.loss_fn = nn.CrossEntropyLoss()
+        self.optimiser = torch.optim.Adam(params=[{"params": layer.parameters()} for layer in self.layers], lr=learning_rate)
+        self.to(torch.device(DEVICE))
+
+    def forward(self, input_batch: List[int]) -> torch.Tensor:
+        x = torch.tensor(input_batch, dtype=torch.float)
+        for layer in self.layers[:-1]:
+            x = torch.sigmoid(layer(x))
+        x = self.layers[-1](x)
+        return x
+
+    def training_epoch(self, training_data: Generator[TrainingBatch, None, None]) -> None:
+        self.train(True)
+        for x, y in tqdm(training_data):
+            prediction_probs, targets = self.forward(x), torch.tensor(y, dtype=torch.long, device=torch.device(DEVICE))
+            self.optimiser.zero_grad()
+            self.loss_fn(prediction_probs, targets).backward()
+            self.optimiser.step()
+
+    def evaluate(self, evaluation_data: Generator[TrainingBatch, None, None]) -> EvaluationResults:
+        self.train(False)
+        accumulated_loss = 0.0
+        total = 0
+        total_correctly_classified = 0
+        for x, y in tqdm(evaluation_data):
+            prediction_probs, targets = self.forward(x), torch.tensor(y, device=torch.device(DEVICE))
+            predictions = torch.argmax(prediction_probs, dim=1)
+            total += len(targets)
+            total_correctly_classified += sum(predictions == targets)
+            accumulated_loss += self.loss_fn(prediction_probs, targets)
+        return EvaluationResults(
+            total=total,
+            correct=total_correctly_classified,
+            accumulated_loss=accumulated_loss
+        )
+
+
diff --git a/multiclass_perceptron.py b/MlpNetwork.py
similarity index 85%
rename from multiclass_perceptron.py
rename to MlpNetwork.py
index 15f8200..df901a1 100644
--- a/multiclass_perceptron.py
+++ b/MlpNetwork.py
@@ -1,5 +1,5 @@
 from typing import Tuple, List, Callable, Generator
-from import_data import test_x_y, train_x_y, IMAGE_SIZE, print_img_to_console, show_picture
+from import_data import get_test_data_generator, get_training_data_generator, IMAGE_SIZE, print_img_to_console
 import numpy as np
 
 
@@ -44,15 +44,15 @@ class MulticlassPerceptron:
         return self.classifiers[classifier_index].get_normalised_weight_array()
 
 
-def train_and_test_multiclass_perceptron(iterations: int = 5, training_inputs: int = 5000, test_inputs: int = 1000):
+def train_and_test_multiclass_perceptron(iterations: int = 5, training_inputs: int = -1, test_inputs: int = -1):
     print("Loading data")
-    training_data_gen = train_x_y(training_inputs)
+    training_data_gen = get_training_data_generator(training_inputs)
     print("Begin training model!")
     model = MulticlassPerceptron(IMAGE_SIZE, 10)
     model.train(training_data_gen, iterations)
     print("Model successfully trained.")
     print("Testing model...")
-    test_data = list(test_x_y(test_inputs)())
+    test_data = list(get_test_data_generator(test_inputs)())
     n_correct = sum(model.prediction(x) == y for x, y in test_data)
     accuracy = n_correct / len(test_data)
     print(f"Accuracy: {accuracy} ({n_correct} correctly classified out of {len(test_data)} total test inputs.)")
@@ -60,8 +60,8 @@ def train_and_test_multiclass_perceptron(iterations: int = 5, training_inputs: i
         print_img_to_console(model.view_for_classifier(i))
 
 
-def get_trained_digit_model(iterations: int = 5, training_inputs: int = 5000, test_inputs: int = 1000):
-    training_data_gen = train_x_y(training_inputs)
+def make_trained_digit_model(iterations: int = 5, training_inputs: int = 5000, test_inputs: int = 1000):
+    training_data_gen = get_training_data_generator(training_inputs)
     model = MulticlassPerceptron(IMAGE_SIZE, 10)
     model.train(training_data_gen, iterations)
     return model
diff --git a/__pycache__/GenericTorchMlpNetwork.cpython-38.pyc b/__pycache__/GenericTorchMlpNetwork.cpython-38.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..94af4141ff4a62393c770e07bee0f7552ef748dd
GIT binary patch
literal 2627
zcmah~TaO$^6|U-g&t*NfAo5yZIUzt=pq=oN0J1EI*F;G6DoPAOEuyB~RkPdUzRXtF
zB-vHZ(>e+-mf$@PGmm-Z-_$El{tHM5zEd-6I|f6I`b^#Xob!F>>)(yX1BUjuFXQYF
z5o3R+!OP9V;8%FM6h<(?E0%8mdF`YQr@m9UwU>IepZa#}RzV%6VI8GW9jCFK^Qu8T
zNC%vK$b>I~Crkv=nGY}AbR_sEED4|Ces+{N#=Bp3+Qc8qMyg!5Dsj#Dp~}mqY>q$3
zb#Y>@-uo=Cmbot5=406{E8Usk@ZRr#d-q<#ji*mVUC?DOHwuGVr(h&YxnQXyUFq#J
z=?ng~^A($M;RyH1C=GV=;XD%F*N%19OJg~ZLlKH_=I%56M_7r);E9)xUS5%7F~rJ9
zjIpx!74ukn1>x<PeH&0&JZx2Q@}OGWt@5rbXQfn#c~6vemo22qs{BkUGp=N=DBuh!
zkcDe~-x?o(0E*FE_h%T*H1FAkvvxL&vt!n?%++4c1!DZtfv^0+Ib@%{{YPizuDqVj
z-L<cSb=dRX75qBeXT7&^Hk`B5A7MV)&<(L3%!l)l%?QSG_mExi-VxqY2dm?rt@rd`
zeML_;oK6ac82zJX9R3t!E}Mf6dHe~U?m7(l_vvH>-+I1g8&>kaI;S2^a}z9bmDe45
z1KX2Yst(C<4&F7s&C54TO>oCQ{xm&lYdNi?5c%{(i0NTlENj{5Zu*gGk8w+l+)W?k
z#Yx%7TlaU#oFc)6Txiuc*=*J{(^nullKS&jJw8~RnZfM}EG*i3apwxTPW%a&!_MD(
z<;)8h53&p#)me6MyK0NP>h7R(c}e1^5w0*!rIM@0@0M^y5sW6fJZ1tLV`pO7AQ%GP
z1o>hi8)2NLF~NPrk}EU0tJ<!+*C33=*?n|PSixqq#`q`~)Q8_LbXgnk*CMY?YzJir
zRyn#gfsmh-g;W9Fo%qJ<WHnPU28wjR@G>1(H!@=6H{8ToRuEIO%%)ylrLEtEp)=hc
z4C8w|;5Yb9KEQMS*8fisFddf7VyUx7ww?ne^-?tjk>#>c!ihL{@pOkUn$3C7VI9Gr
zIxEm{?vnNp#X;|DD_66%*So!Q0ZOi%)0=h&R%r(N9gxgD0=s;n&ld98zt9q2eIIw5
zK+C3UmGNg)n``w3&4pcgT(_l2JoN*N)sJbCf1!vE+guPAZ9+^qYt`qu64x-(SwZC!
zehtqaKY#P}3E7<@)f?-b#APDaxq1f|eJdY?7xBgB;{+X)AWEBx59QA<ICAh2N*qOw
z6-2w?+MOdGu)cQJfetqixTmheR^G}-ZlZNef`Q$G-s}C1vmS28SQ%08^qMVe_vj(m
zo8Xn|Etq5snvt(6q^T(x%AxuRjPa_rIkx*O!_+OBjL)TNGnA!J-=lH#C@&sUx<EfI
z7fG;9@Vi)32eg5onaM&)Q5K}}*+R9Cz;dMJSnBT8-0wZloLscU$v!UVsMZ+xIN@(w
zd;ZSrLHPD@KygJr|Gc~g3__Tqw_yAQoflvTKp@<ei^qEo%p(BfuL28<zXK)!D9~Ym
z0!;-d;VJ@DVIR`>1_X}*UDQVx{Cx&UJstOPA3X+@G4^`UAFzdev~e&7+4T_A$Gixi
zx*&RV^qXV&Wt$>FPWTp;q3s(N<&6(31ViVQ35!-KS!grK3kd15g7%1vR3#aypW(!R
z!}<lvkSTRs=U*7Nl8te@Wo>a*RKLk!3+^xJmOEr_!=yLti?iK(tFx`h(C1KC3aIyJ
z>-%JWPWy*1=<pu|h<13%H?gz32}96(_BY|TP=g~|jSjcJfBr9ty1XixkT5rSEwjuF
zvaD{!vZDSd%TAYhwOvu9SjH`(#Xm*Q>f%mN9$G=!mWNAgBxvdvWGF4_0~j;jiEAON
z>QZ2>sQi$&SgEC&r>C<Wem#C8yb;+iM>5{NDzc(~&@_su4=Foa;NxdqQ}kvtDwdsY
u>x@*d+xlT$AW5;nn&5#A&tCgdd0AJ;3lrVmCg2WH$qHO#llmP#a{mpJ+K?Fl

literal 0
HcmV?d00001

diff --git a/__pycache__/MlpNetwork.cpython-38.pyc b/__pycache__/MlpNetwork.cpython-38.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..d1f2da2d3dbdf44ad9e1138b315b756122c9a967
GIT binary patch
literal 4945
zcmbtY&2JmW6`$D;a`_>OmT61=NW!#EV77^rv}xKVsvOsL9jBJ!)@~1rri(RaC^O#W
zQnSn0B9=e_8L)e3fnIuv4M;~_`p5LR$M)a~y|n19D3Jc%EGbd892e*kJ3Bi&yYoJN
z@AuyD7c(<uhT}xD=sm77_E)-@K5X24gfspP8o>k)Sjb%-8m<wVt{Gac#cA9K?6BY#
z!lGLY9oGp<Zb^@uLD{WbWx^8n119V(!>x+CoS~m^9-E>h$`5R}CXP*w&4?PtW@TN>
z-ZfMzYg-K8GH<fh+#aN0Ei1Ec4f=u1tn1x4$(&1m5cs!oU%D!LQu#@wFlT;UCSD@r
z#1nqvd+U=&*%|#n`Q2W(xBl$I^0n2ASFd<Cuen#UMqhP%iPsI+y(IG5Q7?`Hxz;8b
zrjLCa^)V`$%LQ`{=*)!yoek)0iiWiCvxNnnZBc-J1#v<a*O_!W#wjK(Si=}wqa@4H
zI>kigF&9-a^T2W|q9$e^Ft>_%b&MVpa~Pcw$6=F`Sz~n&B;9u4$MFrR+OnUhsP|$i
zKc13O)TAj4e9;sZWU|Dpv>{VL%T$y_QGmQf;ozC0rDJYMR74fBl*J5IuMb~4YW2kf
zL7u*S>FnSC^8V=yEuNJF>8qXx56QMUWkTv(I4|Lh&!I`!=X~2px#06`2X<`0nhPvt
zo|zhGEy1w1xwgkKch5l6vNNOCcMHnzi70d}x@N_Dvb%mKi4~BI>6sPFpp%umz5XEa
z;_guD2fIui$Mb*RTDlX3aw(8P_)B+$Sh^gw2chgG@zM<ytt&qaftRIKzkR3Mlg;a-
z3Jvu4ZSHkCz24Gl&|j0uy-3|%>~Cg{=K*Jl=Q&s-CM6j^&4=e-VztG|YkL%*kiDis
z9NZ4PzTZ`GR_jM`H|c&MJwRUu&?+J1cLCD2UWHb|QNc+|YtuePCt<0%#V@nZem}Aj
z7&x_rG0(naPmC?jSpuVPG5tLFl`*n$7DmOCZJTLfhmV}Jm>LMmPlVAkggGjuj<D|9
z>ep$BuKhsYvnbH_Y*bFm@%fZ}ZsD}kQiCOh?V_;Pd0HUHHrPBl)!I0};b@l@)`oM}
zCW<tBgYdRgA2ihr<lg%Vha!hR#fjq|7g|nc!_n(9vvs6qC5cza3^FT3g9L6?b<EUm
zR<r13wy%`G*{Y~xG(Jzw0yU@5xDMX-$c`EBX8eA}H?wkINzrYSU0pl3bg>;NCEJNc
zP2M!{c4j9;DFn5c7G=E3=lDrp=5^lW79YOxGMDT3+l1!HLH#05?Yz_IBy5|*lm@P*
z;4q_(j~xTiV63S#n9;IwMNJWnm2YBn*U$=QHc&JOpOIX>h8ZVu#(Hf&eDh_J=C*B<
zGbRW1i3qi*=h4aO55ls9LK)W`eg-r?k7R(W-C&o2GYDQ-JM<xvfdG6HXH14&2Sh%r
zjyQnJxA-574eMqeu^<!^{M<4!WAPpJ4NQGTv8=otAVIXFu)jjq)8SWO1{;3*G7Tw3
z^dc4d_<$5%P9&ZN&*E|rwf!JoL1*%HjZjs?8hc-%X_-0hG~~?Czu)3H;D~6ZAfq$U
z3zi{7P8{;#{~_)g)+Q3bg?!wq5GD2eP<mcg_Pj6>gMj)~&)XRI!T5>Y2_ipHCrDoM
zh9cjpZ&C9mH3S*8M9qOpx~D^-d_eyM-<Sx<;dSe5*)i37xOw`Y-GBah_4bVmu+$vx
zvkHZtPGK^q>q8_)5}4yNZld#$J>(CK4q^Z~)&Vj=UIeE{hKKB{bHj6>D&Rd5F{Xgm
zpsJ7X!Zv%v9`POH5U{k6Ekk`9Q#0=E=2GT7qM2h~SM?UAyh5KPAvL((J<?kfLO%*V
zSm`XSRM8gbcDho<2xPqynMb`(4N*&O?jKN(EUg_xuTGHi%Ga))Bf!Xcj{tTk3zLh<
zNIHa<(Sco&hjlV|3yHu)!Z469%r8;ZJV6rSEVYmrFp?TOCM6H5)Hcdv4-8+uH7>H6
z2YNL-k;-qILvwL)5o*4QrPL3pAv<b(wd^T^CPCHfXtMIbccyTs4MC_RP-?6(FmIjL
z`0(_R=FmjD%T){WpW|Dy0%1+VBmsFnWF4eQ!Wl8|7LfKlzKH$kC5<o2*vOc`)effa
z@--|)qT!-R>O=IWNWfVR{P4E$S4f3_;bg<Nj}$v+-D&*f?@?t#Oq79X`ne&Afb%8v
zV%kC^!W%dzP&xB8i@ew><SeoZAz=$Yio}i~Pz*dkDeybWME07-*`WYDWFX?nM?5!B
z%1$9(6~RsYh?*5NNLS>WDbCayT)>zf{|KGo(P4Iwua7Vk62@J*3C>xhuV18wf=3;g
zi?E+Z);aWOd}6Mn>)eCokd5jG@I=uk<o)N&NXboy7ny)^V#-e;rSD8k03y(VK+KB1
zCV(sGKZEw{_!nJy&qFBXoT(XuxN0Ko(dFe4FHv^*9xXP`4mI@-E%z=p-=XF`YBcYE
zmwL}61cIz0;O7Z}Y^HufjpoOLM!S#VqJT3dB6E1{M8iB?m@|<Q=*b=ho}x4j|4_(h
zvpP;`kESd3IIHO0Tz+$ixpaQPD<nz$Co~Dl4_(fpLfYaZ6ZhltHZg^{W&9Swxov^B
z*p30-LP?@$(+-u2U^^*LMxjC&oLAHgP!L5hfJIpbqjqX1xZ6TWGb-SHCoO;#OR0^v
zoIgRY@}#K0SHhZ9a?g#5Nf|3w(&CPmZ{v@eE30e6>h;JM(6vc*{_w<)<$AZ*oEV^q
zEG>iAbyyA0tkO+09<<vsjyr=O*vuzNu{f;X!iJYVqu&6(9*RP;52Yz`rOu<MtQNrR
zd}Kf>fN_UYdH+jdaf2k&aS3dYW8oHpSk7VJL~oa8wq9n6%u36&&%WPRE0m*jPPE|k
z;rF#F9(HB<mOR|wvU&&mr>TgYd}Ua^*lrJ$-`@P7IW(H*hp#lp<u|n64>!>SH#VbA
zbJ%DmQQ`+pLP|47%3`Zk%`*$tA{uLo0FxIongj@ynHdkl%nW2N=Y$eXAuP8X4M+7c
z4P2v{$0mN+|MS2t?f=o>mU{TBK<^M-#~%x?(^qb$Pv|og581i@#U{iAF+~OAj{cRg
zub^HHdy6V|7FDip;OX8YMBCoq;Ne4&K|w_xzl1ZU?2}i~h=`oQjgh5u_&5?$)Yi0<
z(3PU4jxZQ9v(Cr+)=;0~tLmrJ9FF&FA@uJ`Pb-NMT6EX34c2%e9v|mv2m2#va1$d`
zmxkCuc^;5<mA*%6PZ&WD{EP;Ej;3|YEhL+L09_HK<`hJF>N+*6bi;n6@;`nQIXBlt
zd!791+9)^sn|h~|141(#*-?v<li-0mx~F~SEJFhn%qx`8Vq)<HzQ7%`)@sxnMTh?v
Da+_|`

literal 0
HcmV?d00001

diff --git a/__pycache__/custom_types.cpython-38.pyc b/__pycache__/custom_types.cpython-38.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..07ad83c67d130f3d550407e4ea2c6962519d7ca3
GIT binary patch
literal 912
zcmZ`&&2H2%5OxwLo2K3F_JGvAAr44;A)HZ#D%$cRl@)@v2VX1`&vsKePHH<<%M~63
zjywb};wvX!ffM5_pjHA~GoBwu^UdeU>3CcaTrVGt__v6V@4>mfC_4Kn_8OHWGE#(v
zGgeU(v$#oE(oja5l%>%+pRp0dKyl|YG9!3y%*ZmH5mvk)GLiHXkra}T3EM<Jl^Ock
z;BNuB7=PaWLQE$|Y@(^m*+fR~$b91mRws)&_3269De%QYG$7YDJ+7_u`GHVMyjM_#
ztG8Ez&OV9_3J8lNVeu(}1n5N?<UEEf0ECf@_U^_p`#TfwA$WvB{ph&0_Ia;8g=?r-
zD#6rOi+S#I&Naf~+!vfTt?X5>w>ZD-g<5A!iWq#XJD&<;#Enmvsuj*pI2T&CPPn?&
zmh-Q~Oz`HQex8-9wt-TCl%iZoSsu1k-+*?ud}G>kBbuhx=jCfrt!fSTk3kq60v(tN
zI%itVmrJe7s<*CfxV!1VKI(2vh81!Y8y>lccB3KkfBqigwY&WN;Y%VrfLzK1S)#~N
z>UWN=gzATW-h%Cwvp#j$pz@=tH3ll@r=r3>dL<l4u8`ElJTn21*$65OrcY|^%yw|c
zLH#9VZB0XL2USSg&`%NNxQEz>tm>tB@|Y!6*UzU6%bRNDGwdJPF>&}d%!Uc=uOBAW
zeS^eohQLto9$J2UVniJneI{JB8b}%nFd7Q5t=e*NCF)`NSax`H_Uhp1Ur2qvx1Nfp
W_@@yYz~{(%9`7d8bea`W7XJd9P}N5O

literal 0
HcmV?d00001

diff --git a/__pycache__/import_data.cpython-38.pyc b/__pycache__/import_data.cpython-38.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..9ed9e070e35e0f22a31c271540b0445fe762201e
GIT binary patch
literal 3592
zcmd5<&vV>J74B|HGn(=EM<!m|aS~$|Fqx&+PS|CE!h}uYB)BSZvdM-`sn{Ci>GoKO
zG#a<$+Qg+fIn<g1PzzK}IoLP+fAB|8I)>BmCvbu9wd{%Q^@iex<nDR>L$ABP_r3Sp
zkA{b<49_1fm78<JjQxWeN1qBBAEP8=oH5BH4_U-L&Pf)bh%C>FY|oAy&xuN2DJpwq
zGiHTuRPid1ZLcaFZwRHPhE#2wdBe(9Bg#>u=h&J!$7Jahmu2a`u)VPpBNdEP<q$^B
zsJa@JwO2w8%MrBC%8TeRI!y1FJoCcw#?e<-R?)9UjrRI0OP-bE_~sosqek(T+f0>I
zMNZ1eHS1sxQ<!y5PD96p{MK7%otGCd3*SCujoCh7)!@0a9Qke4aB}C<&2Ff2=TRq!
zJGp%)NYcD=TXmH7(^%*34L=P1)llJ^;ZL<6bb?O%x}UbzH^-o9_VvrJUcda)>z99i
z{c;C?{R@TqN)WZ1tIt!Fv|xt8Q-Vb021+7PrEHf=o{H336H@G1J)ZGhdyn-*>ZD?u
zFR{-*>{*a4BhU5hjHM#8##v@hvU9BGWaeG7GLhLCv@EiX`Hgp>rL@P$usF1};#m)F
zU-z8V&~H6$l(oRhxz$l$<Ri;>uid`cd~olx=EG(0=3)EBy*owQ4r5>Dj`llk<=M%4
z{6(XriGaC<6MCg?@JxkC&V!sk$sN<$XL=kH{`F{KJ&x2usHF54)}>rnid&nJ>ZHlS
zeI2*8A4Pz2;jZ6W4?1f0j`B5OyU<m-rMjt(JI%GVPG=#Ay0K21(og;Q?(@7xn`m}}
zR=TNG4GSeBs2Hzvm)G!)@d>Uc(9__WEOZQiIygCq!T)0jDI6pP{@WIizSQHXCB?2S
zEor}C8OvaeR7|qpg7iyloA2>$IMPN9);Pr0S<z(R{OjvD=zfTj5GC5s_W3yUL#JfZ
zu$<)M>?^Th!#<+_0jBh6b70xf^?Q$-4}W=WX?f-LzR1P=WqlSS2GpW@2hF^?7=o&;
zIO<-VLOZchm6%{#m%2LWq)j4V8aG>UCy7HfzZk|XKTNJdIQ*>P=uxAo-~icQ6QHmo
zX~^v-anNZ9gQ8c_Ks`x)ou1st_-X5r0TN<5gF)uF{x+nB$cNX0P&H{QDS2B-D_F5}
z%tQnmnW%+w;365o+7^GjZ=8c0=MYaocqybsrjfREelOrAFkEJB3z%}YXQyTkoWho+
z!i2@VU%_-6AAZJu#6DpU*yF-Q$}73ht9=5o@1n}B)u6r4^9uQJtfkU@GV{KZ+i_PR
zPG|+cun4B=nvSEw*A1S4^<C27k_G6zg+%<#E1k`#8Kf#o^cl=K3FQ!JZ6e&jr-(I)
z3H2bg3sR48O*FaHBAy&RG+}_&-_ZcU3bg*#6Peg0v@C-Jh<yyL0v`)hFCD=UK?lg9
zPnM7LmJno0<E&Sf<(`{y{g>3v+^jr_Ae5C6ips`)CVG|3LVtz6B$TsC&)wMSe01vU
z*<MAuvH~|7d_yia`0lSKEL2_5-^Ka#_o$kq>ibk(Le(eM_D^+o3nRt}Y1BBOODrlJ
z?+E<oF?^&+9;Pp%`XS02*Scuz1G^@t`IG(uCO4|a`kw122b{P}x~@<~$~>1S0B1@H
zsTGHih$>02rM#+fG4rM8s*W_$iH+rz!8QmH!xVNvk_iyS<u=|a5XKc#_|+d_R>R6E
zCnW_VE8%Kbi26GiJVq(<0V>7;--D2{lxHvv@($vkaj*KXMGp>#oP&&G9I9?I4PU`J
z)>hCpYZ|^bZ2e;>(LbSztdKi~;3p4NKRi?uduw+6Kqs_s13u%^T>p#|(0=;=#zPBL
zS1Au0;E>HWqpzQZ%zs#t88mi~ZJ!EVlj3*$OZFv4)}>hQlCvNZBbqN_R^WnLbpF9Z
zQHct9V3MI~;}xvOD5R%+2f(C4aw)d)BK|xkfKV(-*t_tkJtPh!Wh=9dgk>k$4x2#i
z!geI3ngYl-dN*b=u|u1kc{92(V_<exw$4*LSxB#3e)@huH<@HUkk3ANf0N?X(ZM2^
z(BPF~&_HN%*1oNOij$b2Wzfw_eiy+_?mJ%DZy{MXpB)O%i+Dx$^DG!>U+ACHw^ym6
zbgxZPs<aO;PQO53Qb)yjmCvG7kqD}WrCaZ{RocYWs7UI~!8dQ5YS3kL?^{O}yFrVY
z6|a+ImYw_tg+!Tz!Z{<S5F<nSCgfvmKV%2}{x1yq%|HL&8FHau2whoEp~%tEw{S$0
z9rZP;4BP`#YqG;91ll(kdEVIM;KFQfZ~xuUdWjY~Vchd?QFNC!aLmBB(9__zaBZPb
zVZ8a6Jmp#Um+ure;8Oa$iyNmV+iMDWnp|AdwMCavd9~JNk|Mcdo=P;Wqo=8&e53Kt
z7t<6|a>rcs^*nXZ#mC%saw|!-iGW2cG~tWrr)i7DA<an#kml}U6wA#}U8So=LMzqy
Y1zxi#oZH;BrmNGXF?XUq<IL6n1Lg}F<p2Nx

literal 0
HcmV?d00001

diff --git a/__pycache__/mlp_network.cpython-38.pyc b/__pycache__/mlp_network.cpython-38.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..188d81cc3e48b5eeb887e9eb108019fb41236359
GIT binary patch
literal 4983
zcmZ`-&668P74M!ejYc1qceP*k##xdO5LNMpA_OY9oPdo(fwKghK$RdhjMcqb$)g#$
zXB2z4MyEAJIOM>YP_;Vxf8bBx#Bq*rfGs${m4bxd>(OX;<z!UT(;u&2zwh^2?>8DA
z!?U(i@$X$`?5{L9|5zBjg*W*Z8o>k)S(oE$gvQ9|8l2|L&>UG^Yh-urk<)cXm2PF^
zc3r(@h1HSQ^+vUBO^@xcK5BFuy3fOAw<-DXl73sl`NR|z;Xbjtmlv~G)$>*1VSYt6
z<Yl>XY;;#k2vPgQ5OvYOYWu=mQ(VH_+J(86xQw~=x0zTGt529%1*Q$r7HdyfcT;YO
z^#_Lfr`$YdppV~UosCm)&GtGxuPND!mFR^*l636c+Y3fgyf+z#GPjG5b$5`YxqB-J
z!{9!qt8dFlsvwP3$H=etW$LFY7(|1p?~5P}{C>HdZ|Fstq)Q7pwsJR4k~@>AW9HSd
zl48(HrO2&*9E#jgGM%WXXAq6^hx#VoTX>Tenv`WM<C|b-l^uhnr^enX0Rgv}Oh!))
zRl`Wt(L7~p1)u-Czk3jm<ZdX12zC#I*u5S1CL<Z8$?m%<?yF!l0u#IM1igbnBzNx0
zKoM8FW2t&_oT@nT_xGb{cNC8ONT!cs_2ByWFki!Qe)4b<D4F;n*z)%$QLl;<6U_lv
zZS=pG8zNEgf}1wG$5ay&nqmdRo%e_VwTdRc`pj`cs=<drI`~jF08k#fhCUR;A1j*e
zaWv&aeWFhb^L2Dmb^-zfe_#tk7#JBDtFam1U{`4kqZu#fi`kh8D>C;Kp*p1oiZr5e
zZa+GZO6I0~Jbud6Iu;5}&gicsgZ?NU2og%-qG8<QD}4P^wT=EWbdsNHItiYXe#`|g
zzMG81)iL(e2G%-UBT!e-Up})jKhxKux&nw&O3$Hx;Y?E5;!L8bIBUvNUdTaz`HWx1
z*-!ai$5dpFYLgnm+%YuU-D;pzaOgu@%hXhoct0HlkFNnbp|cowxq2So9u3YvHU@9u
zP5y{R>Il^}q$!{cc(^5=leToWn5;-wSco#VaGu!RDrVg+CMutB;fg9EgC}dly6`Zr
zi8{uOa}W*D#7wi8De#F)h&@G2xm3(ZM`KvQ8LOfV_?8~80pq&Z!1%JbCRh4QuI?M4
z#}Qk=a7A1NHEppCEj^!Kx^rhwPE-)?6~2?(cY{Nzj<z4kLH{64b`XM6Kc1vTCxj0M
z>Tmyj`tLu#bN}5pDNrP-n)DDFWbT%JmU|(&sgHOhds>zd6g>{!g^l0GATu-OvkbQE
z^FHjzH&Qc$EeZB(P<+g9vk%_*r7^XpcE*OriIv(zC#{^g8PBXOmf3w{#`V}f`wHV@
zbH+J)_<|rygg<CYH1o=wClESkDzE8Y!BwZKz6_GoOK5T@Brzm;RYr(L#7OQ0<FSl{
z+99AXQA6gH+ecExNyo{pM27q7MOq*f8d=T<T~DL(lK}v=$DO&I>-&h&sqepx4GB3W
z<BtAqqP2JnHt7D(`s`?PNln+wjfku^0{mojA(WAYlB~6lejA;PPZ2>NL#}1I1DTpr
zD}~%oOz6Ov8OM;QZ)Midni>zASiua!9=SuuR$s$Mb*Lfl%bSJ7{QX!x3Y1V^DWF~<
zfL95?gvF@q)U!4B%Z%6er4;4%uLCa8g#lPz!O!JK+sh1}-#{6%RN;7%_DmosA7Y(M
zPP0yW0MlT9i%m@(B+Q{Xw20v;n9WSz&a9G6r{GX))f926NGmyiPkj|%2!Yt^;$RpC
z)F$L(^-avEZx9sHV=@WTB|a6gM)F_8)E4x5bZwcri{iYXN(z0%ljf($v6L1N_7Lu7
z3l*7#F*<?jBZ#Tjumdq~p^zoI^2$8D-z3`T2*!^#mZ_S<AYXZd2y)g1L+(&HAfpRH
zCj~6*jp8i{{fx}iJRy<unNf<`F1*Z=k7Z92JNG3Wo)Nt@;okuwb%UBEw`ul*ur~?e
zlsdJ47a%1Q&xrOSC{Qo3<_?UM%!kaSd>ZIf@DfMKpV0h<?NdB5p13JXd1fAK4?5<*
zB_0i7!mup#h(q%u2D7qLnAFfY=2J&QAWjV{(@N@|RI^HEXHJ`-+|07r&;vv*bKC4&
z%wWC;{J@D^YCo{l6DYZ!xicOanLDj&T*xZ$+7iD9udZpl)HX6NtIo)<>*sLSOWZmZ
zR`xzOtx^e-kYiH_{-8bO8UKi(IBg3S8G`@LcnBYXIZ+(d#f4S~?83PIs`heJ6=!<V
z1(A0nM1k6iN8_8{C+s9+2TUHlvTSAdgWdywtm5(Y8(|D>B{$J2_nv-+=k!xF>QZ@l
zr<vO-i25jKLKzi4OOB2}NHv$D>Os4#4oh>xf~uv`4qe3Mbvl+#^+y9CLKu>c_lgRy
zPGi~r-XfIb=Uq?eBqx9`Z&B-uB8AZQynSxqi!$9b=X=U=Z9ay7eTWo&4vEgL-PJi3
zJ@SS2y>5NJNskJL_#RQErCnVJ@iyiX@<7I~7#?q;jH@G!w2f_yJjB;FKic|26`)+(
z!`2G{h`fO+LLGpH=x9G6+lN;aSz70mJ>(Q*736OOSXe)K1+s|1bpRe<!!Mi@*uQQq
z1TV5wCo|y%E+DJq7upNl%$f3s>lxjM=DAxDR~=7hq1=VkkeQ_@H2*o;)=E6nb*ECO
zlQ`4Xsx_&8M8mt(yhF{!5TkyGxu4-psP1R{8e|74;)n44^5@C#Sz9_Kn}^p>z{wps
zj(Z2mg{Vmpb5RZb00U%bct6!Vl&o<5Fom(fe$W1ZS&k%j%&@jy)<Z}E7UBtIaBIeA
zCMuqn9=h|I=cx7G{QkG2Pkv*ksDdnYhsd$VY7nLB$LJTi!Z~O1Kh+R=TanF?!|%&*
zNkqA=Z<s!S=h>}})ZOGqYs=!%aJbg07XXXTPw2Cjqxgw%ul4=h^ZijQCh$T(ulqi3
zZDFyZC^Z$e7UjU)B%-NO$nE_w4pOyC>y+%Yn=49ZI_Ii4sP`r{nnzNnB6%w^XGNMl
z$IhZ4Q#)9A5pP0MF87Sh+DfJ6teBhT=1Qxo*Lzr6JcN^8?Hxzxq`0x+zGn7GgVwP*
zWvL--_ybQ(LD_>%sp^6U2xo?WG%^D^eW9qwFmGq5UCCFVSt?NM2gWgJ_O-M!bkpk4
z6P1r)3s^_y5V%ha>tq{R>(#wM%f!u3fQ(a;Qva1(+yD5>>sQ_!{GH}WgeaY==>dwB
z17vX>%MtB%u#mTwudv-}q2R~<p&~Oaq^5;^kA}KVY9;uqK^s#%P6u(6;G%z+<P{Vl
zy5Q9{<I4a?fowy`GR!Y)wCDes07>Ql5nZqB;)?b@(dEs{5FkINvQ=7ot{^aogs*o+
z`X*EU4X_Uotw*LyN(zK^eXDJ9bwJx;fFt}z;`^N|xs5V^d{|f!8C~wAhhxyFAULMT
zlNE{Y%!cyXU^I?ZQ4}c(kXlH2y*EkHc;sWdOth`4`?RP{^B2^kJF}uc0@Salp}bq<
zEV^uJU1;*u&uMrTmKH{uyEh7Nxk*?2ger6woNXgO)wye~Tbq_=ww<=swwt%yy379$
D7UFHi

literal 0
HcmV?d00001

diff --git a/__pycache__/multiclass_perceptron.cpython-36.pyc b/__pycache__/multiclass_perceptron.cpython-36.pyc
deleted file mode 100644
index 518a3e5889070e6239a582063674ecb3b4316cb3..0000000000000000000000000000000000000000
GIT binary patch
literal 0
HcmV?d00001

literal 4897
zcmbtYOOM;u6~31biJ~+bc`SSUj*>co)!NgfX_MA5#&&GObsJAz*lhq}Qi7w)Q8Xq+
z%_SAj2oz9220UGK(XJZAF1qL@+y0a;xoj8dpqq4S6iB~wsmIt>?E=-{US5*-aUS3K
z&f&bfuwWng{Oe!+slwRb*@2&l@fEcAAv(bX4_L?@9%_yj>W&^7j=|}<7MNkdDTGC*
z7+Q`MmYh;(JGOeK2W6*nlL<qZ51BAWnzJAl{VM&5(qmoNqWsWw7DesAvx->2vzmWM
zRPSr@*Z$&&VK4nIYaZH%B&=y<=DmI|@H6A1PMl=cH7^Lf4cwP*`dwdoNhF(QW+i@{
zxI6A{R!XGT>8hc9>-N=~H{83ooEuraCp+E5?SySNiQHDyjU(()i9d}VxV=s*=}UjD
zMF&oPQ-k#I#Agl{%+a767aEk)pqwu1zJWhe7*Ng>1t?MwNBm-&`PQa(ocV^Z9&4f`
zY`iJ?wr?C~qWqW(Qrd9JqAC_2GN*!hH9S2emhf~z9ES2ov-<6RkaSvs7sq#e+46gd
zjJoqB{P6(^Mb+1ZhTU{w;8X(+Fd<Jt$y4-;q5xTo!ooXCNyeO#D2oc@u*CvSt_@zB
zck;?ih_5bOJN3`My?5erlV^6|d$Q}o4Sq`>n~tv3uA#+e(Isq)Z)qtPe3^}4zdEdV
zjHS%gQw_Z#7|zw#_BrP6Yv|xmt=r2A((8&S%nZ6_#Rq<;{b>@*1)8B}M(hWhnceC3
z`iUEN2EKanC6h<-{^`%JU0nY~?8|svcwIMMzaF*vq2Ep7^*b`!@>}_!Exj=8bldAQ
z?bgGo-QC{Q@GHID%yQjMx0AT8g#%&(9pfkX;M^<BwK7?@Z({`nuL>{m++ZVcdtOJz
zS+y6%ouu=b?*iC<0F@HLbq5%2sZ+45j8;TbHvKaOJAX`As*m_}_Q~&uMgrTWhR~MT
z7wm~P;+*Xa5?Fi$dt*kht_@AJ!myaKEj=xa_|Qs=sfLhS6Ixdj=CG7nLcedyjkHA9
zUQgY#sHg7P&`$06JXRZMW?HJVq_9;KMw_Pv@@kzelShs1^B=Qq`(scAd|Fr=EZv$Y
z)9CiY4PRbt$SUNQ<m@&YeqUeS{|3LNm6`B#+s{lDtXav&5;BFK6{3CuKg+|IuKX-(
z7-gm>rMKHG%Q`(jLETB}PN8!wtaizk8Si9#C*!-B-IKmRw8OTUsjTf3TalE&gMv-o
zEn{_NDjoq%vY3uyyvmpOF>do3Z*YST-h7qY)%q5}nSOL7N>L6ZK`AI;N)1<CaF|gA
z$4G<Ow6&>WnntduE~2sWZ(waxQwnD$kkk*KlU%-z859GtI-3vPdX=QPZCm6K`q7ne
zr$jx6LC$#)mL(L&xQ_Tqkn}RB9#^x@uH%XF_jD6Fn>M+N7L#|{fX645AqQ;vi2qL8
zHty!33Kr2p%}p)SR^FCpG4(lxp4yiJP=6~5d#hwQrB{Ise)cN8+J548BN=*F?h7~P
z4_85E<x&u}ydYl1V6u0P%SD{9{|&mPo}*0xO%J`DCeL9;wmkrplP@{u_(WXB2Os<&
z;;!Lrf+8-oWwT6V)b&E&bu-&_!$|Z48dqF*yYB_#H|Ay#d5Jtm@{%tk0Z@L2I&!N5
zihP?!GnLdx1%N%{L}H$pSkK}$<CJab@&~y2>fc}f>#w&r?p%hYj^I8kQ^2W=<>xFt
zr7t>NAGf%H!6WvFKhidVe56wgm;h-Ji1suWiB_e9XP`uqQ|!m2jDk{ah{;=QkL~f1
z_6(eqa0rp}n3{2SEM3kTiYKNz$_tosnzkjl0#fhH_0fdD=Ya<2oS}2dO7G5Q2Pp?Z
ztIi>#$oHwEl%<UPqA+A@<s#y&NywglsT?^5w4Co~*);W%nWijr1vfhvVOubbN(1MS
z0(2w`4aq|P0!7RdBoNM011SMd-~*krM5799yE3M5eQj{&9#vGxl8u>;jm=2rw~c|m
zva$k|8#qq>h`QIPBZM{01H?>%%5R}_?AbmCkf#hmt7y4G8{>7bZIusB%r%E1SVY9P
zG5-agCA2B9Bp|IvY!eBRkVcF<0@j{I7%?6pKp~8>G;!Qs&S{)tk0=!vBB$|z2MEBr
z6nNo=@K)c#>llp<F3c4;=h=fO%GXgbLoAemWqQhlV}e(z<+#b!l*&jX&6{-AnBY&o
z<h1#QA;^+p2nr+oQ8;dDLKFH!OBlbUBxJ5Bm`$Vb85>as-{ZNBQg)mI_60j>x%AIP
z+(oQxlI&>zE#78HdXBA-E$;ifh@<af1Ni}Uq|J*KJ9xe_8@Y$@H8I=#I(K$B5>su4
zRMdXL-+9KIWPX(-$s7cklpm*98=FJRqk#x^BHb#+&p|#r{8`6;;3A%K>Qod$96b?p
zetkJ-5drl*I&7RIs`4E=?t9d|OC6DRPXFJh(Q|o$Od~05^1MLSl9#EQlN=<~qXo2>
zvXaHCN9y{C!jg{6KyUVmgZB3jPW%7Bj&K$Qf3~P17DNJDqL_=bvifSvZ>Ah((T->;
zg8za+f&zqiDnX5e!d1t;DsdAn(S<(JeuGd&S*oXOq+u3{5;dE?Kxvhk6ezn;DGcr_
zDlRC9BDlbyjDx3UY9_d&qGnjYdMhn}9ZRW+-p=1(RDM#V{dUeID3BGOE)9!`jkC)s
z-q5@4Ka5$kvNouE6nTP3ldAo}kq`ZLr`wnqpn;6-2d}FL8=SmNH;uU8YWZ=z*$;x<
ze4;N_2DN+mu%&I(3NY<7Ajv+|$h9h`qP{u?hUY^KGN~$y3jALZn`<hkst_f=!XcC#
z^J0sb1W-5C0W(^ATDsK62lh@+uKtitAg~*3@V-*P#Rr+IoEOghTAEc?lRXCZ)mE!7
zz1Hr<#z1SF8=P*83vXyUjWW>yM>e9(#-QFvqQnatbVwsd$V#(W$#V<UBMNAefRYz8
ziU|mknI8AUOb`67A_iHaDFo!ErC=zp(Sz$W^U%Z}uKFZ{tWHU3MYm3=i~kd-Zv)5j
z#=@%vHeuu&v=LEDcJ_a<3K3RJ1uWy1`m=dOU90>kMh#>-`4haIMgm0<d6)!_-$0kw
z&WM1VxV537a`zbdDJp7wJLJ`YA?Fwg`B-J)sRiUM>?)NWvnW>@EmKviv_j=9I&FOS
zDu9q7$I02k$54gKpW+FXqapp<g{rM9wC7doK1BE8gQcvH?Dl|ZNtnthXIh?S<xbd(
zWTHGG$)C9*%F)V|l%F#brDkteeH-OKAjVYIQ}X1@H&aQClwQ^)sDWa6mGW6k#C?pP
O;+9@*)@${m#s35C=W93s

diff --git a/custom_types.py b/custom_types.py
new file mode 100644
index 0000000..90b583a
--- /dev/null
+++ b/custom_types.py
@@ -0,0 +1,22 @@
+import torch
+from typing import Tuple, NamedTuple, List, Callable
+import numpy as np
+
+TrainingBatch = Tuple[List[List[float]], List[int]]
+
+
+class LossFun(NamedTuple):
+    exec: Callable[[np.array, np.array], float]
+    deriv: Callable[[np.array, np.array], np.array]
+
+
+class EvaluationResults(NamedTuple):
+    total: int
+    correct: int
+    accumulated_loss: float
+
+
+if torch.cuda.is_available():
+    DEVICE = "cuda:0"
+else:
+    DEVICE = "cpu"
diff --git a/import_data.py b/import_data.py
index 6270980..44c693f 100644
--- a/import_data.py
+++ b/import_data.py
@@ -1,5 +1,6 @@
 from PIL import Image
-from typing import Union, List, Generator, Callable
+from typing import Tuple, Union, List, Generator, Callable
+from custom_types import TrainingBatch
 
 
 BOX_SHADING = " ░▒▓██"
@@ -24,7 +25,7 @@ def print_img_to_console(img: Union[bytes, List[int]]):
     print()
 
 
-def read_labels(file_location: str):
+def read_labels(file_location: str) -> int:
     with open(file_location, 'rb') as img_file:
         img_data = img_file.read()
         num_items = int.from_bytes(img_data[4:8], byteorder="big")
@@ -32,7 +33,7 @@ def read_labels(file_location: str):
             yield int.from_bytes(img_data[i:i + 1], byteorder="big")
 
 
-def read_imgs(file_location: str, as_bytes=False):
+def read_imgs(file_location: str, as_bytes=False) -> List[int]:
     with open(file_location, 'rb') as img_file:
         img_data = img_file.read()
         num_items = int.from_bytes(img_data[4:8], byteorder="big")
@@ -50,28 +51,42 @@ def read_imgs(file_location: str, as_bytes=False):
                 start_byte = end_byte
 
 
-def read_img_lbl_pairs(imgs_file: str, lbls_file: str):
+def read_img_lbl_pairs(imgs_file: str, lbls_file: str) -> Tuple[List[int], int]:
     for img, label in zip(read_imgs(imgs_file), read_labels(lbls_file)):
         yield img, label
 
 
-def test_x_y(num: int = -1) -> Callable[[], Generator]:
+def get_test_data_generator(batch_size: int = 1, num: int = -1) -> Callable[[], Generator[TrainingBatch, None, None]]:
     if num == -1:
         num = 9992
 
     def generator():
-        for i, (img, lbl) in zip(range(num), read_img_lbl_pairs("t10k-images.idx3-ubyte", "t10k-labels.idx1-ubyte")):
-            yield img, lbl
+        accum_x, accum_y = [], []
+        for i, (img, lbl) in zip(range(num), read_img_lbl_pairs("data/t10k-images.idx3-ubyte", "data/t10k-labels.idx1-ubyte")):
+            accum_x.append(img)
+            accum_y.append(lbl)
+            if (i + 1) % batch_size == 0:
+                yield accum_x, accum_y
+                accum_x, accum_y = [], []
+            elif i == num:
+                yield accum_x, accum_y
 
     return generator
 
 
-def train_x_y(num: int = -1) -> Callable[[], Generator]:
+def get_training_data_generator(batch_size: int = 1, num: int = -1) -> Callable[[], Generator[TrainingBatch, None, None]]:
     if num == -1:
         num = 60000
 
     def generator():
-        for i, (img, lbl) in zip(range(num), read_img_lbl_pairs("train-images.idx3-ubyte", "train-labels.idx1-ubyte")):
-            yield img, lbl
+        accum_x, accum_y = [], []
+        for i, (img, lbl) in zip(range(num), read_img_lbl_pairs("data/train-images.idx3-ubyte", "data/train-labels.idx1-ubyte")):
+            accum_x.append(img)
+            accum_y.append(lbl)
+            if (i + 1) % batch_size == 0:
+                yield accum_x, accum_y
+                accum_x, accum_y = [], []
+            elif i == num:
+                yield accum_x, accum_y
 
     return generator
diff --git a/main.py b/main.py
index 7ed1437..535a762 100644
--- a/main.py
+++ b/main.py
@@ -1,5 +1,50 @@
-import torch
-from multiclass_perceptron import train_and_test_multiclass_perceptron
-from import_data import show_picture, test_x_y
+from MlpNetwork import train_and_test_multiclass_perceptron
+from mlp_network import train_and_test_neural_network
+from import_data import show_picture, get_test_data_generator, get_training_data_generator, IMAGE_SIZE
+from GenericTorchMlpNetwork import GenericTorchMlpClassifier
+import argparse
 
-train_and_test_multiclass_perceptron()
\ No newline at end of file
+
+def main():
+    args = get_args()
+    classifier = GenericTorchMlpClassifier(
+        dims_per_layer=[IMAGE_SIZE, 200, 80, 10],
+        learning_rate=args.learning_rate,
+    )
+    for i in range(args.num_epochs):
+        print(f"Begin training epoch {i + 1}.")
+        classifier.training_epoch(get_training_data_generator(20)())
+        results = classifier.evaluate(get_test_data_generator(20)())
+        print(f"Evaluation results: {results.correct} / {results.total}",
+              f"Accumulated loss = {results.accumulated_loss:.3f}",
+              f"Average loss = {results.accumulated_loss / results.correct:.3f}",
+              f"Accuracy = {100 * float(results.correct) / float(results.total):.2f}%",
+              sep="\n", end="\n\n")
+
+
+def get_args():
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "--num_epochs",
+        "-e",
+        type=int,
+        default=5,
+        help="Number of training epochs to undertake."
+    )
+    parser.add_argument(
+        "--learning_rate",
+        type=float,
+        default=0.001,
+        help="Learning rate for the optimiser."
+    )
+    parser.add_argument(
+        "--num_training_samples",
+        type=int,
+        default=-1,
+        help="Number of samples to train with (default = all)."
+    )
+    return parser.parse_args()
+
+
+if __name__ == "__main__":
+    main()
diff --git a/mlp_network.py b/mlp_network.py
index a6d9ab9..6a14c7e 100644
--- a/mlp_network.py
+++ b/mlp_network.py
@@ -1,15 +1,11 @@
 import numpy as np
 from recordclass import recordclass
 from typing import NamedTuple, Tuple, List, Callable, Generator
-from import_data import train_x_y, test_x_y
+from import_data import get_training_data_generator, get_test_data_generator
+from custom_types import LossFun
 import sys
 
 
-class LossFun(NamedTuple):
-    exec: Callable[[np.array, np.array], float]
-    deriv: Callable[[np.array, np.array], np.array]
-
-
 def sum_squares_loss_func(predicted: np.array, gold: np.array) -> float:
     return sum((predicted - gold) ** 2)
 
@@ -106,10 +102,11 @@ class FFNeuralNetwork:
 def train_and_test_neural_network():
     model = FFNeuralNetwork([28**2, 100, 10], sum_squares_loss, 0.0001)
     training_data_gen = train_x_y(1000)
-    test_data = test_x_y(10)()
+    test_data = get_test_data_generator(10)()
     model.train(training_data_gen, 5)
     for test_datum, label in test_data:
-        print(model.feed_forward(test_datum), label)
+        prediction = model.feed_forward(test_datum)
+        print(prediction, label, label == prediction)
     np.set_printoptions(threshold=sys.maxsize)
     print(model.layers[0].weights)