From 0e0198bca2bde6f884757224a4977203bcf3bc64 Mon Sep 17 00:00:00 2001 From: julienChemillier Date: Tue, 14 Feb 2023 15:21:09 +0100 Subject: [PATCH 1/2] Add convolution to explaination --- doc/cnn/backpropagation_explaination.md | 15 +++++++++++++++ 1 file changed, 15 insertions(+) diff --git a/doc/cnn/backpropagation_explaination.md b/doc/cnn/backpropagation_explaination.md index d3b8cf2..b3d69c9 100644 --- a/doc/cnn/backpropagation_explaination.md +++ b/doc/cnn/backpropagation_explaination.md @@ -55,3 +55,18 @@ $\forall i,j: \space b_{i j} = \dfrac{a_{2i \space 2j} + a_{2i+1 \space 2j} + a_ > Derivatives: $\forall i,j: \space \dfrac{\partial E}{\partial a_{i \space j}} = \dfrac{1}{4} \dfrac{\partial E}{\partial b_{k \space l}} $ where $k = \Big\lfloor \dfrac{i}{2} \Big\rfloor$ and $l = \Big\lfloor \dfrac{j}{2} \Big\rfloor$ +--- +--- + +## Backpropagation of a convolutionnal layer + + + + +$\forall i,j: c_{i \space j} = b_{i \space j} + \sum\limits_{0 \leqslant k, l \leqslant 1} \space k_{k \space l} c_{i+k, \space j+l}$ +$ $ + +> Derivatives: +$\dfrac{\partial E}{\partial b_{i,j}} = \dfrac{\partial E}{\partial c_{i, j}}$ +$\dfrac{\partial E}{\partial k_{i,j}} = \sum\limits_{p=0}^{2} \sum\limits_{l=0}^{2} \Big( \dfrac{\partial E}{\partial c_{k \space l}} a_{i+p, j+l}\Big)$ +$\dfrac{\partial E}{\partial a_{i,j}} = \sum\limits_{k=max(0, k\_size-1)}^{min(k\_size, dim\_input-j)} \sum\limits_{l=max(0, k\ _size-1)}^{min(k\_size, dim\_input-k)} \dfrac{}{}$ From 7d1729970a4673681442ad57c0e7f53a7dd65bbc Mon Sep 17 00:00:00 2001 From: julienChemillier Date: Wed, 15 Feb 2023 11:30:20 +0100 Subject: [PATCH 2/2] =?UTF-8?q?Ajout=20de=20texte=20et=20passage=20de=20l'?= =?UTF-8?q?anglais=20au=20fran=C3=A7ais?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- doc/cnn/backpropagation_explaination.md | 32 +++++++++++++++---------- 1 file changed, 19 insertions(+), 13 deletions(-) diff --git a/doc/cnn/backpropagation_explaination.md b/doc/cnn/backpropagation_explaination.md index b3d69c9..cbeecc6 100644 --- a/doc/cnn/backpropagation_explaination.md +++ b/doc/cnn/backpropagation_explaination.md @@ -1,10 +1,13 @@ -# Explaination of the calculus of the backpropagation for the different layers +# Explication des calculs de la backpropagation des différentes couches -## Backpropagation of the softmax +## Backpropagation de la dernière couche avec softmax -Valeur des variables: +La couche ($o_1$, $o_2$, $o_3$) contient les valeurs que le réseau devrait donner idéalement. +La couche ($l_1$, $l_2$, $l_3$) contient les valeurs que le réseau donne réellement. +Soit f la fonction d'activation de la première couche (qui transforme les $a_i$ en $l_i$). +Relations entre les différents variables: - $l_1 = \dfrac{e^{a_1}}{e^{a_1}+e^{a_2}+e^{a_3}}$ $l_2 = \dfrac{e^{a_2}}{e^{a_1}+e^{a_2}+e^{a_3}}$ $l_3 = \dfrac{e^{a_3}}{e^{a_1}+e^{a_2}+e^{a_3}}$ @@ -26,11 +29,11 @@ $\dfrac{\partial E}{\partial b_i} = \dfrac{\partial E}{\partial a_i}$ -Soit f la fonction d'activation de la première couche et g la fonction d'activation de la deuxième couche. +Soit f la fonction d'activation de la première couche (qui transforme les $a_i$ en $l_i$) et g la fonction d'activation de la deuxième couche (qui transforme les $c_i$ en $d_i$). - $d_1 =g(c_1)$ $d_2 = g(c2)$ $c_1 = w_{11}l_1 + w_{21}l_2 + w_{31}l_3 + b'_1$ -$c_2 = w_{12}l_1 + w_{22}l_2 + w_{32}l_3 + b'_2$ +$c_2 = w_{12}l_1 + w_{22}l_2 + w_{32}l_3 + b'_2$ $l_1 = f(a_1)$ $l_2 = f(a_2)$ $l_3 = f(a_3)$ @@ -39,34 +42,37 @@ $\dfrac{\partial c_2}{\partial l_1} = w_{12}$ $\dfrac{\partial c_1}{\partial l_1} = w_{11}$ $\dfrac{\partial l_1}{\partial a_1} = f'(a_1)$ -> Derivatives: +> Dérivées: $\dfrac{\partial E}{\partial b_j} = \dfrac{\partial E}{\partial l_i} $ $\dfrac{\partial E}{\partial w_{ij}} = \dfrac{\partial E}{\partial c_j}l_i$ $\dfrac{\partial E}{\partial a_i} = \dfrac{\partial E_{c_1}}{\partial c_1} w_{i1} + \dfrac{\partial E_{c_2}}{\partial c_2} w_{i2}$ --- --- -## Backpropagation of an average 2d pooling layer +## Backpropagation d'une couche d'average 2d pooling layer - + +Relation entre les différentes variables: $\forall i,j: \space b_{i j} = \dfrac{a_{2i \space 2j} + a_{2i+1 \space 2j} + a_{2i \space 2j+1} + a_{2i+1 \space 2j+1}}{4}$ -> Derivatives: +> Dérivées: $\forall i,j: \space \dfrac{\partial E}{\partial a_{i \space j}} = \dfrac{1}{4} \dfrac{\partial E}{\partial b_{k \space l}} $ -where $k = \Big\lfloor \dfrac{i}{2} \Big\rfloor$ and $l = \Big\lfloor \dfrac{j}{2} \Big\rfloor$ +où $k = \Big\lfloor \dfrac{i}{2} \Big\rfloor$ et $l = \Big\lfloor \dfrac{j}{2} \Big\rfloor$ --- --- -## Backpropagation of a convolutionnal layer +## Backpropagation d'une couche convolutive - +Les matrices rouges représente les couches n et n+1. +La matrice orange représente . +La matrice verte représente les biais de la couche n+1. $\forall i,j: c_{i \space j} = b_{i \space j} + \sum\limits_{0 \leqslant k, l \leqslant 1} \space k_{k \space l} c_{i+k, \space j+l}$ $ $ -> Derivatives: +> Dérivées: $\dfrac{\partial E}{\partial b_{i,j}} = \dfrac{\partial E}{\partial c_{i, j}}$ $\dfrac{\partial E}{\partial k_{i,j}} = \sum\limits_{p=0}^{2} \sum\limits_{l=0}^{2} \Big( \dfrac{\partial E}{\partial c_{k \space l}} a_{i+p, j+l}\Big)$ $\dfrac{\partial E}{\partial a_{i,j}} = \sum\limits_{k=max(0, k\_size-1)}^{min(k\_size, dim\_input-j)} \sum\limits_{l=max(0, k\ _size-1)}^{min(k\_size, dim\_input-k)} \dfrac{}{}$