TIPE en MP2I puis MPI* 2021-2023 https://tipe.augustin64.fr/mnist
Go to file
2023-04-15 21:19:20 +02:00
.github/workflows Remove unnecessary tests from GH Actions 2023-03-03 22:18:25 +01:00
.vscode Update neuron_io.c to save larger networks 2023-02-10 14:55:08 +01:00
build Add .gitkeep 2022-10-24 12:57:07 +02:00
data/mnist Move MNIST data files 2022-04-03 21:44:15 +02:00
doc Forgot that 2023-03-15 21:34:03 +01:00
src Load image from a separate thread 2023-04-02 17:34:31 +02:00
test Update test/cnn_function.cu 2023-03-31 15:06:10 +02:00
.gitignore Add webserver/guess 2023-03-11 17:51:52 +01:00
COMPTE_RENDU.md Rename mnist network to dense for consistency 2023-03-15 21:27:57 +01:00
Makefile Fix previous compilation errors 2023-03-31 14:17:41 +02:00
README.md Update README.md 2023-04-15 21:19:20 +02:00

TIPE en MP2I puis MPI* 2021-2023
Julien CHEMILLIER, Augustin LUCAS

Objectifs

Objectif principal

Classification de villes à l'aide d'un réseau de neurones convolutif

Découpage du projet

  1. Créer un réseau de neurones "basique", constitué uniquement de couches denses pour se familiariser avec la structure de réseaux de neurones et le langage C qui n'avait que peu été étudié auparavant.
  2. Créer un réseau de neurones convolutif plus efficace sur des images de grande taille.
  3. Implémenter différentes techniques d'optimisation du temps de calcul (utilisation du GPU) et du nombre d'itérations (Adam Optimizer)



Résultats selon ce découpage

Réseau dense

Le code est disponible dans src/dense

Arborescence du code
src/dense
├── include
│   ├── main.h
│   ├── neural_network.h
│   ├── neuron.h
│   ├── neuron_io.h
│   └── preview.h
├── main.c
├── neural_network.c
├── neuron_io.c
├── preview.c
└── utils.c

2 directories, 10 files

Résultats sur MNIST:

$ build/dense-main train -e 5 -i data/mnist/train-images-idx3-ubyte -l data/mnist/train-labels-idx1-ubyte
Threads [8] Époque [0/5]    Image [60000/60000] Accuracy: 86.7%
Threads [8] Époque [1/5]    Image [60000/60000] Accuracy: 90.0%
Threads [8] Époque [2/5]    Image [60000/60000] Accuracy: 90.5%
Threads [8] Époque [3/5]    Image [60000/60000] Accuracy: 90.8%
Threads [8] Époque [4/5]    Image [60000/60000] Accuracy: 90.9%
Execution time: 50 s.

$ build/dense-main test -i data/mnist/t10k-images-idx3-ubyte -l data/mnist/t10k-labels-idx1-ubyte -m out.bin
10000 Images   Accuracy: 90.4%



Réseau convolutif

Le code est disponible dans src/cnn

Arborescence du code
src/cnn
├── backpropagation.c/.cu
├── cnn.c
├── convolution.c/.cu
├── creation.c
├── export.c
├── free.c
├── function.c/.cu
├── include
│   ├── backpropagation.h
│   ├── cnn.h
│   ├── config.h
│   ├── convolution.h
│   ├── creation.h
│   ├── free.h
│   ├── function.h
│   ├── initialisation.h
│   ├── jpeg.h
│   ├── main.h
│   ├── make.h
│   ├── matrix_multiplication.h
│   ├── neuron_io.h
│   ├── print.h
│   ├── struct.h
│   ├── test_network.h
│   ├── train.h
│   ├── update.h
│   └── utils.h
├── initialisation.c
├── jpeg.c
├── main.c
├── make.c/.cu
├── neuron_io.c
├── preview.c
├── print.c
├── test_network.c
├── train.c
├── update.c
└── utils.c

2 directories, 42 files

Résultats sur MNIST avec l'architecture LeNet-5, avec Leaky RELU en fonction d'activation, des Batchs de taille 32 et le décalage aléatoire des images désactivé:

$ build/cnn-main train --dataset mnist --images data/mnist/train-images-idx3-ubyte --labels data/mnist/train-labels-idx1-ubyte --epochs 5
Pas de fichier de sortie spécifié, défaut: out.bin
Taux d'apprentissage initial: 3.00e-04
Initialisation: 185ms

Threads [8] Époque [0/5]    Image [60000/60000] Accuracy: 60.5244%  Loss: 0.046990: Temps: 1mn 31s
Threads [8] Époque [1/5]    Image [60000/60000] Accuracy: 91.3681%  Loss: 0.012858: Temps: 1mn 31s
Threads [8] Époque [2/5]    Image [60000/60000] Accuracy: 93.0354%  Loss: 0.010549: Temps: 1mn 30s
Threads [8] Époque [3/5]    Image [60000/60000] Accuracy: 93.8429%  Loss: 0.009243: Temps: 1mn 29s
Threads [8] Époque [4/5]    Image [60000/60000] Accuracy: 94.4507%  Loss: 0.008328: Temps: 1mn 31s

Temps total: 7mn 33s
$ build/cnn-main test -m out.bin -d mnist -i data/mnist/t10k-images-idx3-ubyte -l data/mnist/t10k-labels-idx1-ubyte
Accuracy: 94.860001 Loss: 0.007952



Optimisations

Adam Optimizer

Configuration dans src/cnn/config.h. Cette optimisation peut-être désactivée à la compilation sur chacun des éléments du réseau de manière indépendante

Meilleur taux de réussite sur le jeu de test avec Adam Optimizer (ADAM_DENSE_WEIGHTS uniquement): 97.3%

Utilisation de la Carte Graphique

Un des objectifs principaux de ce TIPE étant également de réaliser un réseau de neurones n'utilisant pas de bibliothèques extérieures pour plus de clarté, seulement la gestion de la mémoire partagée sera faite "en boîte noire", on essayera d'éviter les appels aux fonctions de multiplication de matrices ou de convolution toute faites par exemple.

Pour utiliser la carte graphique, toutes les données traitées par le GPU doivent être copiées dans la mémoire de celui-ci, mais la manière dont cela est géré impose d'allouer des blocs de 48kB de mémoire pour en éviter une saturation très rapide. Une "surcouche" à la gestion de la mémoire est donc implémentée dans src/cnn/memory_management.cu

Résultats pour un réseau assez conséquent, avec des images de 256x256 pixels:

Tâche Temps GPU Temps CPU
Chargement de l'image 20ms 20ms
Forward 220ms 4s 200ms
Backward 370ms 8s 400ms
Architecture du réseau
Network* create_large_network(float learning_rate, int dropout, int activation, int initialisation, int input_dim, int input_depth) {
    Network* network = create_network(16, learning_rate, dropout, activation, initialisation, input_dim, input_depth);
    add_convolution(network, 6, 258, activation);
    add_convolution(network, 16, 256, activation);
    add_average_pooling(network, 64);
    add_convolution(network, 16, 60, activation);
    add_average_pooling(network, 30);
    add_convolution(network, 16, 26, activation);
    add_convolution(network, 16, 22, activation);
    add_convolution(network, 16, 18, activation);
    add_dense_linearisation(network, 840, activation);
    add_dense(network, 520, activation);
    add_dense(network, 420, activation);
    add_dense(network, 320, activation);
    add_dense(network, 220, activation);
    add_dense(network, 120, activation);
    add_dense(network, 50, SOFTMAX);
    return network;
}


Utilisation

Sur le cloud avec google Colab: bon GPU mais mauvais processeur: Open In Colab

Les distributions suivantes ont étés essayées, il sera sans doute nécessaire de modifier le code pour l'exécuter sous Windows/ MacOS:

  • Arch
  • Fedora
  • Manjaro
  • Ubuntu

Dépendances

  • cuda : pour utiliser la carte graphique (NVIDIA seulement)
  • libjpeg-dev : n'est pas installé par défaut sur ubuntu notamment
  • GNU Make : installé par défaut sur la majorité des distributions
  • GCC : installé par défaut sur la majorité des distributions

Compilation

Compiler tous les exécutables:

make -j all

Exécuter tous les tests: (Attention, si cuda est installé mais qu'aucune carte graphique n'est disponible, cela peut prendre plusieurs minutes)

make -j run-tests

Exécution

Exécuter un fichier compilé (disponible dans build/) sans arguments affichera une aide rapide.
Se référer à doc/{cnn,dense} pour avoir des informations plus détaillées.



Articles de recherches utilisés

Titre Auteur Lien
LeNet-5 Yann Lecun http://yann.lecun.com/exdb/lenet/index.html
AlexNet Alex Krizhevsky et al. https://papers.nips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf
Dropout Nitish Srivastava et al. https://www.jmlr.org/papers/volume15/srivastava14a/srivastava14a.pdf
Adam Optimizer Diederik P. Kingma, Jimmy Lei Ba https://arxiv.org/pdf/1412.6980.pdf
Recent Advances in Convolutional Neural Networks Jiuxiang Gu, Zhenhua Wang, Jason Kuen et al. https://arxiv.org/pdf/1512.07108.pdf
DeepGeo & 50STates10K Database Sudharshan Suresh, Nathaniel Chodosh, Montiel Abello https://arxiv.org/pdf/1810.03077v1.pdf
Img2GPS James Hays and Alexei A. Efros http://graphics.cs.cmu.edu/projects/im2gps/im2gps.pdf
PlaNet Tobias Weyand https://arxiv.org/pdf/1602.05314.pdf