tipe/src/mnist/neural_network.c

304 lines
12 KiB
C
Raw Normal View History

2022-03-24 13:42:03 +01:00
#include <stdio.h>
#include <stdlib.h>
2022-04-22 14:22:45 +02:00
#include <stdbool.h>
#include <stdint.h>
2022-03-24 13:42:03 +01:00
#include <string.h>
#include <math.h>
#include <time.h>
2022-04-01 15:41:54 +02:00
#include "struct/neuron.h"
2022-03-24 13:42:03 +01:00
2022-04-18 17:49:50 +02:00
// Définit le taux d'apprentissage du réseau neuronal, donc la rapidité d'adaptation du modèle (compris entre 0 et 1)
//Cette valeur peut évoluer au fur et à mesure des époques (linéaire c'est mieux)
2022-04-25 10:09:47 +02:00
#define TAUX_APPRENTISSAGE 2.
2022-04-18 17:49:50 +02:00
//Retourne un nombre aléatoire entre 0 et 1
2022-04-16 17:02:57 +02:00
#define RAND_DOUBLE() ((double)rand())/((double)RAND_MAX)
2022-04-18 17:49:50 +02:00
//Coefficient leaking ReLU
#define COEFF_LEAKY_RELU 0.2
2022-04-22 14:22:45 +02:00
#define MAX_RESEAU 100000
2022-04-25 10:09:47 +02:00
#define INT_MIN -2147483648
2022-04-22 14:22:45 +02:00
#define PRINT_POIDS false
#define PRINT_BIAIS false
2022-03-24 13:42:03 +01:00
2022-04-05 09:08:39 +02:00
float max(float a, float b){
2022-04-21 12:09:35 +02:00
return a < b ? b : a;
2022-04-05 09:08:39 +02:00
}
float sigmoid(float x){
2022-04-22 14:22:45 +02:00
return 1/(1 + exp(-x));
2022-04-05 09:08:39 +02:00
}
float sigmoid_derivee(float x){
2022-04-21 12:09:35 +02:00
float tmp = exp(-x);
return tmp/((1+tmp)*(1+tmp));
2022-04-05 09:08:39 +02:00
}
2022-04-18 17:49:50 +02:00
float leaky_ReLU(float x){
2022-04-22 14:22:45 +02:00
if (x > 0)
2022-04-18 17:49:50 +02:00
return x;
2022-04-22 14:22:45 +02:00
return COEFF_LEAKY_RELU;
2022-04-18 17:49:50 +02:00
}
float leaky_ReLU_derivee(float x){
2022-04-22 14:22:45 +02:00
if (x > 0)
2022-04-18 17:49:50 +02:00
return 1;
return COEFF_LEAKY_RELU;
2022-04-05 09:08:39 +02:00
}
2022-03-24 13:42:03 +01:00
2022-04-12 18:19:09 +02:00
void creation_du_reseau_neuronal(Reseau* reseau, int* neurones_par_couche, int nb_couches) {
2022-04-05 09:08:39 +02:00
/* Créé et alloue de la mémoire aux différentes variables dans le réseau neuronal*/
2022-04-10 12:32:06 +02:00
Couche* couche;
2022-04-05 09:08:39 +02:00
2022-04-12 18:19:09 +02:00
reseau->nb_couches = nb_couches;
reseau->couches = (Couche**)malloc(sizeof(Couche*)*nb_couches);
2022-04-01 15:18:48 +02:00
for (int i=0; i < nb_couches; i++) {
2022-04-12 18:19:09 +02:00
reseau->couches[i] = (Couche*)malloc(sizeof(Couche));
couche = reseau->couches[i];
2022-04-10 12:32:06 +02:00
couche->nb_neurones = neurones_par_couche[i]; // nombre de neurones pour la couche
2022-04-12 18:19:09 +02:00
couche->neurones = (Neurone**)malloc(sizeof(Neurone*)*reseau->couches[i]->nb_neurones); // Création des différents neurones dans la couche
2022-04-01 15:18:48 +02:00
2022-04-10 12:32:06 +02:00
for (int j=0; j < couche->nb_neurones; j++) {
couche->neurones[j] = (Neurone*)malloc(sizeof(Neurone));
2022-04-12 18:19:09 +02:00
if (i != reseau->nb_couches-1) { // On exclut la dernière couche dont les neurones ne contiennent pas de poids sortants
2022-04-10 12:32:06 +02:00
couche->neurones[j]->poids_sortants = (float*)malloc(sizeof(float)*neurones_par_couche[i+1]);// Création des poids sortants du neurone
couche->neurones[j]->d_poids_sortants = (float*)malloc(sizeof(float)*neurones_par_couche[i+1]);
2022-04-25 10:09:47 +02:00
couche->neurones[j]->last_d_poids_sortants = (float*)malloc(sizeof(float)*neurones_par_couche[i+1]);
2022-04-01 15:18:48 +02:00
}
2022-03-24 13:42:03 +01:00
}
}
}
2022-04-12 18:19:09 +02:00
void suppression_du_reseau_neuronal(Reseau* reseau) {
2022-03-24 13:42:03 +01:00
/* Libère l'espace mémoire alloué aux différentes variables dans la fonction
2022-04-12 18:19:09 +02:00
'creation_du_reseau' */
2022-03-24 13:42:03 +01:00
2022-04-12 18:19:09 +02:00
for (int i=0; i<reseau->nb_couches; i++) {
if (i!=reseau->nb_couches-1) { // On exclut la dernière couche dont les neurones ne contiennent pas de poids sortants
for (int j=0; j<reseau->couches[i]->nb_neurones; j++) {
free(reseau->couches[i]->neurones[j]->poids_sortants);
free(reseau->couches[i]->neurones[j]->d_poids_sortants);
2022-03-24 13:42:03 +01:00
}
}
2022-04-12 18:19:09 +02:00
free(reseau->couches[i]->neurones); // On libère enfin la liste des neurones de la couche
2022-03-24 13:42:03 +01:00
}
2022-04-12 18:19:09 +02:00
free(reseau); // Pour finir, on libère le réseau neronal contenant la liste des couches
2022-03-24 13:42:03 +01:00
}
2022-04-12 18:19:09 +02:00
void forward_propagation(Reseau* reseau) {
2022-04-05 09:08:39 +02:00
/* Effectue une propagation en avant du réseau neuronal lorsque les données
on é insérées dans la première couche. Le résultat de la propagation se
2022-04-10 12:32:06 +02:00
trouve dans la dernière couche */
Couche* couche; // Couche actuelle
2022-04-18 17:49:50 +02:00
Couche* pre_couche; // Couche précédente
2022-04-25 10:09:47 +02:00
float sum;
float max_z;
2022-04-10 12:32:06 +02:00
2022-04-12 18:19:09 +02:00
for (int i=1; i < reseau->nb_couches; i++) { // La première couche contient déjà des valeurs
2022-04-25 10:09:47 +02:00
sum = 0;
max_z = INT_MIN;
2022-04-12 18:19:09 +02:00
couche = reseau->couches[i];
pre_couche = reseau->couches[i-1];
2022-04-10 12:32:06 +02:00
for (int j=0; j < couche->nb_neurones; j++) {
2022-04-22 14:22:45 +02:00
couche->neurones[j]->z = couche->neurones[j]->biais;
2022-04-10 12:32:06 +02:00
for (int k=0; k < pre_couche->nb_neurones; k++) {
2022-04-18 17:49:50 +02:00
couche->neurones[j]->z += pre_couche->neurones[k]->z * pre_couche->neurones[k]->poids_sortants[j];
2022-03-24 13:42:03 +01:00
}
2022-04-18 17:49:50 +02:00
if (i < reseau->nb_couches-1) { // Pour toutes les couches sauf la dernière on utilise la fonction leaky_ReLU (a*z si z<0, z sinon)
couche->neurones[j]->z = leaky_ReLU(couche->neurones[j]->z);
2022-04-22 14:22:45 +02:00
} else { // Pour la dernière couche on utilise la fonction sigmoid permettant d'obtenir un résultat entre 0 et 1 à savoir une probabilité
2022-04-25 10:09:47 +02:00
max_z = max(max_z, couche->neurones[j]->z);
2022-03-24 13:42:03 +01:00
}
}
}
2022-04-25 10:09:47 +02:00
int last_layer = reseau->nb_couches-1;
int size_last_layer = reseau->couches[last_layer]->nb_neurones;
for (int j=0; j < size_last_layer; j++) {
reseau->couches[last_layer]->neurones[j]->z = exp(reseau->couches[last_layer]->neurones[j]->z - max_z);
sum += reseau->couches[last_layer]->neurones[j]->z;
}
for (int j=0; j < size_last_layer; j++) {
reseau->couches[last_layer]->neurones[j]->z = reseau->couches[last_layer]->neurones[j]->z / sum;
}
2022-03-24 13:42:03 +01:00
}
2022-04-12 18:19:09 +02:00
int* creation_de_la_sortie_voulue(Reseau* reseau, int pos_nombre_voulu) {
2022-03-25 14:26:46 +01:00
/* Renvoie la liste des sorties voulues à partir du nombre
de couches, de la liste du nombre de neurones par couche et de la
2022-03-24 13:42:03 +01:00
position du résultat voulue, */
2022-04-12 18:19:09 +02:00
int nb_neurones = reseau->couches[reseau->nb_couches-1]->nb_neurones;
2022-03-24 13:42:03 +01:00
2022-04-08 15:53:29 +02:00
int* sortie_voulue = (int*)malloc(sizeof(int)*nb_neurones);
for (int i=0; i < nb_neurones; i++) // On initialise toutes les sorties à 0 par défault
sortie_voulue[i] = 0;
sortie_voulue[pos_nombre_voulu] = 1; // Seule la sortie voulue vaut 1
2022-03-24 13:42:03 +01:00
return sortie_voulue;
}
2022-04-12 18:19:09 +02:00
void backward_propagation(Reseau* reseau, int* sortie_voulue) {
2022-04-05 09:08:39 +02:00
/* Effectue une propagation en arrière du réseau neuronal */
2022-04-10 12:32:06 +02:00
Neurone* neurone;
Neurone* neurone2;
2022-04-18 17:49:50 +02:00
float changes;
2022-04-25 10:09:47 +02:00
float tmp;
2022-03-24 13:42:03 +01:00
2022-04-22 14:22:45 +02:00
int i = reseau->nb_couches-2;
2022-03-24 13:42:03 +01:00
// On commence par parcourir tous les neurones de la couche finale
2022-04-22 14:22:45 +02:00
for (int j=0; j < reseau->couches[i+1]->nb_neurones; j++) {
neurone = reseau->couches[i+1]->neurones[j];
2022-04-25 10:09:47 +02:00
tmp = (sortie_voulue[j]==1) ? neurone->z - 1 : neurone->z;
2022-04-22 14:22:45 +02:00
for (int k=0; k < reseau->couches[i]->nb_neurones; k++) {
2022-04-25 10:09:47 +02:00
reseau->couches[i]->neurones[k]->d_poids_sortants[j] += reseau->couches[i]->neurones[k]->z*tmp;
reseau->couches[i]->neurones[k]->last_d_poids_sortants[j] = reseau->couches[i]->neurones[k]->z*tmp;
//if (k==0)printf("\n %f ->%f", reseau->couches[i+1]->neurones[j]->z*tmp, tmp);
2022-03-24 13:42:03 +01:00
}
2022-04-25 10:09:47 +02:00
neurone->d_biais += tmp;
//printf("\n%f", neurone->d_biais);
2022-04-22 14:22:45 +02:00
}
i--;
for (; i >= 0; i--) {
for (int j=0; j < reseau->couches[i+1]->nb_neurones; j++) {
changes = 0;
for (int k=0; k < reseau->couches[i+2]->nb_neurones; k++) {
//printf("Couche %d Neurone %d Poids %f\n", i+1, j, reseau->couches[i+1]->neurones[j]->poids_sortants[k]);
2022-04-25 10:09:47 +02:00
changes += (reseau->couches[i+1]->neurones[j]->poids_sortants[k]*reseau->couches[i+1]->neurones[j]->last_d_poids_sortants[k])/reseau->couches[i+1]->nb_neurones;
2022-04-22 14:22:45 +02:00
}
changes = changes*leaky_ReLU_derivee(reseau->couches[i+1]->neurones[j]->z);
reseau->couches[i+1]->neurones[j]->d_biais += changes;
2022-04-25 10:09:47 +02:00
reseau->couches[i+1]->neurones[j]->last_d_biais = changes;
2022-04-22 14:22:45 +02:00
for (int l=0; l < reseau->couches[i]->nb_neurones; l++){
//printf("%f\n", changes);
reseau->couches[i]->neurones[l]->d_poids_sortants[j] += reseau->couches[i]->neurones[l]->poids_sortants[j]*changes;
2022-04-25 10:09:47 +02:00
reseau->couches[i]->neurones[l]->last_d_poids_sortants[j] = reseau->couches[i]->neurones[l]->poids_sortants[j]*changes;
2022-03-24 13:42:03 +01:00
}
}
}
}
2022-04-22 14:22:45 +02:00
void modification_du_reseau_neuronal(Reseau* reseau, uint32_t nb_modifs) {
2022-03-24 13:42:03 +01:00
/* Modifie les poids et le biais des neurones du réseau neuronal à partir
du nombre de couches et de la liste du nombre de neurone par couche */
2022-04-10 12:32:06 +02:00
Neurone* neurone;
2022-04-25 10:09:47 +02:00
for (int i=0; i < reseau->nb_couches; i++) { // on exclut la dernière couche
2022-04-12 18:19:09 +02:00
for (int j=0; j < reseau->couches[i]->nb_neurones; j++) {
neurone = reseau->couches[i]->neurones[j];
2022-04-22 14:22:45 +02:00
if (neurone->biais != 0 && PRINT_BIAIS)
printf("C %d\tN %d\tb: %f \tDb: %f\n", i, j, neurone->biais, (TAUX_APPRENTISSAGE/nb_modifs) * neurone->d_biais);
neurone->biais -= (TAUX_APPRENTISSAGE/nb_modifs) * neurone->d_biais; // On modifie le biais du neurone à partir des données de la propagation en arrière
2022-04-19 08:49:03 +02:00
neurone->d_biais = 0;
2022-04-22 14:22:45 +02:00
2022-04-19 10:57:29 +02:00
if (neurone->biais > MAX_RESEAU)
neurone->biais = MAX_RESEAU;
else if (neurone->biais < -MAX_RESEAU)
neurone->biais = -MAX_RESEAU;
2022-04-10 12:32:06 +02:00
2022-04-25 10:09:47 +02:00
if (i!=reseau->nb_couches-1) {
2022-04-12 18:19:09 +02:00
for (int k=0; k < reseau->couches[i+1]->nb_neurones; k++) {
2022-04-22 14:22:45 +02:00
if (neurone->poids_sortants[k] != 0 && PRINT_POIDS)
printf("C %d\tN %d -> %d\tp: %f \tDp: %f\n", i, j, k, neurone->poids_sortants[k], (TAUX_APPRENTISSAGE/nb_modifs) * neurone->d_poids_sortants[k]);
neurone->poids_sortants[k] -= (TAUX_APPRENTISSAGE/nb_modifs) * neurone->d_poids_sortants[k]; // On modifie le poids du neurone à partir des données de la propagation en arrière
2022-04-19 08:49:03 +02:00
neurone->d_poids_sortants[k] = 0;
2022-04-22 14:22:45 +02:00
2022-04-25 10:09:47 +02:00
if (neurone->poids_sortants[k] > MAX_RESEAU) {
2022-04-19 10:57:29 +02:00
neurone->poids_sortants[k] = MAX_RESEAU;
2022-04-25 10:09:47 +02:00
printf("Erreur, max du réseau atteint");
}
else if (neurone->poids_sortants[k] < -MAX_RESEAU) {
2022-04-19 10:57:29 +02:00
neurone->poids_sortants[k] = -MAX_RESEAU;
2022-04-25 10:09:47 +02:00
printf("Erreur, min du réseau atteint");
}
}
2022-03-24 13:42:03 +01:00
}
}
}
}
2022-04-12 18:19:09 +02:00
void initialisation_du_reseau_neuronal(Reseau* reseau) {
2022-04-25 10:29:36 +02:00
/* Initialise les variables du réseau neuronal (biais, poids, ...)
2022-03-24 13:42:03 +01:00
en suivant de la méthode de Xavier ...... à partir du nombre de couches et de la liste du nombre de neurone par couche */
2022-04-10 12:32:06 +02:00
Neurone* neurone;
double borne_superieure;
double borne_inferieure;
2022-04-16 17:02:57 +02:00
double ecart_bornes;
2022-04-10 12:32:06 +02:00
2022-03-24 13:42:03 +01:00
srand(time(0));
2022-04-12 18:19:09 +02:00
for (int i=0; i < reseau->nb_couches-1; i++) { // On exclut la dernière couche
2022-04-22 14:22:45 +02:00
for (int j=0; j < reseau->couches[i]->nb_neurones; j++) {
2022-04-10 12:32:06 +02:00
2022-04-12 18:19:09 +02:00
neurone = reseau->couches[i]->neurones[j];
2022-03-25 14:26:46 +01:00
// Initialisation des bornes supérieure et inférieure
2022-04-19 08:49:03 +02:00
borne_superieure = 1/sqrt((double)reseau->couches[reseau->nb_couches-1]->nb_neurones);
borne_inferieure = -borne_superieure;
2022-04-16 17:02:57 +02:00
ecart_bornes = borne_superieure - borne_inferieure;
2022-04-10 12:32:06 +02:00
2022-04-22 14:22:45 +02:00
for (int k=0; k < reseau->couches[i+1]->nb_neurones; k++) { // Pour chaque neurone de la couche suivante auquel le neurone est relié
2022-04-25 10:09:47 +02:00
neurone->poids_sortants[k] = borne_inferieure + RAND_DOUBLE()*ecart_bornes;
neurone->d_poids_sortants[k] = 0;
neurone->last_d_poids_sortants[k] = 0;
2022-03-24 13:42:03 +01:00
}
2022-04-01 15:18:48 +02:00
if (i > 0) {// Pour tous les neurones n'étant pas dans la première couche
2022-04-25 10:09:47 +02:00
neurone->biais = borne_inferieure + RAND_DOUBLE()*ecart_bornes;
neurone->d_biais = 0;
neurone->last_d_biais = 0;
2022-04-01 15:18:48 +02:00
}
2022-03-24 13:42:03 +01:00
}
}
2022-04-19 08:49:03 +02:00
borne_superieure = 1/sqrt((double)reseau->couches[reseau->nb_couches-1]->nb_neurones);
borne_inferieure = -borne_superieure;
ecart_bornes = borne_superieure - borne_inferieure;
2022-04-10 12:32:06 +02:00
2022-04-12 18:19:09 +02:00
for (int j=0; j < reseau->couches[reseau->nb_couches-1]->nb_neurones; j++) {// Intialisation de la dernière couche exclue ci-dessus
neurone = reseau->couches[reseau->nb_couches-1]->neurones[j];
2022-04-25 10:09:47 +02:00
neurone->biais = borne_inferieure + RAND_DOUBLE()*ecart_bornes;
neurone->d_biais = 0;
neurone->last_d_biais = 0;
2022-04-01 15:18:48 +02:00
}
2022-04-12 18:28:19 +02:00
}
float erreur_sortie(Reseau* reseau, int numero_voulu){
/* Renvoie l'erreur du réseau neuronal pour une sortie */
float erreur = 0;
2022-04-12 18:33:28 +02:00
float neurone_value;
2022-04-12 18:28:19 +02:00
for (int i=0; i < reseau->nb_couches-1; i++) {
2022-04-12 18:33:28 +02:00
neurone_value = reseau->couches[reseau->nb_couches-1]->neurones[i]->z;
2022-04-22 14:22:45 +02:00
if (i == numero_voulu) {
2022-04-12 18:33:28 +02:00
erreur += (1-neurone_value)*(1-neurone_value);
2022-04-12 18:28:19 +02:00
}
else {
2022-04-12 18:33:28 +02:00
erreur += neurone_value*neurone_value;
2022-04-12 18:28:19 +02:00
}
}
2022-04-12 18:33:28 +02:00
2022-04-12 18:28:19 +02:00
return erreur;
2022-04-12 18:19:09 +02:00
}