Rôle des mathématiques dans les modèles d’intelligence artificielle
Professeur des universités, Salim Bouzebda est également directeur du LMAC. Il décrit les différents outils mathématiques utilisés en intelligence artificielle (IA) et leur rôle.
À la base des technologies IA, il y a les maths. C’est dans les années 1940 que le premier modèle mathématique sur les réseaux de neurones a vu le jour. Toutefois, c’est en 1956 que le terme IA a été utilisé pour la première fois. Depuis, diverses technologies IA ont été développées au fil des années. L’explosion du Big Data, en particulier à partir de 2010, a en revanche changé la donne avec l’IA dite « générative » qui repose sur des algorithmes complexes capables de traiter d’importantes données pour mimer des situations et comportements du monde réel.
Des algorithmes qui requièrent des outils mathématiques spécifiques selon les modèles d’IA développés et leurs champs d’application. Il y a d’abord l’algèbre linéaire. « C’est une branche essentielle pour les calculs réalisés par les réseaux de neurones. Les données d’entrée, les points de connexion entre les neurones et les transformations effectuées dans les couches du réseau sont en effet représentés, en général, sous une forme soit matricielle, soit vectorielle. Des outils que l’on applique notamment dans le cas de la reconnaissance d’images où chaque pixel est représenté par un nombre, l’image finale étant alors symbolisée par une matrice ou un vecteur », décrit Salim Bouzebda.
Les outils IA font également appel à d’autres outils mathématiques, notamment au calcul différentiel, aux modèles aléatoires basés sur des probabilités et des statistiques, à la théorie des graphes et algorithmes de recherche et à la théorie des informations et compression des données.
Le premier permet d’ajuster les paramètres des modèles de l’IA, en particulier dans l’apprentissage supervisé et donc d’optimiser les modèles. « Dans ce cas de figure, nous connaissons les données entrées et nous connaissons les résultats obtenus. Une fois l’opération répétée à maintes reprises sur plusieurs expériences avec de larges données historiques, nous essayons de minimiser le modèle à l’aide d’une fonction coût qui va nous permettre de réduire, le plus possible, la distance entre la réalité et ce que l’on est en train d’estimer », souligne-t-il.
Les deuxièmes sont utilisés dans les situations d’incertitude. « Ces modèles nous permettent de mesurer l’incertitude liée aux décisions prises par les systèmes de l’IA. Ainsi, si vous avez énormément de paramètres à gérer, vous aurez un vrai problème d’interprétation et de classification. Pour contourner ce problème tout en gardant un maximum d’informations, on va faire un encodage que l’on projettera dans un nouvel espace de dimensions plus réduites et donc plus raisonnable à étudier. Une fois la classification des données de départ faite, on va décoder. Ce qui nous permet d’obtenir un nouveau signal très similaire à celui de départ, mais ayant, en plus, la classe qui lui correspond », explique-t-il.
Les graphes, quant à eux, s’appliquent, en particulier, aux relations entre les objets. « À partir des données disponibles, il s’agit de trouver un certain graphe compatible avec ces données-là. Dans ce cas de figure, les nœuds représenteront les individus et les arêtes les relations entre eux. Une méthode appliquée pendant la pandémie du Covid-19 pour tracer les éventuelles contaminations mais aussi dans un grand nombre d’applications grand public : les réseaux sociaux, la mobilité ou plus anecdotique les sites de rencontre… », assure Salim Bouzebda.
Enfin, la théorie des informations et compression des données. « On l’utilise notamment dans la transmission et le stockage des données avec une qualité pertinente. Généralement, les données ont une certaine dimension et, si on les stocke en tant que telles, elles vont non seulement consommer énormément de mémoire mais elles seront également plus difficiles à récupérer. Pour éviter cet écueil, on va les compresser pour obtenir une taille minimale tout en gardant, dans la donnée compressée, la quasi-totalité de l’information de départ. Cette méthode est notamment utilisée dans les outils de vision par ordinateur », conclut-il.
MSD