Rôle des mathématiques dans les modèles d’intelligence artificielle

Pro­fesseur des uni­ver­sités, Sal­im Bouzeb­da est égale­ment directeur du LMAC. Il décrit les dif­férents out­ils math­é­ma­tiques util­isés en intel­li­gence arti­fi­cielle (IA) et leur rôle.

À la base des tech­nolo­gies IA, il y a les maths. C’est dans les années 1940 que le pre­mier mod­èle math­é­ma­tique sur les réseaux de neu­rones a vu le jour. Toute­fois, c’est en 1956 que le terme IA a été util­isé pour la pre­mière fois. Depuis, divers­es tech­nolo­gies IA ont été dévelop­pées au fil des années. L’explosion du Big Data, en par­ti­c­uli­er à par­tir de 2010, a en revanche changé la donne avec l’IA dite « généra­tive » qui repose sur des algo­rithmes com­plex­es capa­bles de traiter d’importantes don­nées pour mimer des sit­u­a­tions et com­porte­ments du monde réel.

Des algo­rithmes qui requièrent des out­ils math­é­ma­tiques spé­ci­fiques selon les mod­èles d’IA dévelop­pés et leurs champs d’application. Il y a d’abord l’algèbre linéaire. « C’est une branche essen­tielle pour les cal­culs réal­isés par les réseaux de neu­rones. Les don­nées d’entrée, les points de con­nex­ion entre les neu­rones et les trans­for­ma­tions effec­tuées dans les couch­es du réseau sont en effet représen­tés, en général, sous une forme soit matricielle, soit vec­to­rielle. Des out­ils que l’on applique notam­ment dans le cas de la recon­nais­sance d’images où chaque pix­el est représen­té par un nom­bre, l’image finale étant alors sym­bol­isée par une matrice ou un vecteur », décrit Sal­im Bouzebda.

Les out­ils IA font égale­ment appel à d’autres out­ils math­é­ma­tiques, notam­ment au cal­cul dif­féren­tiel, aux mod­èles aléa­toires basés sur des prob­a­bil­ités et des sta­tis­tiques, à la théorie des graphes et algo­rithmes de recherche et à la théorie des infor­ma­tions et com­pres­sion des données.

Le pre­mier per­met d’ajuster les paramètres des mod­èles de l’IA, en par­ti­c­uli­er dans l’apprentissage super­visé et donc d’optimiser les mod­èles. « Dans ce cas de fig­ure, nous con­nais­sons les don­nées entrées et nous con­nais­sons les résul­tats obtenus. Une fois l’opération répétée à maintes repris­es sur plusieurs expéri­ences avec de larges don­nées his­toriques, nous essayons de min­imiser le mod­èle à l’aide d’une fonc­tion coût qui va nous per­me­t­tre de réduire, le plus pos­si­ble, la dis­tance entre la réal­ité et ce que l’on est en train d’estimer », souligne-t-il.

Les deux­ièmes sont util­isés dans les sit­u­a­tions d’incertitude. « Ces mod­èles nous per­me­t­tent de mesur­er l’incertitude liée aux déci­sions pris­es par les sys­tèmes de l’IA. Ain­si, si vous avez énor­mé­ment de paramètres à gér­er, vous aurez un vrai prob­lème d’interprétation et de clas­si­fi­ca­tion. Pour con­tourn­er ce prob­lème tout en gar­dant un max­i­mum d’informations, on va faire un encodage que l’on pro­jet­tera dans un nou­v­el espace de dimen­sions plus réduites et donc plus raisonnable à étudi­er. Une fois la clas­si­fi­ca­tion des don­nées de départ faite, on va décoder. Ce qui nous per­met d’obtenir un nou­veau sig­nal très sim­i­laire à celui de départ, mais ayant, en plus, la classe qui lui cor­re­spond », explique-t-il.

Les graphes, quant à eux, s’appliquent, en par­ti­c­uli­er, aux rela­tions entre les objets. « À par­tir des don­nées disponibles, il s’agit de trou­ver un cer­tain graphe com­pat­i­ble avec ces don­nées-là. Dans ce cas de fig­ure, les nœuds représen­teront les indi­vidus et les arêtes les rela­tions entre eux. Une méth­ode appliquée pen­dant la pandémie du Covid-19 pour trac­er les éventuelles con­t­a­m­i­na­tions mais aus­si dans un grand nom­bre d’applications grand pub­lic : les réseaux soci­aux, la mobil­ité ou plus anec­do­tique les sites de ren­con­tre… », assure Sal­im Bouzebda.

Enfin, la théorie des infor­ma­tions et com­pres­sion des don­nées. « On l’utilise notam­ment dans la trans­mis­sion et le stock­age des don­nées avec une qual­ité per­ti­nente. Générale­ment, les don­nées ont une cer­taine dimen­sion et, si on les stocke en tant que telles, elles vont non seule­ment con­som­mer énor­mé­ment de mémoire mais elles seront égale­ment plus dif­fi­ciles à récupér­er. Pour éviter cet écueil, on va les com­press­er pour obtenir une taille min­i­male tout en gar­dant, dans la don­née com­pressée, la qua­si-total­ité de l’information de départ. Cette méth­ode est notam­ment util­isée dans les out­ils de vision par ordi­na­teur », conclut-il.

MSD

Le magazine

Novembre 2024 - N°64

L’intelligence artificielle : un outil incontournable

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram