Imiter la réalité : le rôle des modèles mathématiques

Respec­tive­ment pro­fesseure des uni­ver­sités et maîtresse de con­férences au LMAC, Ghis­laine Gayraud et Miraine Davi­la Felipe s’intéressent à la mod­éli­sa­tion sto­chas­tique de sys­tèmes réels com­plex­es. Irène Maf­fuc­ci, quant à elle maîtresse de con­férences rat­tachée au GEC, est spé­cial­isée en bio-infor­ma­tique struc­turale. Les trois sci­en­tifiques par­ticipent au pro­jet sur la mal­adie de Lyme pilote par Séver­ine Padiolleau.

Le rôle des math­é­mati­ciens dans ce pro­jet ? « L’idée est de pro­pos­er un mod­èle sto­chas­tique qui génère in sil­i­co de nou­velles séquences d’ADN ressem­blant (du point de vue prob­a­biliste) à celles obtenues in vit­ro par l’équipe de Séver­ine. À par­tir de cette famille de séquences générées in sil­i­co, il s’agit ensuite d’en sélec­tion­ner quelques-unes, dites “son­des”, qui sem­blent avoir des bonnes capac­ités d’appairage avec la pro­téine d’intérêt. Leur sélec­tion con­siste à chercher celles qui sont “proches”, en ter­mes de dis­tance math­é­ma­tique, de celles que l’équipe de Séver­ine et d’Irene a éti­quetées comme étant de bonnes can­di­dates sur l’ensemble des séquences obtenues in vit­ro par le SELEX. Le proces­sus com­plet de l’étude com­mence par la par­tie expéri­men­tale (SELEX), se pour­suit par un mod­èle et des out­ils math­é­ma­tiques, puis repart vers l’expérimental pour valid­er les séquences sélec­tion­nées in sil­i­co », explique Ghis­laine Gayraud.

Qu’entend-on par « séquence » ? « L’ADN est com­posé de qua­tre bases azotées : A, T, C, G. On appelle séquence la suc­ces­sion de ces bases posi­tion­nées dans un ordre par­ti­c­uli­er et sur une longueur don­née. La diver­sité de 1014 molécules men­tion­née par Stéphane cor­re­spond à 1014 séquences dif­férentes de longueur 40 à l’étape ini­tiale du SELEX. L’objectif de cette procé­dure est d’identifier in vit­ro des son­des poten­tielles », souligne Séver­ine Padiolleau.

Le déroule­ment de la procé­dure in vit­ro ? « Lors de ce proces­sus très chronophage et com­plexe, il y aura un cer­tain nom­bre de séquences capa­bles de recon­naître la pro­téine d’intérêt mais tout de même réduites par rap­port à toutes les pos­si­bil­ités. Cela représente une lim­ite majeure du SELEX », pré­cise Miraine Davi­la Felipe.

C’est en effet à ce stade que les math­é­ma­tiques inter­vi­en­nent. « Sur la base de nos résul­tats in vit­ro, Ghis­laine et Miraine vont pro­pos­er un mod­èle math­é­ma­tique pour génér­er in sil­i­co de nou­velles séquences dif­férentes des nôtres mais poten­tielle­ment fonc­tion­nelles. On peut bien sûr se deman­der à quoi cela sert puisque l’on a une bonne can­di­date in vit­ro. En fait, vis­er la même cible ne con­stitue pas un but en soi dans l’absolu. D’une part, cela per­met d’augmenter le nom­bre de son­des à dis­po­si­tion. D’autre part, ce mod­èle pour­rait être appliqué pour cibler d’autres pro­téines d’intérêt sans devoir met­tre en place la procé­dure SELEX », assure Séver­ine Padiolleau.

Ghis­laine et Miraine, soutenues par un post­doc, se sont appuyées sur une famille de mod­èles exis­tante, la famille des mod­èles « Restrict­ed Boltz­mann Machines (RBM) ». « Le RBM est un mod­èle graphique à deux couch­es avec une couche en entrée con­sti­tuée de la séquence et une couche cachée qui est cen­sée pren­dre en compte la struc­ture 2D ou encore mieux la 3D, de la séquence lorsqu’elle se replie. La présence de cette couche cachée est impor­tante car la manière dont se replie la séquence est fon­da­men­tale pour assur­er son appariement à la pro­téine cible », dit Ghis­laine. « De plus, il est pos­si­ble d’aller encore plus loin et de simuler la struc­ture tridi­men­sion­nelle des son­des : en effet, j’utilise des méth­odes basées sur la physique clas­sique, qui per­me­t­tent égale­ment de prédire l’interaction entre la séquence repliée dans l’espace et la pro­téine ciblée », con­clut Irène Maffucci.

De nombreuses thèses en appui pour le projet

Les travaux sur la mal­adie de Lyme ont com­mencé en 2021 par la thèse de Mick­ael Guerin. Au GEC, ils se pour­suiv­ent, depuis 2024, avec la thèse d’Hugo Da-Ponte dirigée par Séver­ine Padi­ol­leau, avec celle de Sel­ma Ben­guaouer, co-dirigée par Irène Maf­fuc­ci et Bérangère Bihan-Avalle ain­si qu’avec le ren­fort de Pauline Trezel, une post-doc. Au LMAC, c’est un post-doc, El Meh­di Issouani, qui vient en sou­tien de Miraine Davi­la Felipe et Ghis­laine Gayraud. Marc Shawky co-encadre actuelle­ment, avec Flo­ri­an de Vuyst, la thèse de Tere­sa Cia­vat­ti­ni sur la clas­si­fi­ca­tion des don­nées de patients en coopéra­tion avec Mater Mis­eri­cor­diae Uni­ver­si­ty Hos­pi­tal a Dublin. Enfin, un post-doc sera recruté pour la mise au point d’outils par appren­tis­sage machine afin d’assister les médecins clin­i­ciens dans leur déci­sion de com­mencer un traitement.

MSD

Le magazine

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram