Imiter la réalité : le rôle des modèles mathématiques

Respectivement professeure des universités et maîtresse de conférences au LMAC, Ghislaine Gayraud et Miraine Davila Felipe s’intéressent à la modélisation stochastique de systèmes réels complexes. Irène Maffucci, quant à elle maîtresse de conférences rattachée au GEC, est spécialisée en bio-informatique structurale. Les trois scientifiques participent au projet sur la maladie de Lyme pilote par Séverine Padiolleau.
Le rôle des mathématiciens dans ce projet ? « L’idée est de proposer un modèle stochastique qui génère in silico de nouvelles séquences d’ADN ressemblant (du point de vue probabiliste) à celles obtenues in vitro par l’équipe de Séverine. À partir de cette famille de séquences générées in silico, il s’agit ensuite d’en sélectionner quelques-unes, dites “sondes”, qui semblent avoir des bonnes capacités d’appairage avec la protéine d’intérêt. Leur sélection consiste à chercher celles qui sont “proches”, en termes de distance mathématique, de celles que l’équipe de Séverine et d’Irene a étiquetées comme étant de bonnes candidates sur l’ensemble des séquences obtenues in vitro par le SELEX. Le processus complet de l’étude commence par la partie expérimentale (SELEX), se poursuit par un modèle et des outils mathématiques, puis repart vers l’expérimental pour valider les séquences sélectionnées in silico », explique Ghislaine Gayraud.
Qu’entend-on par « séquence » ? « L’ADN est composé de quatre bases azotées : A, T, C, G. On appelle séquence la succession de ces bases positionnées dans un ordre particulier et sur une longueur donnée. La diversité de 1014 molécules mentionnée par Stéphane correspond à 1014 séquences différentes de longueur 40 à l’étape initiale du SELEX. L’objectif de cette procédure est d’identifier in vitro des sondes potentielles », souligne Séverine Padiolleau.
Le déroulement de la procédure in vitro ? « Lors de ce processus très chronophage et complexe, il y aura un certain nombre de séquences capables de reconnaître la protéine d’intérêt mais tout de même réduites par rapport à toutes les possibilités. Cela représente une limite majeure du SELEX », précise Miraine Davila Felipe.
C’est en effet à ce stade que les mathématiques interviennent. « Sur la base de nos résultats in vitro, Ghislaine et Miraine vont proposer un modèle mathématique pour générer in silico de nouvelles séquences différentes des nôtres mais potentiellement fonctionnelles. On peut bien sûr se demander à quoi cela sert puisque l’on a une bonne candidate in vitro. En fait, viser la même cible ne constitue pas un but en soi dans l’absolu. D’une part, cela permet d’augmenter le nombre de sondes à disposition. D’autre part, ce modèle pourrait être appliqué pour cibler d’autres protéines d’intérêt sans devoir mettre en place la procédure SELEX », assure Séverine Padiolleau.
Ghislaine et Miraine, soutenues par un postdoc, se sont appuyées sur une famille de modèles existante, la famille des modèles « Restricted Boltzmann Machines (RBM) ». « Le RBM est un modèle graphique à deux couches avec une couche en entrée constituée de la séquence et une couche cachée qui est censée prendre en compte la structure 2D ou encore mieux la 3D, de la séquence lorsqu’elle se replie. La présence de cette couche cachée est importante car la manière dont se replie la séquence est fondamentale pour assurer son appariement à la protéine cible », dit Ghislaine. « De plus, il est possible d’aller encore plus loin et de simuler la structure tridimensionnelle des sondes : en effet, j’utilise des méthodes basées sur la physique classique, qui permettent également de prédire l’interaction entre la séquence repliée dans l’espace et la protéine ciblée », conclut Irène Maffucci.
De nombreuses thèses en appui pour le projet
Les travaux sur la maladie de Lyme ont commencé en 2021 par la thèse de Mickael Guerin. Au GEC, ils se poursuivent, depuis 2024, avec la thèse d’Hugo Da-Ponte dirigée par Séverine Padiolleau, avec celle de Selma Benguaouer, co-dirigée par Irène Maffucci et Bérangère Bihan-Avalle ainsi qu’avec le renfort de Pauline Trezel, une post-doc. Au LMAC, c’est un post-doc, El Mehdi Issouani, qui vient en soutien de Miraine Davila Felipe et Ghislaine Gayraud. Marc Shawky co-encadre actuellement, avec Florian de Vuyst, la thèse de Teresa Ciavattini sur la classification des données de patients en coopération avec Mater Misericordiae University Hospital a Dublin. Enfin, un post-doc sera recruté pour la mise au point d’outils par apprentissage machine afin d’assister les médecins cliniciens dans leur décision de commencer un traitement.
MSD




