54 : Coveille un projet structurant pour le LMAC
C’est dans le cadre de la crise sanitaire liée au Covid-19 que l’Institut national des sciences mathématiques et de leurs interactions (INSMI), un des dix instituts du CNRS, a décidé de mettre en place une plateforme de coordination des actions impliquant de la modélisation autour du Covid-19.
Cette plateforme, MODCOV19, vit le jour en plein confinement. Tout naturellement, plusieurs enseignants-chercheurs du laboratoire de mathématiques appliquées de Compiègne (LMAC), intéressés par la problématique, se mobilisèrent.
D’abord, individuellement sur MODCOV19, puis vint l’appel à manifestation d’intérêt lancé par Marie-Christine Ho Ba Tho, directrice à la recherche à l’UTC.
Aussitôt, 3 binômes d’enseignants-chercheurs se formèrent autour du projet Coveille. Les deux premiers, formés, d’une part, de Ghislaine Gayraud, professeure, de Miraine Davila Felipe, maître de conférences, et de Nikolaos Limnios et Salim Bouzebda, d’autre part, tous deux professeurs, s’intéressent particulièrement aux modèles et outils stochastiques.
Autrement dit des modèles où l’on introduit de l’aléa. Le dernier, impliquant Florian De Vuyst et Ahmad El Hajj, tous deux professeurs, travaille sur les modèles et approches mathématiques déterministes.
L’objectif de COVEILLE ? Réaliser la modélisation de la dynamique de l’épidémie de Covid-19 à différents niveaux de granularité, ou de finesse d’analyse des données. En somme, des modèles qui serviront d’aide à une veille de la propagation du virus et des risques de vagues secondaires.
Professeur des universités, Florian De Vuyst est directeur, depuis 2018, du laboratoire de mathématiques appliquées de Compiègne (LMAC). Fort de plus de 30 personnes – enseignants-chercheurs, professeurs agrégés, attachés temporaires d’enseignement et de recherche (ATER), doctorants et post-doctorants – le LMAC compte deux équipes. La première, l’EPIA, se consacre aux « problèmes inverses et analyse numérique » ; la seconde, S2, aux « systèmes stochastiques ». Actuellement, 6 enseignants-chercheurs sont mobilisés sur Coveille, un projet de modélisation lié à l’épidémie de Covid-19.
Après 15 années en tant que professeur des universités – 8 années à l’école Centrale Paris au laboratoire de mathématiques appliquées aux systèmes, puis 7 autres années à l’École normale supérieure de Cachan au centre de mathématiques et de leurs applications – Florian De Vuyst rejoint, en 2017, l’UTC avant de prendre la direction du LMAC dès janvier 2018.
« Actuellement, le LMAC compte 13 enseignantschercheurs, 2 professeurs agrégés, 2 ATER et une quinzaine de doctorants. Au sein du labo, on travaille bien entendu sur des aspects purement théoriques, mais aussi sur des algorithmes et des applications plus pratiques », explique Florian De Vuyst. Équipe d’accueil, le LMAC est aussi membre de la Fédération de mathématiques des Hauts-de-France FMHF, fédération de recherche CNRS.
Les spécialités des deux équipes de recherche ? « L’EPIA travaille sur les problématiques de “problèmes inverses”, d’“équations aux dérivées partielles” ou encore de “réduction de modèles numériques”. De la modélisation déterministe pure avec des applications pratiques dans de nombreux domaines. On peut citer la détection d’anomalies, l’imagerie médicale, la mécanique des fluides ou encore le trafic routier, par exemple. L’équipe S2 s’intéresse plus particulièrement à la modélisation stochastique, caractérisée par l’introduction de l’aléa, la statistique mathématique, l’analyse de données ou encore au machine learning et à l’apprentissage. Des champs théoriques qui aboutissent à des modèles permettant, entre autres, l’extraction de connaissances, la prévision sous incertitudes, la détection de changements de tendance, l’estimation robuste, etc. Des modèles applicables, notamment, dans les domaines de la santé, des systèmes physiques tels que la mécanique – l’étude des fissures dans un matériau, par exemple – de la fiabilité des systèmes complexes, ou tout simplement de l’activité humaine », souligne-t-il.
Un des points forts du LMAC ? « C’est l’existence de deux équipes, l’une avec une approche dite “déterministe”, c’est-à-dire axée sur des modèles dits “continus”, homogénéisés, et l’autre avec une approche stochastique qui s’intéresse à des échantillons ou des échelles de temps et d’espace plus fins. Ce qui permet de décrire une réalité de deux façons différentes mais souvent complémentaires et de donner des éléments de réponse de façon différente et avec des critères différents », ajoute Florian De Vuyst. Loin de l’image de mathématiques désincarnées, les équipes du LMAC collaborent à des applications concrètes notamment avec des institutions de santé ou des industriels. « L’équipe EPIA a notamment travaillé avec le CHU d’Amiens. L’objectif était de détecter des anomalies dans le cerveau ou d’autres parties du corps à partir de la réponse des tissus vivants à différents types d’ondes émises par les dispositifs médicaux. Il s’agit en somme, en partant d’observations ou de mesures inintelligibles, d’inverser la perspective afin de les rendre intelligibles. L’équipe collabore également, dans le cadre de thèses Cifre, avec le constructeur Renault sur un projet d’optimisation des véhicules. La première était consacrée à la problématique d’allégement du véhicule tout en gardant les mêmes performances ou “prestations”. La seconde, à venir, portera sur la réduction de la traînée, c’est-à-dire le coefficient CX, dû au frottement de l’air. Ce qui se traduit par une moindre consommation d’énergie », détaille-t-il.
Le LMAC est enfin impliqué dans des collaborations avec d’autres laboratoires de l’UTC. « Une plateforme collaborative commune a été ainsi mise en place avec Adnan Ibrahimbegovic du laboratoire Roberval et membre senior de l’Institut universitaire de France. Le but ? Travailler ensemble sur des projets communs dédiés à la mécanique numérique. Nous travaillons également avec le BMBI, particulièrement avec Anne-Virginie Salsac sur les problématiques liées aux microcapsules et à leur transport dans les vaisseaux sanguins. Avec comme objectif principal : permettre l’innovation en médecine. Nous avons notamment un doctorant en codirection qui poursuit une thèse sur les techniques de réduction de modèles », conclut Florian De Vuyst.
Maître de conférences au laboratoire de mathématiques appliquées de Compiègne (LMAC), Miraine Davila Felipe fait partie de l’équipe S2 dédiée, notamment, aux modèles et outils stochastiques. Autrement dit : des modèles où l’on introduit de l’aléa. Elle pilote Coveille, un projet de modélisation autour du Covid-19.
C’est après un appel à manifestation d’intérêt (AMI) que trois binômes, impliquant des compétences dans les approches et outils déterministes et stochastiques, se formèrent au sein du LMAC pour travailler sur Coveille. « Je suis la dernière arrivée à l’UTC en 2019. Le fait que mes collègues m’aient choisie pour piloter ce projet me touche énormément, car ils prouvent, par égard », assure Miraine Davila Felipe.
C’est alors qu’elle enseignait à l’université de La Havane que l’idée de venir en France germa dans son esprit. L’élément déclencheur ? « J’ai rencontré des chercheurs français de l’École polytechnique en visite à l’université et j’ai été séduite par la qualité de la recherche en mathématiques en France. Ce qui m’a motivée à postuler en master 1 en mathématiques appliquées dans la même école. J’ai été retenue et ai obtenu une bourse. J’ai poursuivi par un master 2 commun à Polytechnique et Paris VI – Sorbonne Université – en mathématiques appliquées à la biologie. Cela m’a permis, lors d’un stage chez Télécom Paris, d’avoir une première expérience en épidémiologie. J’ai travaillé notamment sur des méthodes qui permettent l’estimation d’événements rares dans le cas de maladies transmissibles, pouvant éventuellement déboucher sur des situations de crise d’un point de vue de santé publique », explique-t-elle.
De là date son intérêt pour l’épidémiologie. Elle poursuit donc par une thèse au sein d’une équipe pluridisciplinaire, rassemblant des biologistes, des mathématiciens, des statisticiens, des probabilistes, dirigée par un professeur de Paris VI au sein du Collège de France.
Le thème de sa thèse ? « J’ai travaillé sur les modèles phylodynamiques, un domaine de recherche relativement récent. Il s’agit d’étudier, à partir des données génétiques du pathogène – virus ou bactérie – la propagation des maladies dans la population. Ce sont des modèles que l’on utilise particulièrement pour les maladies telles que la grippe, le VIH ou encore Ebola, caractérisées par un fort taux de mutation des pathogènes en cause. Le fait de trouver des séquences génétiques différentes d’un pathogène donné chez les patients nous permet en effet de reconstruire l’arbre de transmission. En un mot : dire qui a infecté qui au cours du temps. À condition de disposer d’assez de données pour réduire l’incertitude », précise Miraine Davila Felipe.
Un champ de recherches qui permet, par exemple, d’estimer la date du début de l’épidémie et que les chercheurs tentent d’appliquer au Covid-19. En cela, ils sont aidés par l’émergence de techniques d’échantillonnage assez rapides et peu coûteuses au regard de ce qui existait auparavant. « Actuellement sur le Covid-19, il y a un site qui recense près de 10 000 séquences génétiques de patients. Il faut savoir que chaque individu recèle en lui un certain nombre de virus avec, toutefois, toujours un qui est surreprésenté. En général, c’est celui que l’on a le plus de chance de transmettre. D’où la possibilité, grâce à la signature laissée par le virus, de reconstruire, à l’aide de statistiques, des arbres phylogénétiques de transmission. Certes, il reste encore pas mal d’incertitudes mais cela permet néanmoins de faire des estimations par rapport à l’évolution des épidémies. On peut ainsi estimer le taux de reproduction du virus ou R0 », souligne-t-elle.
Un champ de recherche qu’elle a approfondi lors de son post-doc à l’Institut Pasteur de 2017 à 2018 puis en tant qu’attachée temporaire d’enseignement et de recherche à l’université de Nanterre et qu’elle poursuit depuis son arrivée à l’UTC. « J’ai développé ce type de modèles d’un point de vue mathématique et j’ai obtenu des résultats théoriques assez robustes sur le plan épidémiologique. L’idée est de coupler deux variables très différentes mais fortement corrélées : la dynamique de l’épidémie au niveau de la population, au travers des courbes de malades au cours du temps, et la dynamique génétique du virus grâce à des arbres mathématiques de transmission. On a ainsi une double information », conclut Miraine Davila Felipe.
Un champ de recherche enfin qu’elle compte bien appliquer, avec d’autres collègues, à Coveille, un projet transversal autour de la modélisation du Covid-19.
Six enseignants-chercheurs – formant trois binômes – sont mobilisés sur Coveille, un projet de modélisation de la dynamique de l’épidémie de Covid-19 à plusieurs niveaux de granularité. L’objectif de Coveille étant de pouvoir assurer une veille de la propagation du virus et d’alerter sur les risques de vagues secondaires.
Spécificités de Coveille ? L’implication d’enseignants-chercheurs ayant des compétences dans les modèles et approches mathématiques tant déterministes que stochastiques ou aléatoires et qui seront épaulés, dès janvier 2021, par deux étudiants en stage de fin d’études. Le déroulement du projet ? « Il comprend trois phases : la première s’attache à une analyse statistique classique, avec Miraine et Ghislaine, la deuxième, avec Florian et Ahmad, établit des équations différentielles ordinaires ; quant à Salim et moi-même, nous viendrons, dans une troisième phase, ajouter de l’aléa à l’équation déterministe », explique Nikolaos Limnios, professeur des universités.
Coveille s’articule en effet autour de deux axes de recherche, le premier portant sur la modélisation déterministe et aléatoire, estimation et prévision quantitative ; le second, sur l’identification de classes d’individus en interaction. Toutefois, ces deux axes ne sont nullement disjoints et la réussite du projet passera, ils en sont conscients, par un dialogue permanent entre les trois binômes.
La première phase menée par Ghislaine Gayraud, professeure des universités, spécialiste en statistique mathématique et Miraine Davila Felipe, maître de conférences, spécialiste en probabilités ? « Avec Coveille, nous souhaitons développer des outils qui nous permettraient de décrire l’évolution de la pandémie à différents échelons. En effet, la grande difficulté dans les épidémies en général, et le Covid en particulier, tient à l’hétérogénéité de la population tant par l’âge que par les milieux sociaux, par exemple. Ce qui, d’un point de vue mathématique, pose un défi majeur. Ghislaine et moi nous intéressons plus précisément au réseau de contacts des individus. Notre objectif est de modéliser le réseau social par lequel le Covid est susceptible de se propager », explique Miraine Davila Felipe.
« L’idée n’est pas de prédire qui sera ou ne sera pas infecté à long terme mais de pouvoir assurer une veille et d’identifier des clusters au sein de la population en fonction des contacts des individus. En un mot : on s’intéresse plus au réseau de relations par lequel le virus va se diffuser qu’à la transmission elle-même », ajoute Ghislaine Gayraud.
Caractéristique des modèles et approches déterministes de la deuxième phase ? « On travaille sur des modèles qui ne prennent pas en compte l’aspect aléatoire. En effet, dans les approches déterministes où l’on aborde notamment la thématique des “problèmes inverses” et d’analyse numérique en général, on considère que l’on connaît très bien les paramètres utilisés pour construire les modèles. Une modélisation qui s’applique, entre autres, à la mécanique ou encore à la biologie. Dans ce domaine, on a mené ainsi plusieurs projets avec le CHU d’Amiens, notamment sur la détection de cellules cancéreuses dans le corps humain à partir de mesures de l’activité cérébrale électrique des patients ou encore la caractérisation de l’épilepsie, un projet porté par la région et sur lequel on a collaboré avec le département de mathématiques de l’université d’Amiens », explique Ahmad El Hajj, professeur des universités et responsable de l’équipe déterministe.
Florian De Vuyst, directeur du LMAC, abonde dans ce sens : « Il s’agit en effet de caractériser, à partir de signaux ou de mesures qui ne sont pas des images à proprement parler, une tumeur, par exemple, à un certain endroit dans le corps. C’est ce que l’on appelle “problèmes inverses”. En somme, réussir à transformer des signaux que l’on ne peut pas interpréter directement en données intelligibles et exploitables in fine pour établir un diagnostic. »
« Concernant le Covid-19, nous avons les compétences, en prenant un modèle direct du virus, de déterminer les taux d’infectiosité, d’incubation et de décès, la durée de guérison, etc. Autant de variables pertinentes d’un point de vue épidémiologique et que l’on peut calculer à partir de données observables telles que le nombre de personnes infectées, de personnes hospitalisées, etc. », ajoute-t-il.
Quels peuvent être alors les aléas que l’on pourrait prendre en compte dans le cas du Covid ? « À partir des données antérieures disponibles, par exemple sur les individus sensibles à l’infection, les individus asymptomatiques, les symptomatiques avec symptômes sévères, les symptomatiques non déclarés et enfin les guéris ou décédés, Florian et Ahmad vont proposer un modèle déterministe SEIR enrichi par des catégories qui reflètent au mieux la réalité de l’épidémie actuelle. À ce modèle, nous allons affecter des perturbations aléatoires tels le taux d’infectiosité ou le pourcentage d’infectés sévères qui dépendent de plusieurs facteurs et ne peuvent pas être totalement maîtrisés de manière déterministe », explique Nikolaos Limnios.
Les objectifs de ces modèles ? « Le premier objectif est de déterminer la dynamique et l’évolution du virus dans la population. Mais le développement de modèles stochastiques répond surtout à un besoin de prévision. Il s’agit de pouvoir dire que, si l’on a un nombre de patients N au temps T, on aura, par exemple : N X 2 patients à T+10. Une prévision fiable est un précieux outil d’aide à la décision. Dans le cas du Covid, il permettrait de décider du confinement de tel ou tel territoire ou de redimensionner la capacité des hôpitaux, par exemple », conclut Salim Bouzebda, professeur des universités, responsable de l’équipe stochastique