La science des données au cœur de la révolution numérique

Avec l’émer­gence des Big data ou don­nées mas­sives en français, la sci­ence des don­nées est dev­enue un domaine de recherche où les investisse­ments des entre­pris­es sont con­sid­érables. Enseignant-chercheur en sci­ence des don­nées au lab­o­ra­toire Heudi­asyc de l’UTC, Ben­jamin Quost fait le point avec nous sur les dernières ten­dances de ce phénomène.

Des ser­vices à l’in­dus­trie en pas­sant par l’én­ergie, les appli­ca­tions basées sur l’analyse des régu­lar­ités dans les bases de don­nées pou­vant com­porter des mil­lions d’ex­em­ples et cen­taines de mil­liers de vari­ables offrent des oppor­tu­nité inédites. « Avant les sta­tis­ti­ciens se plaig­naient du manque de don­nées, aujour­d’hui le nou­veau défi c’est sou­vent la grande quan­tité d’in­for­ma­tions à traiter » résume Ben­jamin Quost. Depuis les pre­mières pub­li­ca­tions sci­en­tifiques au début des années 2000, le nom­bre de travaux de recherche et les investisse­ments sur le sujet ont explosé. Après une péri­ode d’ex­péri­men­ta­tion dans les qua­tre — cinq dernières années, les tech­nolo­gies ont gag­né en matu­rité et investis­sent tous les domaines d’ac­tiv­ité. La créa­tion d’al­go­rithmes per­for­mants et les puis­sances de cal­cul tou­jours plus impor­tantes décu­plent les capac­ités d’analyse et ren­dent même pos­si­ble dans cer­tains cas la réso­lu­tion autonome de prob­lèmes. « Des con­cepts anciens comme celui des réseaux de neu­rones ont été per­fec­tion­nés ; nous sommes main­tenant passés au stade des machines autoap­prenantes, par exem­ple en con­juguant l’ap­pren­tis­sage pro­fond ou « deep learn­ing » et l’ap­pren­tis­sage par ren­force­ment » souligne Ben­jamin Quost. Le sci­en­tifique rap­pelle ain­si les suc­cès du pro­gramme Alpha­go con­tre les plus grands cham­pi­ons humains du jeu de Go, un exploit impens­able il y a 15 ans. Par­mi les autres appli­ca­tions util­isant un grand nom­bre de don­nées fournies par des cap­teurs ou des util­isa­teurs, les véhicules intel­li­gents et autonomes dévelop­pés par le lab­o­ra­toire Heudi­asyc font aus­si large­ment appel aux nou­velles pos­si­bil­ités offertes par l’in­tel­li­gence arti­fi­cielle. L’ex­per­tise en sci­ence des don­nées de ce lab­o­ra­toire UTC-CNRS créé en 1981 en fait un acteur impor­tant de la recherche régulière­ment sol­lic­ité par les entre­pris­es. La struc­ture com­piég­noise pos­sède une valeur ajoutée stratégique.

Des applications dans la vie quotidienne

Out­re les appli­ca­tions de haute-tech­nolo­gie, des solu­tions courantes acces­si­bles par l’in­ter­mé­di­aire d’or­di­na­teurs per­son­nels, de sup­ports con­nec­tés ou de cap­teurs embar­qués sont déjà com­mer­cial­isées ou en développe­ment. « Les entre­pris­es pro­posent des pro­jets aus­si divers que les bâti­ments con­nec­tés ou la détec­tion de pos­tures avec des t‑shirts munis de cap­teurs », souligne le maître de con­férences. Respon­s­able de la fil­ière fouille de don­nées et déci­sion­nel, il con­state aus­si l’en­goue­ment actuel des étu­di­ants pour le domaine por­teur des Big data. Cette ten­dance de la sci­ence des don­nées à rem­plac­er l’hu­main par la machine pour­rait selon lui don­ner lieu à un boule­verse­ment sur le plan social. Par ailleurs, les avancées les plus spec­tac­u­laires de la sci­ence des don­nées con­cer­nent les domaines d’ap­pli­ca­tion où les infor­ma­tions sont disponibles en très grand nom­bre. Or cer­tains prob­lèmes d’in­térêt général sont car­ac­térisés par des infor­ma­tions lim­itées. « La recherche et les investisse­ments se focalisent beau­coup sur les « Big data », mais il ne faut pas oubli­er les « Small data », où l’on cherche à analyser des ensem­bles de don­nées incom­plètes ou bruitées » explique-t-il. Éla­bor­er des mod­èles à par­tir de telles infor­ma­tions « pau­vres » représen­terait en effet une avancée promet­teuse pour des domaines comme la biolo­gie et la médecine, où les don­nées peu­vent être en nom­bre lim­ité, incom­plètes, et de qual­ité par­fois incer­taine, ce qui peut être impor­tant à pren­dre en compte dans les proces­sus de prise de décision.

Le magazine

Avril 2025 - N°65

Biomécanique pour la santé : des modèles d’intelligence artificielle spécifiques

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram