Thibaut GERMAIN
Détection et analyse de formes pour les séries temporelles physiologiques
Résumé
Les données temporelles sont courantes en recherche biomédicale et les formes récurrentes ou anormales qu'elles comportent constituent des variables essentielles pour mener des analyses statistiques. Par exemple, dans les électrocardiogrammes, la forme des battements de cœur peut varier selon l'état physiologique des sujets, ce qui en fait une variable décisive pour diagnostiquer des maladies cardiaques. En revanche, la comparaison de telles formes nécessite des outils mathématiques spécifiques situés entre l'apprentissage automatique pour les séries temporelles et de l'analyse des formes.
Alors que la communauté d’analyse de formes s’est partiellement penchée sur les séries temporelles, les méthodes d'apprentissage en séries temporelles s’appuyant sur la notion de forme ont connu un succès dans diverses applications. Cette thèse vise à combiner les forces de ces deux domaines pour proposer des méthodes adaptées à l’analyse de données temporelles en recherche biomédicale. Une attention particulière sera accordée à l'interprétabilité des méthodes par le biais de rendus visuels des formes et des déformations, essentielles dans le dialogue entre données et chercheurs.
La thèse est structurée en deux parties : la première se concentre sur la recherche et la découverte de formes dans des séries temporelles, tandis que la seconde se concentre sur la comparaison de formes.
La première partie aborde le problème de la recherche ou de la découverte de formes dans de longues séries temporelles avec des distances indépendantes de certaines sources de variabilité modélisées par un groupe de déformations. Pour ce faire, une méthode générale de construction de distances invariantes par rapport au groupe de déformation est introduite. Ce cadre étend la distance Z-normalisée en permettant la personnalisation du groupe de déformations. Ces distances peuvent être intégrées dans des algorithmes pour la recherche ou la découverte de motifs sans perte d'efficacité. Un algorithme pour la découverte de motifs a aussi été développé. Il transforme une série temporelle en un graphique permettant l'identification de motifs récurrents. En tirant parti de l'interprétabilité et de l'efficacité de cet algorithme, une application interactive a été conçue pour faciliter la découverte de motifs.
La deuxième partie se concentre sur la comparaison des formes à l'aide de déformations élastiques qui tiennent compte des paramétrisations temporelles. Les méthodes proposées s'inspirent de l'analyse des cycles respiratoires de souris afin d'identifier des modalités de ventilation et d'évaluer les changements respiratoires chez des souris de génotypes différents après exposition à une molécule affectant la respiration. Une première méthode compare les cycles respiratoires à l'aide d'un algorithme de clustering s’appuyant sur la distance Dynamic Time Warping. Conçus comme référence, les résultats expérimentaux montrent que les clusters reflètent des modalités de ventilation liées à des génotypes et à des réponses à l'exposition. La seconde méthode crée des représentations vectorielles de séries temporelles échantillonnées de manière irrégulière et de longueur variable par le vecteur paramétrant les déformations qui font correspondre une série temporelle de référence aux autres. Cette approche s'appuie sur une méthode d'analyse de formes nommée Large Deformation Diffeomorphic Metric Mapping (LDDMM). Celle-ci est modifiée pour maintenir la structure spatio-temporelle des données tout en garantissant la bijectivité des représentations. Cette nouvelle méthode fournit des informations statistiques et visuelles sur les formes et les déformations. Une simple analyse statistique révèle que les déformations les plus importantes ont une signification physiologique permettant de mieux comprendre les modalités de ventilation selon le génotype et l'exposition.
Direction
Jury
- Jessica LIN, Associate Professor, George Mason University
- Romain TAVENARD, Professeur, Université Rennes 2
- Alain TROUVE, Professeur, ENS Paris Saclay
- Laurent YOUNES, Professeur, Johns Hopkins University
- Guillermo SAPIRO, Professeur,Princeton University