Samuel GRUFFAZ
De la quantification du style moteur dans les séries temporelles aux méthodes Monte Carlo par chaînes de Markov en approximation stochastique
Résumé
Cette thèse aborde le problème de l’identification et de la quantification du style individuel dans des séries temporelles physiologiques, avec des applications en neurophysiologie et en médecine personnalisée. Dans une première partie, nous modélisons la variabilité inter- et intra-individuelle comme des transformations de motifs communs. Deux méthodes non supervisées et interprétables sont développées. Pour les signaux régulièrement échantillonnés, nous utilisons une variante de l’apprentissage de dictionnaires convolutionnels (PerCDL), qui capture la variabilité temporelle par déformation temporelle dans le cadre de l’analyse de la marche. Pour les signaux irrégulièrement échantillonnés, nous adaptons le cadre du Large Deformation Diffeomorphic Metric Mapping (LDDMM), issu de l’analyse de formes, aux séries temporelles, en l’appuyant sur une nouvelle représentation à noyaux dans un espace de Hilbert à noyau reproduisant (RKHS). Ces deux approches fournissent des caractéristiques pertinentes pour la classification et la visualisation dans des jeux de données cliniques et expérimentaux.
Le problème d’identification du style fait écho à la modélisation à effets mixtes, qui intègre à la fois des variables latentes individuelles et des paramètres de population. C’est pourquoi la deuxième partie se concentre sur l’estimation des paramètres dans des modèles bayésiens à effets mixtes à l’aide de l’algorithme MCMC-SAEM. Nous abordons les défis computationnels posés par les méthodes de Monte Carlo par chaînes de Markov (MCMC) dans le cadre de l’approximation stochastique. Nous apportons d’abord la première preuve de convergence de l’algorithme No-U-Turn Sampler (NUTS), établissant son ergodicité géométrique. Nous introduisons également le Geodesic Slice Sampling, premier échantillonneur par tranches pratique sur des variétés riemanniennes, et montrons son utilité dans des modèles à variables latentes de nature géométrique. Enfin, nous explorons l’impact de l’utilisation d’échantillonneurs MCMC asymptotiquement biaisés. Nous montrons que l’algorithme de Langevin non ajusté (ULA), bien que biaisé, fonctionne efficacement en pratique et est plus simple à régler que son pendant corrigé par Metropolis.
Dans l’ensemble, cette thèse établit un pont entre la modélisation interprétable des séries temporelles et les méthodes avancées de calcul bayésien, en apportant à la fois des contributions théoriques et des outils pratiques pour l’analyse de la variabilité individuelle dans les données physiologiques.
Mots-clés
Statistiques Bayesiennes, MCMC, analyse de séries temporelles, applications biomédicales, apprentissage de dictionnaire, géométrie riemannienne
Direction
- Nicolas VAYATIS
- Alain DURMUS
Jury
- Julien Mairal
- Anthony Lee,
- Alain Trouvé
- Estelle Kuhn
- Stéphanie Allasonnière,
- Thomas Moreau