Outils géométriques pour les sciences du vivant

Cet axe concerne le domaine des statistiques géométriques et plus précisémment l'étude des données à valeurs dans des variétés, orbifolds ou des espaces stratifiés dont les espaces de formes constituent des exemples emblématiques.

Référents scientifiques

Coordinateur et responsable : Alain Trouvé

Présentation de la thématique

Statistiques géométriques

Dans le cadre de la thèse d’Elodie Maignant (en co-dir avec Xavier Pennec), a étudié la généralisation de techniques de réduction de données par plongement au cas non-euclidien au travers la notion de sous-espaces barycentriques avec des applications via espaces de Kendall à analyse conformationnelle.

Métriques et actions géométriques locales

Les trajectoires géodésiques dans les espaces riemanniens, en particulier dans des situations de transport, sont évidemment induites par le choix des métriques et des actions infinitésimales locales. Malgré leur utilité, le sur-emploi de métriques “simples” (comme la métrique L2 pour le transport optimal ou des métriques de Sobolev isotropes) peut se faire au détriment de métriques plus naturelles encodant des contraintes de modélisation. Les approches sous-riemanniennes dans les espaces de formes ouvrent des voies importantes avec les approches modulaires décomposant les actions infinitésimales locales.

Divergences géométriques

Les divergences entre distributions de probabilités jouent un rôle central dans les approches en machine learning et comme attaches aux données pour des espaces de formes encodées par des distributions. Les normes duales noyaux (ou MMD) fournissent des outils simples et puissants mais les approches par transport optimal (OT) suscitent un très grand intérêt notamment depuis la version Sinkhornisée avec régularisation entropique introduite par Marco Cuturi au prix toutefois d’une perte de la propriété de séparation (ce n’est pas une divergence). L'équipe a établi que cette propriété peut être récupérée dans le cadre d’une famille dite de divergences de Sinkhorn SE qui interpole entre MMD et OT en fonction du paramètre E de régularisation entropique.

Intégration géométrique multi-échelle en neurosciences

L’analyse spatialisée et conjointe des niveaux moléculaires avec celui macro des tissus biologiques et des manifestations cliniques en particulier avec l’arrivée des techniques de transcriptomique spatiale (Meshfish, Barseq) dans l’optique de la construction de modèle data-driven intégratifs en neuroscience est très prometteuse mais fait face plusieurs challenges. L'équipe développe un programme de recherche autour des challenges technologiques au niveau du développement et du déploiement des nouvelles modalités d’acquisition de données massives mais aussi mathématiques par les problématiques de réalignement de données multi-modales, multi-échelles acquises dans des systèmes de coordonnées et des domaines spatiaux 2 à 2 faiblement consistant. Les premières applications concrètes sur des données chez la souris dans le cadre multimodal d’alignement d’atlas sur des données en 2D viennent d’être récemment publiées et s'appuient très fortement sur les possibilités offertes par KeOps.

Mots clés

?

Faits marquants

Logiciels

La librairie Ke0ps  développée pendant  la thèse  de  Jean Feydy permet le calcul de produits  matrices vecteurs  pour des matrices denses dont les coefficients sont recalculés à la volée sur GPU (et non stockés en mémoire) à partir de leurs formules encodées de façon transparente pour l’utilisateur très orienté sur les architectures neuronales (PyTorch, TensorFlox, etc).

Ke0ps constitue un environnement de développement très adapté pour les méthodes particulaires en particulier pour approches hamiltoniennes de transport dans les espaces de formes avec un impact massif en termes de vitesse d'exécution et de facilité de développement.

La librairie GeomLoss  s'appuie sur Ke0ps et permet de calculer sur GPU

  • des normes de noyau (Maximum Mean Discrepancies)
  • des divergences de Hausdorff analogues aux log-vraisemblances des modèles de mélange gaussien.
  • des divergences de Sinkhorn débiaisées, qui sont des approximations positives et définies des distances de transport optimal.

Collaborations

Johns Hopkins University, INRIA-Epione, INRIA-HeKA, Université de Montpellier, LJLL - Sorbonne
Université, Institut du Cerveau, Service Hospitalier Frédéric Joliot

Principales publications

 

  • B. Gris, S. Durrleman, and A. Trouvé. A sub-riemannian modular framework for diffeomorphism- based analysis of shape ensembles. SIAM Journal on Imaging Sciences, 11(1) :802– 833, 2018.
  • N. Charon, B. Charlier, and A. Trouvé. Metamorphoses of functional shapes in sobolev spaces. Foundations of Computational Mathematics, 18 :1535–1596, 2018.
  • J. Feydy, T. Séjourné, F.-X. Vialard, S.-I. Amari, A. Trouvé, and G. Peyré. Interpolating between optimal transport and mmd using sinkhorn divergences. In The 22nd International Conference on Artificial Intelligence and Statistics, pages 2681–2690. PMLR, 2019.
  • B. Charlier, J. Feydy, J. A. Glaunes, F.-D. Collin, and G. Durif. Kernel operations on the gpu, with autodiff, without memory overflows. Journal of Machine Learning Research, 22(74) :1–6, 2021.
  • M. Miller, D. Tward, and A. Trouvé. Molecular computational anatomy : unifying the particle to tissue continuum via measure representations of the brain. BME frontiers, 2022.
  • E. Maignant, A. Trouvé, and X. Pennec. Riemannian locally linear embedding with application to kendall shape spaces. In International Conference on Geometric Science of Information, pages 12–20. Springer Nature Switzerland Cham, 2023.
  • K. M Stouffer, et al. Cross-modality mapping using image varifolds to align tissue-scale atlases to molecular-scale measures with application to 2d brain sections. Nature Communications, 15(1) :3530, 2024.

Portfolio

Interactions avec les autres thématiques du Centre Borelli