From

Horaires à

Lieu ENS Paris-Saclay

Thèses et HDR

Gonzalo QUINTANA : soutenance de thèse

Titre : Exploiter des méthodes d'adaptation de domaine pour l'apprentissage fédéré appliqué à la classification d'images en mammographie
Direction : M. Mougeot, A. Désolneux
Soutenance le 06/12/24 en 1Z14

Ajouter au calendrier

Gonzalo Iñaki QUINTANA

Exploiter des méthodes d'adaptation de domaine pour l'apprentissage fédéré appliqué à la classification d'images en mammographie

Résumé

Le cancer du sein est le cancer le plus fréquemment diagnostiqué chez les femmes. Une détection précoce améliore considérablement le taux de survie. Les techniques d'imagerie par rayons X jouent un rôle crucial dans la détection, le diagnostic et le suivi du traitement du cancer du sein. Les systèmes d'aide à la détection et au diagnostic par ordinateur (CAD) basés sur l'apprentissage profond sont développés pour assister les radiologues dans la détection et l'analyse des résultats radiologiques. Cependant, le développement de ces modèles nécessite l'accès à de grandes bases de données annotées qui capturent la variabilité entre différentes populations, systèmes d'acquisition et algorithmes de post-traitement d'image. La collecte de données provenant de différents sites cliniques pose des défis pratiques et juridiques liés aux lois sur la confidentialité des données de santé, ce qui entrave le développement de CAD basés sur l'apprentissage profond pour la mammographie.

L'apprentissage fédéré (FL) élimine le besoin de collecter des données en un lieu centralisé et a le potentiel de surmonter l'un des principaux obstacles à l'exploitation des données de sites cliniques plus diversifiés. Bien qu'ayant montré des résultats prometteurs lorsque les données des différents clients ou sites sont homogènes, l'entraînement des modèles de FL est affecté négativement lorsque la distribution des données diffère sur chaque site (ce qui est connu comme contexte hétérogène). Cela est particulièrement problématique pour les images de mammographie, en raison des différences entre les populations et du grand nombre de systèmes de mammographie, de fournisseurs et d'algorithmes de post-traitement, qui contribuent à des distributions très hétérogènes entre les sites

Dans cette thèse, nous explorons le développement et l'entraînement de modèles d'apprentissage profond pour la mammographie, en utilisant l'apprentissage fédéré. En particulier, nous étudions les problèmes causés par des distributions de données hétérogènes en raison des différences de style d'image et proposons des moyens de les atténuer.

Nous introduisons d'abord BN-SCAFFOLD, un algorithme d'apprentissage fédéré qui étend SCAFFOLD en utilisant des variables de contrôle pour corriger la dérive des clients dans les couches Batch Normalization. Nous développons un cadre théorique général qui permet de calculer les taux de convergence pour différents algorithmes d'apprentissage fédéré et fournissons des garanties de convergence pour BN-SCAFFOLD. BN-SCAFFOLD surpasse la performance des autres algorithmes d'apprentissage fédéré lorsque l'hétérogénéité est forte. Ensuite, nous proposons une méthodologie d'adaptation de domaine basée sur l'apprentissage contrastif, qui permet d'obtenir des modèles invariants au domaine dans un scénario centralisé, augmentant ainsi les performances de classification. Nous montrons théoriquement que la minimisation des fonctions de perte contrastives réduit la Class-wise Mean Maximum Discrepancy (CMMD), une mesure de dissimilarité couramment utilisée pour réaliser l'adaptation de domaine, et réalise ainsi l'adaptation de domaine. De plus, nous montrons que la diminution des fonctions de perte contrastives augmente la séparabilité des classes dans l'espace des caractéristiques. Enfin, nous étendons cette méthodologie de d'apprentissage contrastif à l'apprentissage fédéré tout en assurant l'alignement des caractéristiques entre les clients sans nécessiter la transmission des caractéristiques extraites localement, ce qui réduit l'impact sur la confidentialité des données.

Mots clés

apprentissage fédéré,apprentissage profond,adaptation de domaine,apprentissage contrastif,détection assistée par ordinateur,imagerie médicale

Direction

Jury

  • Joseph SALMON, Professeur, Université de Montpellier
  • Pietro GORI, Maître de conférences, Télécom Paris
  • Marco LORENZI, Chargé de recherche, Université Côte d'Azur, INRIA
  • Erwan LE PENNEC, Professeur, École polytechnique     
  • Isabelle BLOCH, Professeur, Sorbonne Université, LIP6