From

Horaires à

Lieu ENS Paris Saclay

Thèses et HDR

Antoine DE MATHELIN : soutenance de thèse

Titre : Towards reliable machine learning under domain shift and costly labeling, with applications to engineering design.
Direction : M. Mougeot, N. Vayatis, F. Deheeger
Soutenance le 09/10/2024 en 1B26

Ajouter au calendrier

Antoine De Mathelin

Towards reliable machine learning under domain shift and costly labeling, with applications to engineering design.

Résumé

Dans le domaine de la conception de produits industriels, l'utilisation de modèles d'apprentissage automatique pour trouver des produits innovants pose des défis majeurs. L'efficacité des modèles d'apprentissage automatique a été démontrée lorsqu'ils sont entraînés et utilisés sur de grands ensembles de données d'observations distribuées de manière identique et indépendante. Cependant, dans le contexte de la conception produit, les modèles sont souvent déployés sur des distributions décalées, avec peu de données étiquetées disponibles. De plus, la fiabilité du modèle est fortement requise, car faire confiance à des prédictions erronées peut avoir des conséquences dommageables. Cette thèse relève le défi de fournir un modèle d'apprentissage automatique fiable sous les principales contraintes de la conception produit: le changement de domaine et l'étiquetage coûteux.

En tirant parti de nouvelles contributions en adaptation de domaine, apprentissage actif et quantification d'incertitude, nous proposons une approche générique pour atteindre cet objectif. De plus, les contributions de cette thèse aux trois thèmes susmentionnés ont un impact au-delà du contexte industriel. Elles permettent d'atteindre des performances similaires ou meilleures avec moins de données et un temps de calcul réduit par rapport aux approches standards. En outre, la thèse fournit des outils accessibles à travers une bibliothèque d'adaptation de domaine et d'apprentissage par transfert appelée Adapt.

Abstract

In engineering design, using machine learning models to find innovative products poses major challenges. The effectiveness of machine learning models has been demonstrated when trained and used on large datasets of independently identically distributed observations. However, in the engineering design context, models are often deployed on shifted distributions, with few labeled data available. Moreover, the reliability of the model is strongly required as trusting wrong predictions can lead to dramatic consequences. This thesis tackles the challenge of providing a reliable machine learning model under the main engineering design constraints: domain shift and costly labeling. By leveraging novel contributions from domain adaptation, active learning and uncertainty quantification techniques, we propose a generic approach towards this goal. Moreover, the contributions of this thesis to the three aforementioned thematics are impactful beyond the context of engineering design. They allow for achieving similar or better performances with less data and reduced computation time compared to standard approaches. Additionally, the thesis delivers accessible and user-friendly tools through a domain adaptation and transfer learning library called Adapt.

Direction

Jury

  • Amaury HABRARD, Professeur, Université Jean Monnet de Saint-Etienne, Rapporteur & Examinateur
  • Jean-Michel LOUBES, Professeur, Université de Toulouse, Rapporteur & Examinateur
  • Josselin GARNIER, Professeur, Ecole Polytechnique, Examinateur
  • Céline HUDELOT, Professeure, Ecole CentraleSupelec, Examinatrice
  • Alexandre GRAMFORT, Senior Research Scientist, Meta, Examinateur
  • Benjamin GUEDJ, Associate Professor, University College London, Examinateur