Aitor Artola
Une méthode générique pour la détection d'anomalie sur pièce manufacturées
Résumé
Cette thèse se penche sur les méthodes par apprentissage pour le contrôle optique de la qualité dans l'industrie. L'objectif est de fournir des solutions automatiques et robustes qui ne nécessitent pas l'intervention d'un expert en vision par ordinateur pour s'adapter à un nouvel objet.
Dans la première partie, nous proposons d'ajouter une première étape de normalisation d'image à la chaîne de détection d'anomalies, ce qui facilite les étapes d'apprentissage subséquentes. Nous étudions les méthodes de recalage d'images et développons une alternative pour recaler des objets répétitifs, qui soit aussi robuste aux symétries et aux motifs redondants. Nous proposons également une méthode d'apprentissage non supervisée de normalisation d'image par réseau neuronal afin de réduire l'impact de la variabilité normale sur les fausses détections.
La deuxième partie traite des modèles stochastiques de fond utilisés pour apprendre la structure des images d'objets conformes et pour mesurer les déviations de la normalité. Nous passons d'abord en revue ces méthodes et montrons que des modèles simples peuvent atteindre des performances de pointe en utilisant des réseaux de neurones pré-entraînés pour produire une représentation (embedding) des images. Nous proposons ensuite GLAD, un détecteur d'anomalies basé sur un modèle de mélange de gaussiennes qui utilise un apprentissage global-local pour être économe en données. Puis, nous démontrons que les détecteurs d'anomalies récents ne sont pas adaptés aux cas réels en raison de biais introduits par les bases de données utilisées pour la comparaison. En particulier, nous soulignons la fragilité de ces modèles en cas de variations modérées de la capture des objets observés. Nous proposons une version en ligne de GLAD qui est capable de s'adapter à l'évolution des produits sans avoir à réapprendre de zéro. Dans le dernier chapitre de cette partie, nous montrons que GLAD est un détecteur d'anomalies généraliste, applicable à la détection de changements dans la vidéo. Dans la troisième partie de la thèse, nous discutons de la représentation des données. La plupart des solutions, y compris la nôtre, utilisent la classification sémantique comme tâche prétexte pour apprendre la représentation (embedding) d'une image. Nous montrons que de tels réseaux pré-entrainés (backbones) ne sont pas adaptés à la détection de petites anomalies. Nous développons deux alternatives pour résoudre ce problème dans les deux derniers chapitres. Tout d'abord, nous explorons l'utilisation de backbones conçues pour la segmentation sémantique ainsi que d'autres stratégies multi-échelles pour la détection d'anomalies. Ensuite, dans le dernier chapitre, nous étudions la manière d'affiner la représentation des images normales en utilisant l'apprentissage auto-supervisé et contrastif afin d'améliorer le traitement de leur variabilité.
Jury
- Charles Kervrann, directeur de recherche, INRIA de l’Université de Rennes, France
- Danijel Skocaj, professor at the University of Ljubljana, Slovenia
- Dorit Merhof, Professor, University of Regensburg, Germany
- Angélique Loesch, ingénieur de Recherche, CEA Saclay - Nano Innov, France
- Pablo Musé, Professor , Universidad de la Republica, Uruguay