Mira AIT SAADA
Apprentissage non-supervisé sur des données textuelles à partir de représentations neuronales de texte
Résumé
Les techniques de plongement de mots sont des techniques qui ont pour but de calculer une représentation vectorielle d’un mot, en capturant son sens sémantique. Ces représentations sont destinées à alimenter toutes sortes d’algorithmes d’apprentissage automatique. Toutefois, force est de constater que les techniques de plongement, notamment les modèles Transformeur, n’ont été que très peu exploités dans le monde non-supervisé.
Dans cette thèse, nous nous intéressons exclusivement à des tâches d’apprentissage non-supervisé comme l’apprentissage automatique et la détection d’anomalies. Dans un premier temps, nous tentons de décortiquer ces modèles multi-couches en gardant en tête le contexte non-supervisé. Dans un second temps, nous proposons plusieurs méthodologies permettant d’exploiter au mieux les modèles Transformeur, obtenant des résultats satisfaisant sur des jeux de données réels.
Mots clés
Apprentissage non-supervisé, Plongements de mots, Modèles Transformeur, Classification automatique, Détection d’anomalies
Direction
Jury
- M. Quafafou Mohamed, Professeur des universités, Laboratoire d'Informatique et systèmes, Univ. d'Aix-Marseilles
- M. Lamirel Jean-charles, Maître de Conférences, Laboratoire Lorrain de Recherche en Informatique et ses Applications
- Mme. Rosset Sophie, Directrice de recherche, Laboratoire Interdisciplinaire des Sciences du Numérique
- Mme. Cariou Véronique, Professeure des université, Statistique, Sensométrie et Chimiométrie, ONIRIS
- M. Fall Abdou aziz, Industriel, Caisse des depôts et consignations