From

Horaires à

Lieu Université Paris Cité

Thèses et HDR

Mira AIT SAADA : soutenance de thèse

Titre : Apprentissage non-supervisé sur des données textuelles à partir de représentations neuronales de texte
Direction : Mohamed Nadif
Soutenance : 18/04/2023

Ajouter au calendrier

Mira AIT SAADA

Apprentissage non-supervisé sur des données textuelles à partir de représentations neuronales de texte

Résumé

Les techniques de plongement de mots sont des techniques qui ont pour but de calculer une représentation vectorielle d’un mot, en capturant son sens sémantique. Ces représentations sont destinées à alimenter toutes sortes d’algorithmes d’apprentissage automatique. Toutefois, force est de constater que les techniques de plongement, notamment les modèles Transformeur, n’ont été que très peu exploités dans le monde non-supervisé.
Dans cette thèse, nous nous intéressons exclusivement à des tâches d’apprentissage non-supervisé comme l’apprentissage automatique et la détection d’anomalies. Dans un premier temps, nous tentons de décortiquer ces modèles multi-couches en gardant en tête le contexte non-supervisé. Dans un second temps, nous proposons plusieurs méthodologies permettant d’exploiter au mieux les modèles Transformeur, obtenant des résultats satisfaisant sur des jeux de données réels.

Mots clés

Apprentissage non-supervisé, Plongements de mots, Modèles Transformeur, Classification automatique, Détection d’anomalies

Direction

Jury

  • M. Quafafou Mohamed, Professeur des universités, Laboratoire d'Informatique et systèmes, Univ. d'Aix-Marseilles
  • M. Lamirel Jean-charles, Maître de Conférences, Laboratoire Lorrain de Recherche en Informatique et ses Applications
  • Mme. Rosset Sophie, Directrice de recherche, Laboratoire Interdisciplinaire des Sciences du Numérique
  • Mme. Cariou Véronique, Professeure des université, Statistique, Sensométrie et Chimiométrie, ONIRIS
  • M. Fall Abdou aziz, Industriel, Caisse des depôts et consignations