Jean VASSOYAN : soutenance de thèse

Titre : Le paradigme enseignant-apprenant en apprentissage automatique : application à l'apprentissage humain et aux grands modèles de langue
Direction : N. Vayatis, Jill-Jenn VIE
Soutenance le 16/04/26 à 15h00 au Campus Saint-Germain, Amphithéâtre Lavoisier A

Ajouter au calendrier

Jean VASSOYAN

Le paradigme enseignant-apprenant en apprentissage automatique : application à l'apprentissage humain et aux grands modèles de langue

Résumé de la thèse

En apprentissage automatique classique, les données d’entrainement sont généralement considérées comme issues d’un tirage aléatoire sur lequel l'expérimentateur n’a aucun contrôle. Néanmoins, certains paradigmes comme l'apprentissage actif traitent précisément des situations où l’on peut agir sur la sélection des données afin d’optimiser l’entrainement du modèle. De manière plus large, le problème de sélection des données peut être modélisé par le paradigme "enseignant-apprenant", où l'enseignant est le mécanisme de sélection des données et l'apprenant est l'agent à entrainer. Cette thèse s'intéresse à la tâche de "l'enseignant", vue comme un problème d'optimisation. Nous étudions deux cas particuliers distincts : celui où l'apprenant est un humain et celui où c'est un modèle d'apprentissage statistique "boîte noire".

Le premier axe, celui de l'apprenant humain, correspond au domaine de l'apprentissage adaptatif, particulièrement actif en technologies de l’éducation. Nous proposons un nouveau moteur de recommandation de ressources pédagogiques qui, contrairement aux approches classiques de la littérature est économe en données, passe à l'échelle, ne dépend pas d'un modèle a priori de l'apprentissage humain et est entraîné de bout en bout sur l'optimisation du "progrès" de l'apprenant. Il s'appuie pour cela sur une modélisation par mots-clés des connaissances de l’apprenant.

Le second axe, celui de l'apprenant "machine", correspond à une famille de domaines de l'apprentissage statistique, parmi lesquels l’apprentissage actif, par curriculum ou encore par renforcement. Nous introduisons un cadre formel unificateur permettant de rapprocher et comparer l'ensemble de ces domaines. Nous étudions enfin l’application de ce paradigme aux grands modèles de langue, nouveaux candidats naturels à ce type d'approche. En effet, alors que les données textuelles humaines de haute qualité s'épuisent, l'apprentissage par imitation commence à montrer ses limites. Cela suggère que pour continuer à faire évoluer ces modèles, il est nécessaire de se tourner vers des paradigmes non contraints par les données humaines, basés sur une dynamique "d'auto-enseignement" ouverte.

Mots clés

Apprentissage automatique, Apprentissage par renforcement, Apprentissage adaptatif, Enseignant-apprenant, Grand modèle de langue, Réseaux de neurones sur graphes,

Direction de thèse

Nicolas VAYATIS, Professeur, Centre Borelli, ENS Paris-Saclay (Directeur)
Jill-Jênn VIE

Composition du jury

Pierre-Yves OUDEYER, Directeur de recherche, Centre Inria de l'université de Bordeaux, Rapporteur
Min CHI, Full professor, North Carolina State University, Rapporteur
Olivier SIGAUD, Professeur des universités, Sorbonne Université, Examinateur
Claire VERNADE, Full professor, University of Technology Nuremberg, Examinateur
Guillaume CHARPIAT, Chargé de recherche, Centre Inria de l'Université Paris-Saclay, Examinateur