Computer Science

Clustering de documents avec des plongements LLMs : évaluation de la réduction de dimension

Publié le - Les 29èmes Rencontres de la Société Francophone de Classification (SFC)

Auteurs : Imed Keraghel, Stanislas Morbieu, Mohamed Nadif

Le clustering de documents est crucial pour la gestion et l'analyse d'importants volumes de données textuelles. Les progrès récents dans les grands modèles de langage (LLMs), comme GPT, ont transformé la manière dont les textes peuvent être analysés et interprétés par les machines. Cette étude vise à examiner les effets de différentes techniques de réduction de dimension sur les performances du clustering de documents en utilisant des plongements provenant des LLMs.