Machine Learning

Approche ensemble pour le co-clustering par blocs sur des données textuelles: Application au biomédical

Publié le - Extraction et gestion des connaissances (EGC'2021),

Auteurs : Séverine Affeldt, Lazhar Labiod, Mohamed Nadif

Nous proposons un co-clustering par blocs via une approche ensemble qui fusionne plusieurs co-clusterings élémentaires en une matrice d'affinité consensus structurée. Les co-clusterings de base sont issus des mêmes données textuelles et générés par la même méthode de co-clustering. Ce processus de fusion renforce la qualité individuelle des co-clusterings par blocs au sein d'une seule matrice consensus. Notre approche permet un co-clustering complètement non supervisé, où le nombre de co-clusters est automatiquement déduit d'un critère de modularité non trivial généralisé. La fonction objective associée permet l'apprentissage conjoint de l'agrégation des co-clusterings élémentaires et du coclustering consensus. Les résultats expérimentaux sur plusieurs jeux de données réelles démontrent l'intérêt de notre approche comparée à des méthodes compétitives de co-clustering (Affeldt et al., 2020).