Machine Learning
Méthode ensemble de clustering profond
Publié le - Extraction et gestion des connaissances (EGC'2021),
Plusieurs stratégies de classification non supervisée combinant des algorithmes de clustering classiques et les auto-encodeurs ont été étudiées. Ces stratégies améliorent généralement les performances de clustering, mais dépendent des données et des hyperparamètres choisis qu'on ne peut fixer en amont pour un apprentissage non supervisé. Pour atténuer l'impact de la configuration des hyperparamètres sur la qualité du partitionnement, nous proposons une approche ensemble, ne nécessitant aucun pré-entraînement, qui exploite le clustering spectral et les forces de l'auto-encodeur. Notre approche génère plusieurs encodages profonds à partir des données d'origine, construit une matrice d'affinité consensus clairsemée et de faible dimension via la stratégie des anchors puis applique la classification spectrale pour obtenir l'espace commun partagé par les encodages. La stratégie des anchors assure une représentation efficace des encodages et leur fusion permet d'atténuer les problèmes d'hyperparamètres (Affeldt et al., 2020).