Logiciels et Github

Le centre Borelli et ses chercheurs développent et mettent à disposition de la communauté scientifique des outils et des solutions logicielles.

Github

Software

Librairies et Packages

La librairie Ke0ps  développée pendant  la thèse  de  Jean Feydy permet le calcul de produits  matrices vecteurs  pour des matrices denses dont les coefficients sont recalculés à la volée sur GPU (et non stockés en mémoire) à partir de leurs formules encodées de façon transparente pour l’utilisateur et autorisant l'usage de la différentiation automatique.

Ke0ps constitue un environnement de développement très adapté pour les méthodes particulaires en particulier pour approches hamiltoniennes de transport dans les espaces de formes avec un impact massif en termes de vitesse d'exécution et de facilité de développement.

La librairie GeomLoss  s'appuie sur Ke0ps et permet de calculer sur GPU

  • des normes de noyau (Maximum Mean Discrepancies)
  • des divergences de Hausdorff analogues aux log-vraisemblances des modèles de mélange gaussien.
  • des divergences de Sinkhorn débiaisées, qui sont des approximations positives et définies des distances de transport optimal.

L'algorithme BCOT concerne le biclustering basé sur le transport optimal.

Article de référence : C. Fettal, L. Labiod, M. Nadif. Efficient and effective optimal transport-based biclustering. NeurIPS, 32989-33000, 2022

L'algorithme SC3 est dédié au “subspace convolutional co-clustering".

Article de référence : Boosting subspace co-clustering via bilateral graph convolution. IEEE Transactions on Knowledge and Data Engineering, 36(3): 960-971, 2024

L'algorithme SAGSC est dédié au “subspace clustering”.

Article de référence : C. Fettal, L. Labiod, M. Nadif. Scalable attributed-graph subspace clustering. AAAI, 7559-7567, 2023.

L'algorithme LMGEC est dédié au Multi-vues des graphes attribués.

Article de référence : C. Fettal, L. Labiod, M. Nadif. Simultaneous linear multi-view attributed graph representation learning and clustering. WSDM, 303-311, 2023.

 

Le package Caeclust implémente une méthode s’appuyant sur un algorithme de clustering de type deep spectral. 

Ce travail a donné lieu à une publication. S. Affeldt, L. Labiod, M. Nadif. CAEclust: A consensus of autoencoders representations for clustering. IPOL. 590-603, 2022. Ce travail est issu d’un travail des mêmes auteurs dans Pattern Recognition journal (2020).

L'algorithme GCC est dédié au “graph convolutional clustering”.

Article de référence : C. Fettal, L. Labiod, M. Nadif. Efficient Graph Convolution for Joint Node Representation Learning and Clustering. WSDM, 289-297, 2022.

Le package python TensorClus est dédié au clustering et co-clustering de données tensorielles.

Article de référence : R. Boutalbi, L. Labiod, M. Nadif. TensorClus: A Python library for tensor (co)-clustering. Neurocomputing, 464- 468, 2022.

WordGraph est un package python permettant de reconstruire des modèles graphiques causaux interactifs à partir de données textuelles. Il a été publié à WSDM 2024 et a reçu le prix du meilleur papier “software” présenté à EGC 2024

CORPEX est une interface d'aide à l'analyse de corpus via la visualisation interactive de co-clusters pour soutenir l'exploration de thèmes pour un ensemble de textes. 

Cette interface a été publiée dans EGC 2023 par A. Ferdjaoui, Amira Tlati, S. Affeldt, M. Nadif; CORPEX : Analyse exploratoire d'un corpus biomédical à l'aide de la classification croisée.

 

Le package  dcblockmodels  implémente des algorithmes de co-clustering pour les données de comptage basés sur le modèle de blocs latents (LBM). Il propose deux modèles principaux : un LBM dynamique (dLBM) pour les données représentées sous forme de séries de matrices d'adjacence, et un LBM semi-supervisé (ou contraint) (HLBM) utilisant des contraintes par paires dans les espaces des lignes et des colonnes.

Pour plus de détails : 

Le package ELBMcoclust implémente plusieurs algorithmes de co-clustering. 

Article de référence :  S. Hoseinipour, M. Aminghafari, A. Mohammadpour and M. Nadif “A Sparse  Exponential Family Latent Block Model for Co-clustering”. Advances in Data Analysis and Classification, 1-37.