Signaux et séries temporelles, apprentissage et représentations
Présentation de la thématique
Dans de nombreux contextes applicatifs (santé, industrie, biologie...), les données collectées prennent la forme de séries temporelles. L'enjeu fondamental consiste alors à choisir une représentation adaptée, permettant de prendre en compte au mieux l'information temporelle.
L’équipe SSTAR (Signaux et séries temporelles, apprentissage et représentations) travaille sur différentes tâches liées à l’apprentissage pour les signaux et les séries temporelles.
Le premier axe est lié à la détection d’événements dans les séries temporelles tels que des changements brutaux (détection de ruptures), des formes répétitives (détection de motifs) et des événements anormaux (détection d’anomalies) grâce par exemple à des méthodes statistiques ou inspirées de la géométrie. Cet axe trouve des applications en médecine pour le suivi longitudinal et la comparaison interindividuelle de patients atteints de maladies neurodégénératives, en biologie pour l’étude du comportement de rongeurs ou en industrie pour des tâches de maintenance prédictive.
Le deuxième axe est lié à l’apprentissage de représentation pour les signaux, avec des approches d’apprentissage de dictionnaire, d’apprentissage profond ou de symbolisation permettant, de façon non supervisée, de définir des espaces mathématiques adaptés aux données temporelles. Ces techniques ont été utilisées pour l’étude de la marche, de la respiration ou en neurosciences pour l’étude des spikes.
Le troisième axe porte sur la modélisation de séries temporelles grâce à des approches de signaux sur graphes, qui permettent d’utiliser la structure inhérente des données pour améliorer leur traitement. Ces techniques sont par exemple utilisées pour traiter des données temporelles issues de réseaux de capteurs (capture de mouvement 3D, signaux intracardiaques).
Deux idées infusent également largement dans ces travaux : l’importance de la reproductibilité (par la diffusion de code source et d’applications WEB, le développement de revues scientifiques reproductibles ou la publication de bibliothèques logicielles) et l'interdisciplinarité (grâce à des collaborations avec des médecins, biologistes, opérateurs industriels et chercheurs en neurosciences).
Mots clés
Traitement du signal ; Apprentissage pour les séries temporelles, ; Détection de ruptures ; Détection de motifs ; Détection d’anomalies ; Apprentissage de dictionnaire ; Signaux sur graphes
Thèmes abordés
- Détection d'événements dans les séries temporelles (ruptures, motifs, anomalies)
- Apprentissage de dictionnaire et de représentation
- Traitement des signaux sur graphe
Faits marquants sur 2018-2024
- Librairie Python ruptures implémentant et unifiant de nombreux algorithmes de l’état de l’art et du Centre Borelli pour la détection de ruptures dans les séries temporelles. Lancée en 2019, elle totalise en 2024 plus de 19 Millions de téléchargements et rayonne dans de nombreux domaines (industrie, publicité, médecine, biologie…)
- Travaux théoriques et méthodologiques sur les signaux sur graphes : démonstration d’un principe d’incertitude et méthode d’apprentissage de graphes à partir de données temporelles.
- Méthodes de construction de résumés automatiques structurés pour des flux de données temporelles multivariées avec applications en vidéo, en biologie, et en neuroscience
Applications
- Signaux issus de protocoles de recherche biomédicale : accéléromètrie, ECG, EEG, trajectoires 2D et 3D, vidéo, son…
- Séries temporelles industrielles (monitoring) et maintenance prédictive
- Données issues de réseaux de capteurs
- Étude de la marche, de l’anesthésie, de l’activité respiratoire et cardiaque, de la posture, du mouvement des yeux, du mouvement des membres inférieurs et supérieurs…
Collaborations
- Duke University, Université d’Evry, LSE, Université de Sherbrooke, Michelin, ENGIE, SNCF, Sysnav, RTE, Hôpitaux Percy, Fernand Widal, Bégin, Necker, Cochin