Anne ZHAO
Méthodes de Machine Learning appliquées à la détection de manipulation de marchés financiers
Résumé de la thèse
Cette thèse porte sur l’application de l’apprentissage automatique à la détection des manipulations de marché, en collaboration avec l’Autorité des Marchés Financiers (AMF). Elle aborde plusieurs défis majeurs : données financières haute fréquence, rareté des cas annotés, complexité des comportements et contraintes propres aux environnements industriels. L’approche proposée associe une revue des travaux existants à la conception d’un système modulaire fondé sur l’ensemble learning. Les expérimentations menées sur des cas de layering issus des enquêtes de l’AMF montrent que les modèles entraînés sur des dossiers spécifiques surpassent les algorithmes déterministes actuellement utilisés. Toutefois, la mise en place d’un système global de surveillance suppose encore des avancées en matière de combinaison de règles de détection, de protocoles d’évaluation et d’intégration opérationnelle.
Direction de thèse
- Nicolas VAYATIS, Professeur, Centre Borelli, ENS Paris-Saclay (Directeur)
- Theodoros EVGENIOU, Professeur, Institut européen d'administration des affaires (INSEAD) (Codirecteur)
- Iris LUCAS, Ph.D., Autorité des Marchés Financiers (Tutrice en entreprise)
Composition du jury
- Gianluca BONTEMPI, Professeur, Université Libre de Bruxelles (Rapporteur & Examinateur)
- Christophe HURLIN, Professeur, Université d'Orléans (Rapporteur & Examinateur)
- Charles-Albert LEHALLE, Professeur, École Polytechnique (Examinateur)
- Mathilde MOUGEOT, Professeure, Université Paris-Saclay, École Normale Supérieure Paris-Saclay (Examinatrice)
- Denisa RADU-BANULESCU, Maîtresse de conférences, Université d'Orléans (Examinateur)
Machine Learning Approaches for Market Manipulation Detection in Surveillance Systems
Abstract
This thesis explores the use of machine learning for detecting market manipulation, in collaboration with the French financial regulator (Autorité des Marchés Financiers). Detecting manipulation poses unique challenges, including noisy high-frequency data, scarce labeled cases, evolving behaviors, and industrial constraints. Our approach combines a review of definitions and detection methods and the design of a modular ensemble-based system for market surveillance. From an application standpoint, we exploited historical order data and manipulation cases documented by the regulator, focusing on the Layering pattern. Experiments highlight both the potential and the limitations of ML in this setting: case-specific models outperform existing rule-based algorithms, but scaling to a global surveillance system requires advances in rule aggregation, evaluation protocols, and system integration.
PhD supervisors
- Nicolas VAYATIS, Professor, Centre Borelli, ENS Paris-Saclay (Supervisor)
- Theodoros EVGENIOU, Professor, Institut européen d'administration des affaires (INSEAD) (Co-supervisor)
- Iris LUCAS, Ph.D., Autorité des Marchés Financiers (Industrial Mentor)
Defense committee
- Gianluca BONTEMPI, Professor, Université Libre de Bruxelles (Reviewer & Examiner)
- Christophe HURLIN, Professor, Université d'Orléans (Reviewer & Examiner)
- Charles-Albert LEHALLE, Professor, Ecole Polytechnique (Examiner)
- Mathilde MOUGEOT, Professor, Université Paris-Saclay, École Normale Supérieure Paris-Saclay (Examiner)
- Denisa RADU-BANULESCU, Associate Professor, Université d'Orléans (Examiner)