Tina NIKOUKHAH
La vie secrète des images JPEG : détection de falsification via les traces de compression
Résumé
Avec l'avènement de la photographie numérique et les progrès des outils de retouche photo, modifier une image est devenu facile et accessible à tous. La plupart de ces modifications visent à améliorer l'image, mais certaines ont pour but d'en altérer le sens. De telles contrefaçons peuvent facilement être rendues visuellement réalistes. Heureusement, ils déforment également la structure même de l'image, telle qu'elle se forme au cours de sa chaîne de traitement. En effet, la formation d'une image numérique, des capteurs de la caméra au stockage au format JPEG, laisse des traces caractéristiques, qui agissent comme une signature de l'image. La dissimulation, la modification ou l'ajout d'un objet étranger dans l'image dénaturent ces signatures et créent des incohérences détectables.
Cette thèse étudie la compression JPEG et la signature digitale (sous forme de motifs de blocs de 8x8 pixels) qu'elle laisse sur l'image. Ces motifs sont ensuite exploités pour proposer plusieurs algorithmes de détection de falsification. Ces méthodes sont basées sur la théorie statistique a contrario, conduisant à des algorithmes de décision automatique, ne nécessitant pas d'interprétation visuelle. Parmi les méthodes proposées figure ZERO, un nouvel algorithme de détection de falsification d'images qui analyse les artefacts JPEG et détecte les retouches lorsqu'une anomalie locale est jugée statistiquement significative. Cette méthode constitue l'état de l'art en matière de détection de falsification par les traces JPEG et peut être utilisée par le grand public grâce à un outil développé par l'Agence France-Presse.
La thèse explore également l'évaluation des méthodes de détection de falsification en général. Une nouvelle méthodologie non sémantique est proposée, ainsi que les jeux de données associés. Ils permettent de caractériser la sensibilité des outils forensiques par rapport à des opérations d'images spécifiques et d'éviter les difficultés des évaluations sémantiques.