[Soutenance de thèse] 02/09/2025 – Lucas Potin : « Analyse de graphes complexes pour détecter la corruption dans les marchés publics » (UPR LIA)

Monsieur Lucas POTIN soutiendra publiquement ses travaux de thèse intitulés : « Analyse de graphes complexes pour détecter la corruption dans les marchés publics », dirigés par Monsieur Vincent LABATUT, Madame Christine LARGERON LETENO et Madame Rosa FIGUEIREDO, le mardi 2 septembre 2025.

Date et lieu

Mardi 2 septembre 2025
Avignon Université – Campus Hannah Arendt 74 Rue Louis Pasteur, 84029 Avignon
Salle des thèses

Discipline

Informatique

Laboratoire

Composition du jury de soutenance

M. Vincent LABATUT LIA, Avignon Université Directeur de thèse
Mme Rosa FIGUEIREDO LIA, Avignon Université Co-directrice de thèse
Mme Christine LARGERON Laboratoire Hubert Curien, Université Jean Monnet Co-directrice de thèse
Mme Peggy CELLIER IRISA, INSA Rennes Rapporteure
M. Bruno CREMILLEUX GREYC UMR 6072, Université de Caen Normandie Rapporteur
Mme Céline ROBARDET LIRIS UMR 5205, INSA Lyon Examinatrice
M. Pierre-Henri MORAND ·JPEG, Avignon Université / Agence française anticorruption Invité

Résumé

Les marchés publics jouent un rôle essentiel dans le fonctionnement des institutions, représentant environ 15 % du PIB mondial. En théorie, les procédures sont conçues pour garantir transparence, concurrence et efficacité. En pratique, elles sont souvent complexes, peu lisibles, et exposées à des risques comme la collusion, le favoritisme ou la corruption. Dans ce contexte, l’exploitation des grands volumes de données disponibles permet d’envisager de nouvelles manières de détecter les fraudes, en complément des méthodes classiques, notamment économétriques. Dans cette perspective, le projet DeCoMaP (Détection de la Corruption dans les Marchés Publics), financé par l’Agence nationale de la recherche avait pour but de concevoir des outils de détection combinant expertise juridique, économique et informatique, à partir de données issues des marchés publics français. Menée dans le cadre du projet DeCoMaP, cette thèse cible deux verrous méthodologiques importants : la faible fiabilité des bases de données existantes, et le manque de prise en compte des relations entre les acteurs économiques. Pour y répondre, nous adoptons une modélisation en graphes, afin de mieux représenter les interactions entre acheteurs et fournisseurs dans les marchés publics. Nous commençons par construire deux bases de données originales, FOPPA et BeauAMP, en nous appuyant sur les publications officielles relatives aux marchés publics français, diffusées à l’échelle nationale et européenne. Ce travail repose sur un traitement approfondi des données, comprenant notamment la désambiguïsation des entités. Les bases ainsi obtenues permettent des analyses relationnelles fiables à grande échelle, tout en surpassant les sources existantes en qualité et en facilité d’exploitation. Elles constituent une base solide pour l’étude des marchés publics en France, et peuvent bénéficier aussi bien aux chercheurs qu’aux décideurs publics.

À partir de ces graphes, nous cherchons à distinguer les réseaux de marchés habituels de ceux qui présentent des configurations atypiques, voire suspectes. Pour cela, nous extrayons des motifs discriminants : des sous-graphes apparaissant préférentiellement dans une classe plutôt que dans l’autre. L’un des défis majeurs réside dans la sélection des motifs les plus pertinents pour cette tâche. Pour cela, nous conduisons une étude systématique de 38 mesures de qualité issues de la littérature, en comparant leur comportement et leur performance. Nos résultats montrent que certaines mesures sont instables, tandis que d’autres, simples mais robustes, offrent de bonnes performances. Nous introduisons également un clustering des motifs pour limiter la redondance et structurer plus efficacement l’espace des patterns. L’ensemble de ces résultats constitue un benchmark utile pour guider le choix de mesures de qualité dans de futurs travaux. En nous appuyant sur les résultats précédents, nous concevons le framework PANG (Pattern-based Anomaly detection in Graphs), qui regroupe toutes les étapes du processus : extraction, sélection et représentation des motifs, puis classification des graphes. Nous l’évaluons à la fois sur des jeux de données publics standards en classification de graphes, ainsi que sur la base FOPPA. Les résultats montrent que PANG atteint des performances comparables, voire meilleures, que celles des méthodes existantes. Grâce à des motifs faciles à interpréter, il permet de donner du sens aux configurations détectées, et d’en proposer une lecture à la fois économique et institutionnelle. Ce travail contribue à une meilleure détection des irrégularités, avec l’objectif de renforcer la transparence et l’intégrité des procédures d’attribution dans les marchés publics.

Mots-clés : Théorie des graphes, Apprentissage automatique, Marchés publics

Mots clés associés
soutenance de thèse