[Soutenance de thèse] 20/12/2024 – Omar BOUFOUS : « Équilibres Corrélés et Apprentissage » (UPR LIA)
Omar Boufous soutiendra sa thèse le 20 décembre 2024 sur le thème : « Équilibres Corrélés et Apprentissage ».
Date et lieu
Soutenance prévue le vendredi 20 décembre 2024 à 14h00
Lieu : Orange Gardens, 46 Av. de la République, 92320 Châtillon
Salle : Orange Gardens
Discipline
Informatique
Laboratoire
UPR 4128 LIA – Laboratoire Informatique d’Avignon
Composition du jury de soutenance
M. RACHID ELAZOUZI | Avignon Université | Directeur de thèse |
M. Balakrishna PRABHU | LAAS, CNRS, Toulouse | Examinateur |
M. Maël LE TREUST | CNRS, UMR IRISA, Rennes | Examinateur |
M. Eitan ALTMAN | INRIA, Sophia Antipolis | Co-directeur de thèse |
M. Mikaël TOUATI | Orange | Co-encadrant de thèse |
M. Mustapha BOUHTOU | Orange | Co-encadrant de thèse |
M. Essaid SABIR | Université du Québec | Rapporteur |
Mme Johanne COHEN | LISN, CNRS | Rapporteure |
Résumé
Dans cette thèse, nous étudions le problème de l’apprentissage des équilibres correlés et introduisons un nouveau concept de solution qui tient compte des contraintes limitant les strategies corrélées et étendant le cadre existant des équilibres correlés dans les jeux non coopératifs finis. Dans la premiere partie, nous présentons les définitions de l’équilibre corrélé ainsi que ses principales proprietés, tout en introduisant des concepts essentiels tels que le regret, qui seront utilisés dans les chapitres suivants du manuscrit. Dans la deuxieme partie, nous proposons un algorithme qui combine la minimisation du regret et un dispositif de recommandation d’action pour stabiliser la dynamique de minimisation du regret. Nous montrons que le processus d’apprentissage peut être modelisé comme une chaîne de Markov non-homogene définie sur un espace d’états denombrable. Une étude numérique montre que tous les joueurs jouent à long terme une distribution de probabilité d’équilibre corrélé approximative avec une probabilité élevée. Nous montrons que cette convergence est également observée dans des contextes dynamiques tels que dans des jeux avec un nombre variable de joueurs. Dans la troisième partie, nous définissons des équilibres corélées contraints à travers les équilibres de Nash généralisés d’un jeu étendu avec un dispositif de corrélation. Nous proposons plusieurs caractérisations des stratégies d’équilibre. De plus, nous considérons un cas particulier de contraintes définies sur l’ensemble des distributions de probabilites induites par des stratégies corrélées et montrons que les dispositifs de correlation canoniques suffisent à caractériser l’ensemble des distributions d’equilibre corrélées contraintes. Nous montrons que cet ensemble peut ne pas être convexe et montrons une condition suffisante d’existence. Dans le cas de contraintes lineaires, nous montrons également que le probleme du calcul d’une distribution de probabilité d’équilibre correlée contrainte peut être formulée comme un programme linéaire mixte en nombres entiers.
Mots-clés : Théorie des jeux, Équilibre corrélé, Apprentissage
Mis à jour le 12 décembre 2024