[Soutenance de thèse] 20/12/2024 – Omar BOUFOUS : « Équilibres Corrélés et Apprentissage » (UPR LIA)

Actualité recherche 12 décembre 2024

Omar Boufous soutiendra sa thèse le 20 décembre 2024 sur le thème : « Équilibres Corrélés et Apprentissage ».

Date et lieu

Soutenance prévue le vendredi 20 décembre 2024 à 14h00
Lieu : Orange Gardens, 46 Av. de la République, 92320 Châtillon
Salle : Orange Gardens

Discipline

Informatique

Laboratoire

UPR 4128 LIA – Laboratoire Informatique d’Avignon

Composition du jury de soutenance

M. RACHID ELAZOUZI	Avignon Université	Directeur de thèse
M. Balakrishna PRABHU	LAAS, CNRS, Toulouse	Examinateur
M. Maël LE TREUST	CNRS, UMR IRISA, Rennes	Examinateur
M. Eitan ALTMAN	INRIA, Sophia Antipolis	Co-directeur de thèse
M. Mikaël TOUATI	Orange	Co-encadrant de thèse
M. Mustapha BOUHTOU	Orange	Co-encadrant de thèse
M. Essaid SABIR	Université du Québec	Rapporteur
Mme Johanne COHEN	LISN, CNRS	Rapporteure

Résumé

Dans cette thèse, nous étudions le problème de l’apprentissage des équilibres correlés et introduisons un nouveau concept de solution qui tient compte des contraintes limitant les strategies corrélées et étendant le cadre existant des équilibres correlés dans les jeux non coopératifs finis. Dans la premiere partie, nous présentons les définitions de l’équilibre corrélé ainsi que ses principales proprietés, tout en introduisant des concepts essentiels tels que le regret, qui seront utilisés dans les chapitres suivants du manuscrit. Dans la deuxieme partie, nous proposons un algorithme qui combine la minimisation du regret et un dispositif de recommandation d’action pour stabiliser la dynamique de minimisation du regret. Nous montrons que le processus d’apprentissage peut être modelisé comme une chaîne de Markov non-homogene définie sur un espace d’états denombrable. Une étude numérique montre que tous les joueurs jouent à long terme une distribution de probabilité d’équilibre corrélé approximative avec une probabilité élevée. Nous montrons que cette convergence est également observée dans des contextes dynamiques tels que dans des jeux avec un nombre variable de joueurs. Dans la troisième partie, nous définissons des équilibres corélées contraints à travers les équilibres de Nash généralisés d’un jeu étendu avec un dispositif de corrélation. Nous proposons plusieurs caractérisations des stratégies d’équilibre. De plus, nous considérons un cas particulier de contraintes définies sur l’ensemble des distributions de probabilites induites par des stratégies corrélées et montrons que les dispositifs de correlation canoniques suffisent à caractériser l’ensemble des distributions d’equilibre corrélées contraintes. Nous montrons que cet ensemble peut ne pas être convexe et montrons une condition suffisante d’existence. Dans le cas de contraintes lineaires, nous montrons également que le probleme du calcul d’une distribution de probabilité d’équilibre correlée contrainte peut être formulée comme un programme linéaire mixte en nombres entiers.

Mots-clés : Théorie des jeux, Équilibre corrélé, Apprentissage

Mis à jour le 12 décembre 2024