Stratégies avancées de théorie des jeux pour la prise de décision

Le scrutin de Condorcet randomisé (mon préféré !!) | Démocratie 5 (Décembre 2024)

Le scrutin de Condorcet randomisé (mon préféré !!) | Démocratie 5 (Décembre 2024)
Stratégies avancées de théorie des jeux pour la prise de décision

Table des matières:

Anonim

La théorie des jeux, l'étude de la prise de décision stratégique, regroupe des disciplines disparates telles que les mathématiques, la psychologie et la philosophie. La théorie des jeux a été inventée par John von Neumann et Oskar Morgenstern en 1944 et a parcouru un long chemin depuis lors. L'importance de la théorie des jeux pour l'analyse moderne et la prise de décision peut être mesurée par le fait que, depuis 1970, pas moins de 12 éminents économistes et scientifiques ont reçu le prix Nobel de sciences économiques pour leurs contributions à la théorie des jeux.

La théorie des jeux est appliquée dans un certain nombre de domaines, notamment les affaires, la finance, l'économie, les sciences politiques et la psychologie. Comprendre les stratégies de théorie des jeux - à la fois les stratégies populaires et certains des stratagèmes relativement moins connus - est important pour améliorer ses capacités de raisonnement et de prise de décision dans un monde complexe.

Dilemme du prisonnier - En résumé

Le dilemme du prisonnier est l'une des stratégies de jeu les plus populaires et les plus fondamentales. Ce concept explore la stratégie de prise de décision de deux individus qui, en agissant dans leur propre intérêt, finissent avec des résultats moins bons que s'ils avaient coopéré en premier lieu.

Dans le Dilemme du Prisonnier, deux suspects arrêtés pour un crime sont détenus dans des pièces séparées et ne peuvent pas communiquer entre eux. Le procureur informe chacun d'eux individuellement que s'il (avoue le suspect 1) avoue et témoigne contre l'autre, il peut se libérer, mais s'il ne coopère pas et que le suspect 2 le fait, le suspect 1 sera condamné à trois ans de prison. Si les deux avouent, ils obtiendront une peine de deux ans, et si aucun des deux avoue, ils seront condamnés à un an de prison.

Alors que la coopération est la meilleure stratégie pour les deux suspects, face à un tel dilemme, la recherche montre que la plupart des gens rationnels préfèrent confesser et témoigner contre l'autre plutôt que de rester silencieux et de saisir l'occasion que l'autre partie avoue.

Stratégies de théorie des jeux

Le dilemme des prisonniers jette les bases de stratégies avancées de théorie des jeux dont les plus populaires sont:

Pennies assorties

: jeu à somme nulle impliquant deux joueurs (appelez-les Joueur A et Joueur B) plaçant simultanément un penny sur la table, avec le paiement selon que les pennies correspondent. Si les deux pennies sont en tête ou en queue, le joueur A gagne et conserve le penny du joueur B. S'ils ne correspondent pas, le joueur B gagne et conserve le penny du joueur A. Deadlock

: Il s'agit d'un scénario de dilemme social comme le dilemme du prisonnier en ce sens que deux joueurs peuvent coopérer ou faire défaut (i.e. ne pas coopérer). Dans Deadlock, si le joueur A et le joueur B coopèrent tous les deux, ils reçoivent chacun un gain de 1, et s'ils ont tous deux un défaut, ils reçoivent chacun un gain de 2. Mais si le joueur A coopère et le joueur B 0 et B obtient un gain de 3. Dans le diagramme de gains ci-dessous, le premier chiffre dans les cellules (a) à (d) représente la récompense du joueur A, et le deuxième chiffre est celui du joueur B: Deadlock Matrice de paiement < Joueur B

Coopérer

Défaut

Joueur A

Coopérer

(a) 1, 1

(b) 0, 3

Défaut

(c) 3 , 0

(d) 2, 2

L'impasse diffère du dilemme du prisonnier en ce que l'action du plus grand bénéfice mutuel (c'est-à-dire les deux défauts) est aussi la stratégie dominante. Une stratégie dominante pour un joueur est définie comme celle qui produit le plus haut rendement de toute stratégie disponible, indépendamment des stratégies employées par les autres joueurs.

Un exemple souvent cité de blocage est celui de deux puissances nucléaires qui essaient de parvenir à un accord pour éliminer leurs arsenaux de bombes nucléaires. Dans ce cas, la coopération implique l'adhésion à l'accord, tandis que la défection signifie renier secrètement l'accord et conserver l'arsenal nucléaire. Le meilleur résultat pour l'une ou l'autre nation, malheureusement, est de revenir sur l'accord et de conserver l'option nucléaire pendant que l'autre nation élimine son arsenal, car cela donnera un avantage caché au premier si la guerre éclate entre les deux. La deuxième meilleure option est à la fois de faire défaut ou de ne pas coopérer, car cela conserve leur statut de puissance nucléaire.

Concours de Cournot

: Ce modèle est également conceptuellement similaire au Prisonnier Dilemme, et est nommé d'après le mathématicien français Augustin Cournot, qui l'a introduit en 1838. L'application la plus commune du modèle de Cournot est de décrire un duopole ou deux producteurs dans un marché.

Par exemple, supposons que deux entreprises A et B produisent un produit identique et peuvent produire des quantités élevées ou faibles. Si les deux parties coopèrent et acceptent de produire à des niveaux bas, alors une offre limitée se traduira par un prix élevé pour le produit sur le marché et des profits substantiels pour les deux sociétés. D'un autre côté, s'ils présentent des défauts et produisent à des niveaux élevés, le marché sera submergé et entraînera un prix bas pour le produit et par conséquent des bénéfices plus faibles. Mais si l'on coopère (c'est-à-dire produit à bas niveaux) et les autres défauts (c'est-à-dire subrepticement à des niveaux élevés), alors le premier casse juste alors que le second gagne plus que si tous deux coopèrent. La matrice des gains pour les entreprises A et B est montrée (les chiffres représentent le bénéfice en millions de dollars). Ainsi, si A coopère et produit à bas niveaux alors que B est défectueux et produit à des niveaux élevés, le gain est indiqué dans la cellule (b) - rentabilité pour la société A et bénéfices de 7 millions de dollars pour la société B.

Cournot Payoff Matrice

Société B

Coopérer

Défaut

Société A

Coopérer

(a) 4, 4

(b) 0, 7

Défaut

(c 7, 0

(d) 2, 2

Coordination

: En coordination, les joueurs gagnent des gains plus élevés lorsqu'ils choisissent le même plan d'action.

A titre d'exemple, considérons deux géants de la technologie qui décident d'introduire une nouvelle technologie radicale dans les puces de mémoire qui pourraient leur rapporter des centaines de millions de bénéfices ou une version révisée d'une technologie plus ancienne qui leur rapporterait beaucoup moins. Si une seule entreprise décidait d'adopter la nouvelle technologie, l'adoption du marché par les consommateurs serait nettement plus faible et, par conséquent, elle rapporterait moins que si les deux entreprises décidaient de la même chose. La matrice des gains est présentée ci-dessous (les chiffres représentent le bénéfice en millions de dollars). Ainsi, si les deux entreprises décident d'introduire la nouvelle technologie, elles gagneraient 600 millions de dollars chacune, tandis que l'introduction d'une version révisée de l'ancienne technologie leur rapporterait 300 millions de dollars chacune, comme indiqué dans la cellule (d). Mais si la société A décidait seule d'introduire la nouvelle technologie, elle ne gagnerait que 150 millions de dollars, même si la société B gagnerait 0 dollar (vraisemblablement parce que les consommateurs ne seraient peut-être pas disposés à payer pour sa technologie obsolète). Dans ce cas, il est logique que les deux entreprises travaillent ensemble plutôt que par elles-mêmes.

Matrice des gains de coordination

Société B

Nouvelle technologie

Ancienne technologie

Société A

Nouvelle technologie

(a) 600, 600

(b) 0, 150 < Ancienne technologie

(c) 150, 0

(d) 300, 300

Centipede Game

: C'est un jeu de forme extensive dans lequel deux joueurs ont alternativement la chance de prendre le plus grand part d'une cachette d'argent lentement croissante. Le jeu de Centipede est séquentiel, puisque les joueurs font leurs mouvements l'un après l'autre plutôt que simultanément; chaque joueur connaît également les stratégies choisies par les joueurs qui ont joué avant eux. Le jeu se termine dès qu'un joueur prend la réserve, avec ce joueur obtenant la plus grande partie et l'autre joueur obtenant la plus petite partie.

Par exemple, si le joueur A et le joueur B jouent au jeu Centipede, supposons que le joueur A passe en premier et décide s'il doit "prendre" ou "passer" la réserve, qui s'élève actuellement à 2 $. S'il prend, alors A et B obtiennent 1 $ chacun, mais si A passe, la décision de "prendre ou passer" doit maintenant être prise par le joueur B. Si B prend, elle obtient 3 $ (soit la cachette précédente de 2 $ + 1 $ ) et A obtient 0 $. Mais si B passe, A peut maintenant décider de prendre ou de passer, et ainsi de suite. Si les deux joueurs choisissent toujours de passer, ils reçoivent chacun un gain de 100 $ à la fin de la partie.

Le point de la partie est que si A et B coopèrent et "passent" à la fin de la partie, ils obtiennent le gain maximum de 100 $ chacun. Mais s'ils se méfient de l'autre joueur et s'attendent à ce qu'ils «prennent» à la première occasion, alors l'équilibre de Nash prédit que les joueurs prendront la plus petite réclamation possible (1 $ dans ce cas). Des études expérimentales ont montré, cependant, que ce comportement «rationnel» (tel que prédit par la théorie des jeux) est rarement exposé dans la vie réelle. Ceci n'est pas surprenant intuitivement compte tenu de la petite taille de la récompense initiale par rapport à la finale. Comportement similaire par des sujets expérimentaux a également été exposée dans le dilemme du voyageur. Dilemme du Voyageur

: Il s'agit d'un jeu à somme non nulle dans lequel les deux joueurs tentent de maximiser leur propre gain sans égard pour l'autre. Conçue par l'économiste Kaushik Basu en 1994, dans Traveler's Dilemma, une compagnie aérienne accepte de payer à deux voyageurs une compensation pour dommages causés à des articles identiques. Toutefois, les deux voyageurs sont tenus séparément d'estimer la valeur de l'article, avec un minimum de 2 $ et un maximum de 100 $. Si les deux écrivent la même valeur, la compagnie aérienne remboursera chacun d'eux. Mais si les valeurs diffèrent, la compagnie aérienne leur versera la valeur la plus basse, avec une prime de 2 $ pour le voyageur qui a noté cette valeur inférieure et une pénalité de 2 $ pour le voyageur qui a noté la valeur la plus élevée.

Le niveau d'équilibre de Nash, basé sur l'induction vers l'arrière, est de 2 $ dans ce scénario. Mais comme dans le jeu Centipede, les expériences en laboratoire démontrent systématiquement que la plupart des participants - naïvement ou autrement - choisissent un nombre beaucoup plus élevé que 2 $.

Le dilemme du voyageur peut être appliqué pour analyser une variété de situations de la vie réelle. Le processus d'induction rétrospective, par exemple, peut aider à expliquer comment deux entreprises engagées dans la concurrence acharnée peuvent régulièrement réduire les prix des produits afin de gagner des parts de marché, ce qui peut entraîner des pertes de plus en plus importantes dans le processus. Stratégies de théorie des jeux supplémentaires

Battle of the Sexes

: C'est une autre forme de jeu de coordination décrite plus haut mais avec des asymétries de gains. Il s'agit essentiellement d'un couple essayant de coordonner leur soirée. Alors qu'ils avaient accepté de se rencontrer au jeu de balle (la préférence de l'homme) ou à une pièce de théâtre (la préférence de la femme), ils ont oublié ce qu'ils avaient décidé et, pour aggraver le problème, ne peuvent plus communiquer. Où devraient-ils aller? La matrice des gains est telle que montrée - les chiffres dans les cellules représentent le degré relatif de jouissance de l'événement pour la femme et l'homme, respectivement. Par exemple, la cellule (a) représente la récompense (en termes de niveaux de plaisir) pour la femme et l'homme, respectivement, au jeu (elle en profite beaucoup plus que lui). La cellule (d) est la récompense si les deux arrivent au jeu de balle (il l'apprécie plus qu'elle ne le fait). La cellule (c) représente l'insatisfaction si les deux vont non seulement au mauvais endroit, mais aussi à l'événement qu'ils apprécient le moins - la femme au jeu de balle et l'homme au jeu.

Matrice des gains de la bataille des sexes

Homme Jouez

Jeu de la bille

Femme

Jouez

(a) 6, 3

(b) 2, 2 > Jeu de balle

(c) 0, 0

(d) 3, 6

Dictator Game

: C'est un jeu simple dans lequel le joueur A doit décider comment partager un prix en argent avec le joueur B , qui n'a aucune influence sur la décision du joueur A. Bien que ce ne soit pas une stratégie de théorie des jeux

en soi

, elle fournit des informations intéressantes sur le comportement des gens. Les expériences révèlent qu'environ 50% gardent tout l'argent pour eux-mêmes; 5% le partagent également, et les 45% restants donnent une plus petite part à l'autre participant. Le jeu des dictateurs est étroitement lié au jeu de l'ultimatum, dans lequel le joueur A reçoit une somme d'argent déterminée, dont une partie doit être donnée au joueur B, qui peut accepter ou rejeter le montant donné.Le hic, c'est que si le deuxième joueur rejette le montant offert, A et B n'obtiennent rien. Les jeux de dictature et d'ultimatum contiennent des leçons importantes pour des questions telles que les dons de bienfaisance et la philanthropie.

Guerre de la Paix : Variation du Dilemme du Prisonnier dans lequel les décisions «Coopérer ou Défaire» sont remplacées par «Paix ou Guerre. "Une analogie pourrait être deux sociétés engagées dans une guerre des prix. Si les deux s'abstiennent de baisser les prix, ils jouissent d'une relative prospérité (cellule a), mais la guerre des prix réduirait considérablement les gains (cellule d). Cependant, si A s'engage dans la réduction des prix (guerre) mais que B ne le fait pas, A aurait un bénéfice supérieur à 4 puisqu'il pourrait être en mesure de conquérir des parts de marché substantielles, et ce volume plus important compenserait les prix plus bas. Matrice des gains de guerre de paix Compagnie B

Paix Guerre

Compagnie A

Paix

(a) 3, 3

(b) 0, 4 > Guerre

(c) 4, 0

(d) 1, 1

Dilemme du volontaire

: Dans le dilemme d'un volontaire, quelqu'un doit entreprendre une corvée ou un travail pour le bien commun. Le pire résultat possible est réalisé si personne ne fait du bénévolat. Par exemple, considérons une entreprise où la fraude comptable est généralisée, mais la direction ne l'ignore pas. Certains employés subalternes du service de la comptabilité sont au courant de la fraude, mais hésitent à le dire à la haute direction, car cela entraînerait le licenciement des employés impliqués dans la fraude et probablement des poursuites. Être étiqueté comme un «dénonciateur» peut également avoir des répercussions sur la ligne. Mais si personne ne fait du bénévolat, la fraude à grande échelle peut entraîner la faillite de l'entreprise et la perte de tous les emplois.

The Bottom Line

La théorie des jeux peut être utilisée très efficacement comme outil de prise de décision, que ce soit dans un contexte économique, commercial ou personnel.