¿Cuál es el dilema del viajero?
El dilema del viajero, en la teoría de juegos, es un juego de suma no cero en el que dos jugadores intentan maximizar su propia recompensa, sin tener en cuenta al otro. El juego demuestra la "paradoja de la racionalidad", la ironía de que la toma de decisiones ilógica o ingenua a menudo produce una mejor recompensa en la teoría del juego.
Para llevar clave
- El dilema del viajero es un juego en el que dos jugadores ofertan cada uno en un pago propuesto y ambos reciben la oferta más baja, más o menos un pago de bonificación. Según la teoría del juego, la estrategia racional para ambos jugadores es elegir la recompensa más baja posible. Esto da como resultado que ambos jugadores reciban pagos más bajos de lo que podrían lograr siguiendo una estrategia irracional. En estudios experimentales, las personas eligieron consistentemente pagos más altos y lograron mejores resultados que la estrategia racional predicha por la teoría del juego.
Comprender el dilema del viajero
El juego del dilema del viajero, formulado en 1994 por el economista Kaushik Basu, presenta un escenario en el que una aerolínea daña severamente antigüedades idénticas compradas por dos viajeros diferentes. El gerente de la aerolínea está dispuesto a compensarlos por la pérdida de las antigüedades, pero como no tiene idea de su valor, les dice a los dos viajeros que escriban por separado su estimación del valor como cualquier número entre $ 2 y $ 100 sin consultar con uno. otro.
Sin embargo, hay un par de advertencias:
- Si ambos viajeros escriben el mismo número, les reembolsará a cada uno esa cantidad. Si escriben números diferentes, el gerente asumirá que el precio más bajo es el valor real y que la persona con el número más alto está haciendo trampa. Si bien les pagará a ambos la cifra más baja, la persona con el número más bajo recibirá un bono de $ 2 por honestidad, mientras que el que escribió el número más alto recibirá una multa de $ 2.
La elección racional, en términos del equilibrio de Nash, es de $ 2. El razonamiento es el siguiente. El primer impulso del viajero A puede ser anotar $ 100; si el Viajero B también anota $ 100, esa es la cantidad que ambos recibirán del gerente de la aerolínea. Pero pensándolo bien, el Viajero A razona que si escribe $ 99, y B deja $ 100, entonces A recibiría $ 101 ($ 99 + $ 2 de bonificación). Pero A cree que esta línea de pensamiento también se le ocurrirá a B, y si B también pone $ 99, ambos recibirían $ 99. Entonces, A sería mejor dejar $ 98 y recibir $ 100 ($ 98 + $ 2 de bonificación) si B escribe $ 99. Pero dado que esta misma idea de escribir $ 98 podría ocurrirle a B, A considera poner $ 97, y así sucesivamente. Esta línea de inducción hacia atrás llevará a los viajeros hasta el número más pequeño permitido, que es de $ 2.
¿La gente realmente elige el equilibrio de Nash?
En estudios experimentales, contrariamente a las predicciones de la teoría de juegos, la mayoría de las personas eligen $ 100 o un número cercano a él, ya sea sin pensar en el problema o sin darse cuenta de que se desvían de la elección racional. Entonces, aunque la mayoría de las personas intuitivamente sienten que seleccionarían un número mucho mayor que $ 2, esta intuición parece contradecir el resultado lógico predicho por la teoría del juego: que cada viajero seleccionaría $ 2. Al rechazar la elección lógica y actuar ilógicamente al escribir un número más alto, las personas terminan obteniendo una recompensa sustancialmente mayor.
Estos resultados concuerdan con estudios similares que utilizan otros juegos como el dilema del prisionero y el juego de bienes públicos, donde los sujetos experimentales tienden a no elegir el equilibrio de Nash. Con base en estos estudios, los investigadores han propuesto que las personas parecen tener una actitud natural y positiva a favor de la cooperación. Esta actitud conduce a equilibrios cooperativos que brindan mayores beneficios a todos los jugadores en juegos de un solo tiro o repetidos, y puede explicarse por presiones evolutivas selectivas que favorecen este tipo de estrategias aparentemente irracionales pero beneficiosas.
Sin embargo, los estudios sobre el dilema del viajero también han demostrado que cuando la penalización / bonificación es mayor o cuando los jugadores están formados por equipos de varias personas que toman una decisión común, los jugadores eligen con mayor frecuencia seguir la estrategia racional que conduce al equilibrio de Nash. Estos efectos también interactúan, ya que los equipos de jugadores no solo eligen la estrategia más racional, sino que también responden aún más al tamaño de la penalización / bonificación que los jugadores individuales. Estos estudios sugieren que las estrategias evolucionadas que tienden a crear resultados sociales beneficiosos pueden compensarse con estrategias más racionales que tienden hacia el equilibrio de Nash dependiendo de la estructura de los incentivos y la presencia de divisiones sociales.