¿Qué es la inducción hacia atrás?
La inducción hacia atrás en la teoría de juegos es un proceso iterativo de razonamiento hacia atrás en el tiempo, desde el final de un problema o situación, para resolver una forma extensa finita y juegos secuenciales, e inferir una secuencia de acciones óptimas.
Inducción hacia atrás explicada
La inducción hacia atrás se ha utilizado para resolver juegos desde que John von Neumann y Oskar Morgenstern establecieron la teoría de juegos como un tema académico cuando publicaron su libro, Theory of Games and Economic Behavior en 1944.
En cada etapa del juego, la inducción hacia atrás determina la estrategia óptima del jugador que realiza el último movimiento en el juego. Luego, se determina la acción óptima del penúltimo jugador en movimiento, tomando la acción del último jugador como se indica. Este proceso continúa hacia atrás hasta que se determine la mejor acción para cada momento. Efectivamente, uno está determinando el equilibrio de Nash de cada subjuego del juego original.
Sin embargo, los resultados inferidos de la inducción hacia atrás a menudo no pueden predecir el juego humano real. Los estudios experimentales han demostrado que el comportamiento "racional" (como lo predice la teoría de juegos) rara vez se exhibe en la vida real. Los jugadores irracionales en realidad pueden terminar obteniendo ganancias más altas de lo previsto por la inducción hacia atrás, como se ilustra en el juego de ciempiés.
En el juego de ciempiés, dos jugadores alternativamente tienen la oportunidad de tomar una parte mayor de un bote de dinero cada vez mayor, o de pasar el bote al otro jugador. Los pagos se organizan de modo que si el bote se pasa al oponente y el oponente toma el bote en la siguiente ronda, uno recibe un poco menos que si hubiera tomado el bote en esta ronda. El juego concluye tan pronto como un jugador toma el alijo, con ese jugador obteniendo la porción más grande y el otro jugador obteniendo la porción más pequeña.
Ejemplo de inducción hacia atrás
Como ejemplo, suponga que el jugador A va primero y tiene que decidir si debe "tomar" o "pasar" el alijo, que actualmente asciende a $ 2. Si él toma, entonces A y B obtienen $ 1 cada uno, pero si A pasa, la decisión de tomar o pasar ahora debe ser tomada por el Jugador B. Si B toma, ella recibe $ 3 (es decir, el alijo anterior de $ 2 + $ 1) y A recibe $ 0. Pero si B pasa, A ahora decide si tomar o pasar, y así sucesivamente. Si ambos jugadores siempre eligen pasar, cada uno recibe una recompensa de $ 100 al final del juego.
El objetivo del juego es que si A y B cooperan y continúan pasando hasta el final del juego, obtienen el pago máximo de $ 100 cada uno. Pero si desconfían del otro jugador y esperan que "tomen" en la primera oportunidad, el equilibrio de Nash predice que los jugadores tomarán el reclamo más bajo posible ($ 1 en este caso).
El equilibrio de Nash de este juego, donde ningún jugador tiene un incentivo para desviarse de su estrategia elegida después de considerar la elección de un oponente, sugiere que el primer jugador tomaría el bote en la primera ronda del juego. Sin embargo, en realidad, relativamente pocos jugadores lo hacen. Como resultado, obtienen una recompensa mayor que la pronosticada por el análisis de equilibrio.
Resolver juegos secuenciales usando inducción hacia atrás
A continuación se muestra un juego secuencial simple entre dos jugadores. Las etiquetas con el Jugador 1 y el Jugador 2 dentro de ellos son los conjuntos de información para los jugadores uno o dos, respectivamente. Los números entre paréntesis en la parte inferior del árbol son los pagos en cada punto respectivo. El juego también es secuencial, por lo que el Jugador 1 toma la primera decisión (izquierda o derecha) y el Jugador 2 toma su decisión después del Jugador 1 (arriba o abajo).
Figura 1
La inducción hacia atrás, como toda teoría del juego, utiliza los supuestos de racionalidad y maximización, lo que significa que el Jugador 2 maximizará su recompensa en cualquier situación dada. En cualquier conjunto de información tenemos dos opciones, cuatro en total. Al eliminar las opciones que el Jugador 2 no elegirá, podemos reducir nuestro árbol. De esta manera, resaltaremos las líneas que maximizan la rentabilidad del jugador en el conjunto de información dado.
Figura 2
Después de esta reducción, el Jugador 1 puede maximizar sus ganancias ahora que las opciones del Jugador 2 se dan a conocer. El resultado es un equilibrio encontrado por la inducción hacia atrás del Jugador 1 eligiendo "derecho" y el Jugador 2 eligiendo "arriba". A continuación se muestra la solución al juego con la ruta de equilibrio en negrita.
figura 3
Por ejemplo, uno podría configurar fácilmente un juego similar al anterior usando compañías como jugadores. Este juego podría incluir escenarios de lanzamiento de productos. Si la Compañía 1 quisiera lanzar un producto, ¿qué podría hacer la Compañía 2 en respuesta? ¿La compañía 2 lanzará un producto similar de la competencia? Al pronosticar las ventas de este nuevo producto en diferentes escenarios, podemos configurar un juego para predecir cómo se desarrollarán los eventos. A continuación se muestra un ejemplo de cómo se podría modelar un juego de este tipo.
Figura 4