Juegos de suma cero para dos jugadores con estrategias aleatorizadas

Se analizarán ahora aquellos juegos que no tienen punto silla, que de hecho son mucho más frecuentes en la práctica. Para ello supongamos que dos personas van a jugar a pares o impares solamente con la posibilidad de sacar uno o dos dedos cada uno. Si la suma de ambos es par el jugador A pagará un euro al jugador B. En caso contrario será B el que pague a A. Por tanto la matriz de beneficios se puede expresar de la forma siguiente:


No hay punto silla. Eso significa que para cualquier decisión de estrategias hay un jugador que puede beneficiarse cambiando de estrategia unilateralmente. Si por ejemplo los dos sacan dos dedos el resultado sería par y ganaría B. Pero al cambiar A de estrategia pasaría a ganar A y por tanto a perder B.

Se determinarán ahora estrategias óptimas y el valor de este juego. Para ello se amplía
el conjunto de estrategias posibles. Hasta ahora se ha supuesto que cada vez que un jugador participa en un juego utilizará la misma estrategia. Ahora se permitirá que un jugador opte por una estrategia concreta en una proporción determinada de casos, que llamaremos probabilidad. Este tipo de estrategias se denominan estrategias aleatorizadas o mixturas. En general podríamos representar una estrategia aleatorizada de A de la forma (x1, x2) y una de B de la forma (y1, y2). Esto quiere decir que si el jugador A utiliza la estrategia (x1, x2) sacará un dedo en el 100x1 % de las veces que juegue y dos en el resto (100x2 %). Por supuesto ha de verificarse que

SOLUCIÓN GRÁFICA

En el ejemplo anterior la ganancia esperada de A cuando B escoge 1 ser´a:


y en el caso de que B elija 2 la ganancia esperada de A ser´a:





En la Figura 1 se representan gr´aficamente ambas ganancias esperadas. Por tanto, suponiendo que el jugador B conoce la decisi´on de A, (x1, 1 − x1), la ganancia esperada de A vendrá determinada por la linea gruesa. De este modo el punto de corte ofrece a A garantías de una ganancia media mínima de cero. Este punto proporciona la mejor estrategia para A, (1/2, 1/2). El caso de B es totalmente sim´etrico produciendo ahora la Figura sgte. Ambas gráficas representan las ganancias medias de A. Por ese motivo B buscará minimizar la ganancia esperada de A, que conociendo de antemano la estrategia de B vendrá representada por la línea gruesa en la Figura 2. Se puede decir por tanto que en este juego el techo o nivel superior del jugador A coincide con el suelo o nivel inferior de B. Esto es algo general, de modo que siempre el suelo del jugador fila coincide con el techo del jugador columna. El valor común de ambos se denomina valor del juego para el jugador fila. Así, cualquier estrategia del jugador fila que garantice una ganancia esperada al menos igual al valor es una estrategia óptima para este jugador. Del mismo modo cualquier estrategia del jugador columna que garantice una pérdida esperada a lo sumo igual al valor es una estrategia óptima para el jugador columna. En el ejemplo el valor es cero y (1/2, 1/2) será una estrategia óptima para ambos. Además es única.
Supongamos que el jugador A escoge la estrategia (1/3, 2/3). Entonces escogiendo B dos
dedos garantiza que la ganancia media de A es negativa y por tanto su ganancia esperada
es positiva. Sería una estrategia óptima para B, pero no para A.

Selección de la estrategia de A

Selección de la estrategia de B


En caso de que existan más de dos estrategias por jugador, será necesario el uso de la programación lineal.


Tomado de: www.uclm.es/profesorado/jesuslopezfidalgo/juegos.pdf

2 comentarios:

  1. MUXAS GRACIAS POR LA INFORMACION , ME SIRVIO DE MUXO, YA QUE NO ENCONTRAVA MUXO SOBRE ESTE TEMA.

    ResponderEliminar