lunes, 2 de marzo de 2020

El Problema de Monty Hall

El problema de Monty Hall es un problema matemático de probabilidad basado en el concurso televisivo estadounidense Trato hecho (Let's Make a Deal). El problema fue bautizado con el nombre del presentador de dicho concurso: Monty Hall.

La premisa

El concursante debe elegir una puerta entre tres (todas cerradas); el premio consiste en llevarse lo que se encuentra detrás de la elegida. Se sabe con certeza que tras una de ellas se oculta un automóvil, y tras las otras dos hay cabras. Una vez que el concursante haya elegido una puerta y comunicado su elección a los presentes, el presentador, que sabe lo que hay detrás de cada puerta, abrirá una de las otras dos en la que haya una cabra. A continuación, le da la opción al concursante de cambiar, si lo desea, de puerta (tiene dos opciones). ¿Debe el concursante mantener su elección original o escoger la otra puerta? ¿Hay alguna diferencia?



Esa pregunta generó un intenso debate. Como la respuesta correcta parece contradecir la intuición, es aparentemente una paradoja.

La premisa original

A continuación se expone el enunciado más famoso del problema, extraído de una carta de Craig F. Whitaker a la columna de Marilyn vos Savant en Parade Magazine en 1990 (como la citan Bohl, Liberatore y Nydick).

Supón que estás en un concurso, y se te ofrece escoger entre tres puertas: detrás de una de ellas hay un coche, y detrás de las otras, cabras. Escoges una puerta, digamos la nº1, y el presentador, que sabe lo que hay detrás de las puertas, abre otra, digamos la nº3, que contiene una cabra. Entonces te pregunta: "¿No prefieres escoger la nº2?". ¿Es mejor para ti cambiar tu elección?

En la carta posterior de Selvin a American Statistician (agosto de 1975) aparece la que parece ser la primera mención del término "problema de Monty Hall".

Un problema análogo denominado "problema de los tres prisioneros" apareció en la columna Mathematical Games, de Martin Gardner, en 1959. La versión de Gardner hace el proceso de elección explícito, evitando las suposiciones de la versión original.

La manera más intuitiva de visualizar la mejor estrategia es teniendo en cuenta que tienes 2/3 de probabilidad de elegir una cabra y luego el presentador te desvela dónde está la otra. Por descarte, lo más probable es que el coche esté en la puerta restante y, en concreto, con 2/3 de probabilidad.

La premisa completa

Se ofrece un concurso cuya mecánica es la siguiente:
Al concursante se le ofrece la posibilidad de escoger una entre tres puertas. Tras una de ellas se encuentra un coche, y tras las otras dos hay una cabra. El concursante gana el premio que se oculta detrás de la puerta que escoja.

Después de que el concursante escoja una puerta, el presentador abre una de las otras dos puertas, mostrando una cabra. Siempre puede hacerlo ya que incluso si el concursante ha escogido una cabra, queda otra entre las puertas que ha descartado y el presentador conoce lo que hay detrás de cada puerta.

Entonces, ofrece al concursante la posibilidad de cambiar su elección inicial y escoger la otra puerta que descartó originalmente, que continúa cerrada.

La pregunta oportuna es: ¿debe hacerlo o no?

La solución

Suposiciones iniciales

Esta solución se basa en tres suposiciones básicas:

  1. que el presentador siempre abre una puerta, 
  2. que tras la que el presentador ha abierto siempre hay una cabra, puesto que conoce lo que hay detrás de cada puerta, 
  3. que el presentador la escoge entre las dos restantes después de que el concursante haya escogido la suya.


Un estudio probabilístico

La probabilidad de que el concursante escoja en su primera oportunidad la puerta que oculta el coche es de 1/3, por lo que la probabilidad de que el coche se encuentre en una de las puertas que no ha escogido es de 2/3. ¿Qué cambia cuando el presentador muestra una cabra tras una de las otras dos puertas?

Una suposición errónea es que, una vez solo queden dos puertas, ambas tienen la misma probabilidad (es 1/2) de contener el coche. Es errónea ya que el presentador abre la puerta después de la elección del jugador. Esto es, la elección del jugador afecta a la puerta que abre el presentador. No es un suceso aleatorio ni inconexo.

Si el jugador escoge en su primera opción la puerta que contiene el coche (con una probabilidad de 1/3), entonces el presentador puede abrir cualquiera de las otras dos puertas. Además, el jugador pierde el coche si cambia cuando se le ofrece la oportunidad, puesto que había acertado.

Pero, si el jugador escoge una cabra en su primera opción (con una probabilidad de 2/3), el presentador solo tiene la opción de abrir una puerta, y esta es la única puerta restante que contiene una cabra. En ese caso, la puerta restante tiene que contener el coche, por lo que cambiando lo gana, puesto que había elegido cabra en primera opción.

En resumen, si mantiene su elección original gana si escogió originalmente el coche (con probabilidad de 1/3), mientras que si cambia, gana si escogió originalmente una de las dos cabras (con probabilidad de 2/3). Por lo tanto, el concursante debe cambiar su elección si quiere maximizar la probabilidad de ganar el coche.

¿Por qué sucede esto?

Porque lo que muestra el presentador no afecta a tu elección original, solo a la otra puerta no escogida. Tu elección inicial no podía ser revelada, independientemente de su contenido, en cambio la otra podría haber sido eliminada en caso de que no fuera la correcta. Una vez que se abre una puerta y se muestra la cabra, esa puerta tiene una probabilidad igual a 0 de contener un coche, por lo que deja de tenerse en cuenta. Si el conjunto de dos puertas tenía una probabilidad de 2/3 de contener el coche, entonces, si una tiene una probabilidad de 0, la otra debe tener una probabilidad de 2/3. La elección consiste en preguntarte si prefieres seguir con tu puerta original o escoger las otras dos puertas. La probabilidad de 2/3 se traspasa a la otra puerta no escogida (en lugar de dividirse entre las dos puertas restantes de modo que ambas tengan una probabilidad de 1/2) porque en ningún caso puede el presentador abrir la puerta escogida inicialmente. Si el presentador escogiese al azar y abriese una de las dos puertas con cabras (siendo una de estas posiblemente la del concursante), y luego diese de nuevo una posibilidad de elegir entre las demás, entonces las dos puertas restantes sí tendrían la misma probabilidad de contener el coche. Es necesario tener en cuenta la situación en como se dan las cosas.

¿Por qué solemos equivocarnos?

El razonamiento intuitivo que nos lleva a la conclusión errónea es que como hay dos puertas, una con el coche y otra con la cabra, y no sabemos en cuál de las dos está el coche, pensamos que cada una tiene 50% o 1/2 de probabilidad. Pero este razonamiento no toma en cuenta el conocimiento con que las puertas fueron elegidas.

Para ilustrar, supongamos que no conocemos el año de cierto acontecimiento histórico, pero nos dan como únicas opciones 1990 y 1991. Si no tenemos más información, podemos decir que cada una tiene 1/2 de probabilidad, pero si le preguntamos a un estudiante que no suele sacar buenas notas, titubea e inseguro nos dice que es 1990, y luego le preguntamos a un profesor de historia y muy convencido nos dice que es 1991, no sería adecuado asignarle 1/2 de probabilidad a cada opción. La diferencia entre las dos es el respaldo que tienen. Una está respaldada por alguien que podemos considerar ignorante, y la otra está respaldada por un sabio. No es imposible que el profesor esté equivocado, pero sabemos que eso es menos frecuente.

En el problema de Monty Hall sucede que el presentador conoce las posiciones y está forzado a dejar el automóvil oculto para la segunda ronda. Las únicas dos puertas que permanecerán tapadas son la que eligió el concursante al principio y otra que decida el presentador. Ahora bien, el concursante elige una puerta que esconde una cabra con una frecuencia de 2/3, es decir, la mayoría de las veces, lo que significa que la otra puerta que deje cerrada el presentador tendrá que ser la del coche en esa misma mayoría de las veces para que pueda permanecer oculto. En otras palabras, el presentador elige el coche con más frecuencia que el concursante, y por eso es más probable que se gane cambiando a que se gane manteniendo la elección original.

NOTA: Ver Explicaciones matematicas en el articulo orginal.

Explicaciones alternativas

El problema con las 100 puertas

Una forma más clara de verlo es replantear el problema. Si en lugar de haber solo tres puertas hubiese 100, y tras la elección original el presentador abriese 98 de las restantes para mostrar que tras de ellas hay cabras. Si no cambiase su elección, ganaría el coche solo si lo ha escogido originalmente (1 de cada 100 veces); mientras que si la cambia siempre, ganaría cada vez que no lo haya escogido originalmente, o sea, 99 de cada 100 veces. Si en un juego particular la puerta correcta fuese la 30, por poner un ejemplo, tenemos los siguientes casos:

1- El concursante elige la puerta 1. El presentador revela todas menos la 1 y la 30. Se gana cambiando.
2- El concursante elige la puerta 2. El presentador revela todas menos la 2 y la 30. Se gana cambiando.
3- El concursante elige la puerta 3. El presentador revela todas menos la 3 y la 30. Se gana cambiando.
...
98- El concursante elige la puerta 98. El presentador revela todas menos la 98 y la 30. Se gana cambiando.
99- El concursante elige la puerta 99. El presentador revela todas menos la 99 y la 30. Se gana cambiando.
100- El concursante elige la puerta 100. El presentador revela todas menos la 100 y la 30. Se gana cambiando.

La única manera de ganar manteniendo la elección inicial es si al principio el concursante eligió la puerta 30. Esto es, debe haber acertado la correcta teniendo 100 posibilidades.

Imaginar que el presentador es otro concursante

Dado que desde el punto de vista del presentador, seleccionar la puerta que debe abrir entre las dos restantes es lo mismo que seleccionar la puerta que no debe abrir, a éste puede imaginársele como otro concursante y la puerta que deja cerrada es su elección. A diferencia del primer participante, él tiene la ventaja de conocer el contenido de cada una de las puertas. Si fuera el primero en escoger, sería libre de elegir siempre la puerta del coche, por lo que podría ganarlo el 100% de las veces. Pero tiene el inconveniente de que otro concursante va a seleccionar primero, y luego él tiene que escoger una que no haya sido la puerta del primero. Si el primer concursante elige la puerta del coche, lo cual ocurre 1/3 de las veces, el presentador solo podrá escoger una puerta con una cabra, pero si el primero falla, lo cual ocurre en los 2/3 restantes, el presentador ganará.

Decidir cambiar es equivalente a apostar por que ganó el presentador, es decir, por el concursante que conocía los contenidos, y decidir no cambiar es equivalente a apostar por el concursante que hizo una selección al azar. Un concursante tiene ventaja sobre el otro. De este modo, se aprecia que la segunda elección en el problema de Monty Hall no es una decisión aleatoria entre dos puertas indistinguibles, en cuyo caso las probabilidades sí serían de 1/2. En este caso tenemos dos posiciones bien diferenciadas: puerta de cambiar y puerta de no cambiar. El hecho de que el coche se encuentre en una o en otra depende de dos eventos con distinta probabilidad. Estará en la puerta de no cambiar si y solo si al principio se acertó (1/3), y estará en la otra si y solo si al principio se falló (2/3).

Una explicación gráfica

Por si no se ve claro, aquí va una explicación gráfica: Tenemos tres cajas:
([?]) vs ([?][?]) ahora hay dos grupos: la caja que se escogió (con probabilidad 1/3 y el grupo de las otras dos cajas (con probabilidad 2/3).
([?]) vs ([?][?]) = 1/3 vs (1/3,1/3)
Se descubre una cabra del grupo de las dos cajas.
([?]) vs ([B][?]) = x vs (0,1-x)

¿Dónde es más probable que se encuentre el premio? ¿en la caja escogida o entre las otras dos (aunque una esté descubierta)?
Evidentemente es más probable que esté entre las otras dos.
Comprobémoslo con seis cajas (cinco contienen cabra y una premio):
([?][?][?][?][?][?]) antes de empezar hay una probabilidad de 1/6 de encontrar el premio dentro del grupo.
Elijo la primera (o cualquier otra).
([?]) vs ([?][?][?][?][?]) ahora hay dos grupos: la caja que se escogió (con probabilidad de 1/6 y el grupo de las otras cinco cajas (con probabilidad 5/6).
Preguntémonos en este punto: ¿dónde es más probable que esté el premio; en la caja elegida (1/6) o entre las cinco restantes (5/6)?
Se descubren cuatro cabras.
([?]) vs ([B][B][?][B][B])=1/6 vs 5/6.
Otra vez la misma pregunta: ¿dónde es más probable que esté el premio, en la caja escogida o entre las otras 5? La respuesta sigue siendo la misma porque la única puerta cerrada de las cinco originales no seleccionadas mantiene la probabilidad de todo el conjunto de puertas no elegidas.



Artículos: "Problema de Monty Hall" Publicado en https://es.wikipedia.org Consultado el 2 Febrero 2020
URL: https://es.wikipedia.org/wiki/Problema_de_Monty_Hall

No hay comentarios:

Publicar un comentario