martes, 6 de marzo de 2012

Las matematicas detras del concurso "Atrapa un millon".

¿Qué probabilidad tendrías de ganar algo sin tener ni idea en ninguna de las preguntas? En el sentido de teoría de la decisión con incertidumbre y en caso de dudar en una pregunta, ¿es mejor apostar todo a una respuesta o repartir los fajos de billetes?

Para resolver todas estas cuestiones que seguro te quitan el sueño he creado un simulador online y, para los inquietos, explicaré el desarrollo matemático en el que está basado.

Si no te interesan las fórmulas, ve directamente al punto 2 de conclusiones.


1. Reglas del juego
En este programa de televisión, inicialmente se tienen 40 fajos de billetes y el juego consiste en dividirlos entre las respuestas durante una serie de ocho preguntas tipo test. Las cuatro primeras preguntas tienen cuatro respuestas, las tres siguientes tres, y la octava y última solamente dos posibles respuestas.

Como mínimo, siempre hay que dejar una respuesta sin apuesta. Por ejemplo, en las cuatro primeras se pueden dividir los fajos entre tres respuestas como máximo. El número de fajos que pasen de la última pregunta es el premio de los concursantes, que van en parejas y se (suelen) ayudar mutuamente...






2. Conclusiones (para impacientes)

  • Si no tienes ni idea de cuáles son las respuestas y... 
    • ...apuestas siempre los 40 fajos al azar a una única respuesta, podrás llegar al final con una probabilidad del 0,0046%. Eso sí...en el improbable caso de llegar ¡será con el premio máximo!. Aunque si quieres una dosis de realismo, hay un 99,61% de que no llegues ni a la quinta pregunta.
    • ...divides equitativamente entre el máximo de respuestas posibles (descartando una de ellas al azar), tendrás "muchas" más opciones: con un 12,39% llegarás a la quinta pregunta, aunque superar la octava pregunta con saldo positivo sólo ocurrirá con un 0,285%. En concreto, con un 0,2765% de ganar 1 fajo, 0,0083% de ganar 2 fajos y un 0,0003% de ganar 3 fajos. ¡Y olvídate de premios superiores porque demasiado lejos has llegado sin tener ni idea! Más te vale conformarte con el juego que regalan de consolación.
  • Ahora, lo más normal es que haya al menos una respuesta que se pueda descartar por sentido común o porque el concursante sepa seguro que no es correcta (en todas excepto en la octava que sólo tiene dos respuestas y puede ser más difícil). Asumamos que ese es el único conocimiento que tiene el concursante, por lo que esa respuesta descartada se deja sin fajos y el resto se reparte equitativamente entre las demás respuestas. En ese caso, resumiendo: ¡hay un 3% de probabilidades de llevarse algún premio!... aunque con un 2,906% será solamente 1 fajo. El juego tendrá un poco más de vidilla porque con un 39,16% se superará la cuarta pregunta. Los resultados completos de este caso se muestran en la siguiente imagen (sacados del simulador de abajo).



  • Un último caso para ilustrar el efecto diezmador de las cuatro primeras preguntas: asumiendo que se está al 100% seguro de las cuatro primeras respuestas y se apuesta todo a la opción verdadera, si se juega el resto del juego totalmente al azar se tendrán hasta un 15% de probabilidades de ganar algo. Comparar con el 0,0046% del caso de juego al azar desde el principio. De hecho, en caso de ganar algo, lo más probable es que se ganen no 1 ni 2 fajos, sino ¡5 fajos!, lo que ocurriría con un 2,82%.
 3. Las mates

Lo primero es definir el espacio de estado, con qué variables debemos modelar el problema.

Tenemos nueve etapas: una etapa inicial (0) y una etapa tras cada una de las preguntas (1-8). En cada etapa el estado del jugador se resume en un único número entero: el número de fajos que aún tiene en su poder.

Llamamos Ki a ese número de fajos en cada una de las etapas, con i=0...8. Sabemos que se empieza con 40 fajos, así que K0=40. Para el resto de etapas, necesitamos echar mano de la estadística porque no sabemos exactamente qué pasa, así que necesitamos modelar la incertidumbre.

Se llama distribución de probabilidad discreta o función de masa de probabilidad (fmp) a la función que nos dice la probabilidad de que se dé cada posible estado en un problema. Lo denotamos con una P() mayúscula. Su valor será de 0 para eventos que son imposibles y de 1 para los que son inevitables. Si no estás acostumbrado a cálculos de probabilidad posiblemente te suenen más sus valores multiplicados por 100 y dados como porcentajes de probabilidad.

Para el estado inicial conocemos la fmp a la perfección, ya que es imposible que se tengan 0,1,2..., hasta 39 fajos, y es inevitable tener 40. Resulta una función con todo ceros menos un uno en el valor 40:


P(N0=k)={0, k=0,...,391, k=40 


Fíjate como la gráfica para "P0" en el simulador de arriba es justamente esta función.

Ahora llega lo chulo. ¿Qué pasa tras la pregunta 1?  Hagámoslo aún mejor: ¿qué pasa con la fmp entre una etapa i y la siguiente i+1, en general? Pueden pasar muchas cosas: se pueden distribuir los fajos de muy distintas formas, se puede perder cualquier número de ellos, etc.

Para hacer tratable el problema, echamos mano de la ley de la probabilidad total. Si queremos calcular la fmp para el paso i+1, P(Ni+1) podemos calcularla como:

P(Ni+1=k)=q=0...40 P(Ni+1=k|Ni=q)P(Ni=q)


En palabras: hay que tener en cuenta todos los posibles caminos independientes (el sumatorio) por los que se puede llegar a tener k fajos, usando las distribuciones condicionales (las del simbolo A|B) de que antes tuviésemos q fajos y, naturalmente, ponderando cada una de esas posibilidad por su probabilidad P(Ni=q).

Esa fórmula tiene dos propiedades maravillosas: al tratarse de un espacio de estados discreto podemos hacer la suma de manera exacta (si fueran continuas e integrales la cosa se complica) y además, permite calcular secuencialmente cualquier estado a partir de uno inicial conocido (¡y conocemos la fmp inicial!).

Si conoces la convolución de funciones y miras los histogramas del simulador arriba verás que el efecto es muy parecido: cada fmp es "más ancha" que la anterior. Aunque a diferencia de convolución de funciones continuas, aquí no podemos bajar del valor mínimo (k=0), por lo que todas las probabilidades tienden a acumularse ahí... ¡y nuestro pobre concursante a irse con las manos vacías!

Solo nos queda definir el modelo de transición probabilístico entre etapas, que aparece en la fórmula como la distribución condicional. De nuevo aplicando la ley de la probabilidad total, vemos que tenemos la mezcla de dos distribuciones, cada una ponderada por la probabilidad de haber acertado a la hora de descartar respuestas (P=α) o de haber fallado (P=1-α):

P(Ni+1=k|Ni=q)= α P(Ni+1=k|Ni=q,Acierto)+(1α) P(Ni+1=k|Ni=q,Fallo)

El caso del fallo es sencillo: si te equivocaste al descartar significa que no apostaste nada por la respuesta válida, luego en el siguiente paso tendrás con un 100% de probabilidad cero fajos:

P(Ni+1=k|Ni=q,Fallo) ={ 1, k=0  0, k=1,...,40

En caso de acertar en el descarte y distribuir los q fajos al azar entre M respuestas, pensando un poco nos podemos dar cuenta de que las probabilidades de acertar son equivalentes a si apostásemos los fajos de uno en uno, colocándolos al azar y por supuesto ciegamente (sin saber cuál es la correcta).

Ese patrón está muy bien estudiado y da lugar a la distribución binomial, por lo que:


P(Ni+1=k|Ni=q,Acierto) =B(k;q,β)

donde β=1/M es la probabilidad de acertar habiendo distribuido al azar entre las M respuestas entre las que estamos asumiendo que se encuentra la correcta.

2 comentarios:

  1. Como es habitual, las matemáticas vuelven a aparecer en los concursos de televisión, siempre en perjuicio del concursante, claro.

    Me ha gustado mucho esta entrada (y el blog en general). De hecho, estás en mi blogroll. Puedes, si quieres, linkearme también?

    ResponderEliminar
  2. me alegro de que te guste la entrada y el blog, yo tambien te incluire en el blogroll

    ResponderEliminar