sábado, 3 de julio de 2010

LAS OPOSICIONES Y EL MODELO DE PROBABILIDAD HIPERGEOMÉTRICO

En año de oposiciones, una de las peticiones con las que más se avasalla a un matemático y estadístico como yo es la de querer saber qué probabilidad se tiene de aprobar cuando se llevan estudiados k temas. Ahora os dejo una aplicación para que en el futuro cada uno calcule la suya de manera hipersencilla.
Lo segundo que más me llama la atención es la sorpresa de después, cuando a alguien a quien le has vaticinado un no despreciable 80% de probabilidad de aprobar te dice que por poco, que de las cinco bolas sólo una le ha sido favorable, que esto de jugar con el azar es pura lotería. 
En ese momento me encojo de hombros y sonrío: se trata de algo largo y aburrido de explicar, pero en toda medida lógico. No hay más que calcular el valor esperado para ver que sale algo intermedio entre una y dos bolas. Amigo y/o amiga: tú no juegas con el azar. El azar es el que juega contigo.

Partamos de un supuesto estándar. Imaginemos que en nuestra oposición hay N temas. Imaginemos que en el tribunal sacarán n bolas. Y por último imaginemos que nos hemos estudiado k temas. El modelo probabilístico para definir el número de objetos de un tipo en un muestreo sin reposición de tamaño n de una población de N objetos donde hay marcados k de dicho tipo, se llama modelo hipergeométrico H(N,n,k). El que quiera, que busque más información acerca de este modelo, o bien que me pregunte por correo y le responderé encantado en cuanto pueda. 
Sí que quiero no dejar pasar la oportunidad de mostrar una sencilla forma de utilizarlo sin necesidad de saber muchas matemáticas, utilizar factoriales ni números combinatorios.
Bastará con irse al excel, y utilizar una de estas fórmulas perdidas que alguna que otra vez vimos y nunca pensamos siquiera en que podrían ser de utilidad alguna. Os mostraré una imagen:


Si se imita la distribución que yo he realizado, en la casilla E2 tendréis que escribir en la barra de fórmulas lo mismo que yo tengo:  =DISTR.HIPERGEOM(D2;B2;C2;A2) (No se os olvide poner el igual).
En D2 siempre colocaremos el número exacto de bolas favorables que queremos que nos salgan. En este ejemplo concreto, he supuesto un temario de 70 temas (A2), en una oposición como la de este año, con 5 bolas sacadas (B2), y con un opositor que se haya estudiado 22 temas (C2). La probabilidad de que no te salga ninguna de las tuyas, en un caso como este, es del 14,14%. Bastará variar los parámetros anteriores para jugar y ver cómo varía la probabilidad.

Si lo que queremos saber es cómo calcular nuestra probabilidad de aprobar, tenemos que programar otra casilla, como muestra este dibujo:



La fórmula en este caso es =1-(DISTR.HIPERGEOM(0;B2;C2;A2)). Dicho de otra manera, en vez de calcular la probabilidad de aprobar (o acertar), calculo la probabilidad de cascarla (de ahí introducir el parámetro 0), y posteriormente resto a uno el resultado obtenido.

Enseñado esto, que cada uno optimice como quiera sus horas de estudio. Eso sí, con este modelo de prueba y estos parámetros, la probabilidad de que te salga exactamente UN TEMA es del 35%. La probabilidad de que te salgan DOS TEMAS y puedas elegir es del 33%. Para TRES TEMAS ya nos caemos al 14%, y CINCO TEMAS mejor no preguntes. 

Un abrazo, y suerte a todos los opositores.

Hoy me he pasado de técnico. El próximo día insultaré un poquito.

17 comentarios:

María A. dijo...

Sí, te has pasado de tecnicismos...y más con las pocas neuronas que me quedan a estas alturas!!! Sólo quiero atestiguar que, a pesar de que da miedo creer en los números, tengo que darte la razón por todas las veces que dijiste: "la probabilidad es la probabilidad"...;p

Manuel Amaro dijo...

María... ¿Yo dije eso? Jajjajaja, vaya frase!!! Es tan absurdo como decir que una mesa es una mesa. Cuando descubras ampliamente la probabilidad, te volverás vaga como yo.

irene dijo...

Pues mira, lo mejor es estudiarse los 70 temas, así no hay que echar tantas cuentas ni calentarse la cabeza con las probabilidades, con la suerte, con la incertidumbre...
Por cierto, no me molestan tus tacos en mi blog, yo soy también algo taquera.
Y no quieras ser yo, seguro que cuando llegues a mi edad habrás viajado mucho más.
Besos, Manuel.

Anónimo dijo...

Necesitaría información técnica sobre si es correcto decir que España tiene ahora el 25% de opciones de ganar el mundial. Y sobre si es correcto decir que al comienzo tenía sólo el 3,125%, con lo cual ha aumentado sus opciones en un 800%. Gracias.

Manuel Amaro dijo...

Irene... estudiarse 70 temas sería una burrada, mi querida Irene. A pesar de ello, aún quiero ser tú. XD.

Anónimo... no suelo dar información técnica a anónimos, pero hoy te diré que un partido de fútbol no es un fenómeno aleatorio, con lo cual sería absurdo afirmar que la probabilidad que España tiene de ganar el mundial ahora mismo es un 25%. Sería así si los partidos se jugaran a cara o cruz.

Anónimo dijo...

Partiendo, en mi opinión, que las matemáticas NO son una ciencia exacta,la Probabilidad como parte de ella la verdad es que "acojona". Sobre todo cuando de 5 bolas al final sale sólo una y además es la última.
Qué sudores me entró, anda que a la "prota" que no pararía de resoplar. Saludos de J.L.

Manuel Amaro dijo...

J.L... A la prota le salió la cuarta bola, no la quinta. El efecto es el mismo: salió la dichosa bolita. Sobre la exactitud o no, siempre uno es libre de estudiarse 66 temas de los 70 y decirme entonces si ese 100% de probabilidad que le doy es o no exacto.

Anónimo dijo...

No niego el acierto de tu cálculo, lo único que afirmo , como antes, es que "acongoja" el goteo de bola a bola...
Bueno mañana nos vamos de "vacas"; que lo paseis todos muy bien y hasta la vuelta.
La "prota" y tú estais invitados.
J.L.

Asdi dijo...

Esto seguro que se lo ha pedido la señorita pianista para quedarse más tranquila, si lo sabré yo :P
También sirve la tabla para calcular cuántos años tardaré en sacarme la carrera? jajajaja
Es curioso el excel, yo sé hacer 3 pegoletes, pero no conocía lo del modelo hipergeométrico [que eso sí que suena a palabrota de las gordas jajaja]

Saludos de la guachizumbada :)

Anónimo dijo...

Bueno, ahora no me dirá que España tiene un 95 % de opciones de ganar el mundial, precisamente porque el fútbol no es aleatorio.

Anónimo dijo...

Al final, el pulpo Paul lo hizo mejor que cualquier modelo matemático.

Manuel Amaro dijo...

Asdi... a la señorita pianista le hago los cálculos, quiera ella o no.

Anónimo... ¿?¿? Tratándose de España, tiene el 100%. Y escribiendo esto después de acabar el mundial, ni te cuento.

Anónimo2... perdone usted, pero el pulpo Paul estudió estadística conmigo en la carrera.

Manuel dijo...

Algo no me cuadra. En el último párrafo dices que la probabilidad de que te salgan dos temas es del 33%, lo cual es el resultado de DISTR.HIPERGEOM(2;5;22;70)=0,3301

Hasta ahí bien, pero si aumentas el número de temas preparados de 22 a, por ejemplo, 40, la probabilidad se reduce (DISTR.HIPERGEOM(2;5;40;70)=0,2616) lo cual no tiene sentido. He hecho varias pruebas y a partir de cierto número de temas preparados se va reduciendo hasta llegar a cero.

Mi interés es conocer cuál es la probabilidad de que me toquen 2 o 3 temas, y todos los ejemplos que he visto lo hacen con la probabilidad de que toque un solo tema.

Manuel dijo...

Me respondo a mi mensaje anterior, creo que la probabilidad baja porque lo que calcula la función es la probabilidad de que EXACTAMENTE haya ese número de aciertos no de que AL MENOS haya ese número de aciertos.

Si aumenta el número de aciertos en la población (los temas preparados), la probabilidad de que EXACTAMENTE haya un cierto número de aciertos (que es lo que da la función) evidentemente bajará (y consecuentemente será más probable que haya más aciertos de esos que hemos establecido, pero esto no es lo que da la función).

Manuel Amaro dijo...

Bien contestado, Manuel.
Con ese 2 marcas que te salgan exactamente dos bolas, algo menos probable cuanto más temas hayas estudiado.
Si lo que quieres es "al menos" dos bolas, tendrás que sumar las probabilidades de que te salgan 2, 3, 4 y 5... aunque creo que ya has deducido tú mismo todo esto.
Eso sí... creo que en el nuevo formato de oposiciones vuelven a sacar dos bolas en vez de cinco, ¿no?
Un saludo.

Manuel dijo...

Efectivamente, deduje que para calcular la probabilidad de "al menos" 2 tenía que sumar la de que salgan exactamente 3, 4, etc. Para un temario de 78 temas, si quieres tener una probabilidad del 90% de que te salga un tema (al menos) de entre cuatro bolas hay que prepararse 34, pero para que te salgan dos (al menos) se va a 55 temas :S

Yo me presentaré a las opos de secundaria, y hay que escoger un tema sacados de dos bolas para temarios de <25 temas, tres bolas para temarios entre 25 y 50 y cuatro bolas si el temario es de más de 50 temas (como el mío, que tiene 78).

Hubo un borrador del sistema de acceso en 2011 que proponía que fueran dos bolas para todos e incluso que se extrajeran 6 epígrafes al azar de entre todos los temas, lo cual era una barbaridad, porque te obligaba a estudiarte casi todos los temas para garantizarte el aprobado, así que no se aprobó al final.

Anónimo dijo...

Muchas gracias por tu ilustración q me ha servido para tenr más control en mi proceso de preparación de la oposición