Probabilidades en la Asamblea

En el post anterior hemos demostrado, a regañadientes, que que la probabilidad de empate en 3030 votantes, cuando no hay conocimiento de la distribucion de voto (y por tanto se considera que puede tomar uniformemente cualquier calor en el intervalo [0,1]), da 1/3031=0.0329%. El gran problema de las demostraciones verbales de este resultado es que pueden inducir generalmente a errores muy terribles en otros calculos. Esto ocurre a la hora de considerar qué resultados, o “casos”, son equiprobables. La uniformidad no implica equiprobabilidad.

Un ejemplo curioso, en el que con el mismo hilo argumental conseguimos erroneamente la respuesta correcta, es el siguiente problema: la probabilidad de ganar en la apuesta de sacar cara tirando una moneda, de equilibrio desconocido, como máximo dos veces. Los distintos posibles lances del juego son

) saco cara y gano,
) saco cruz pero luego cara,
) saco cruz y cruz.

Como tengo tres casos, y dos de ellos me son favorables, la probabilidad de ganar es de 2/3.

¡El resultado es correcto! Pero el argumento es una mierda, es falso, esta asumiendo que la probabilidad de cada uno de esos tres casos es 1/3 cuando en realidad la del primero es 1/2, la del segundo 1/6 y la del tercero 1/3. Resulta que un medio y un sexto suman dos tercios, pero ha sido más suerte que industria.

Revisemoslo. Es facil ver que la probabilidad del tercero de los casos es 1/3. Si la probabilidad de sacar cara es “p”, dado que desconocemos cual es el valor concreto de p, integramos sobre todos los posibles y tenemos

P(cruz,cruz)=$\int_0^1 (1-p)^2 dp $ = 1/3

Bueno, este 1/3 sí que coincide con el del estimado “verbal”. Por supuesto, si supieramos que la moneda esta perfectamente equilibrada, no integramos sobre todos los posibles, sino solamente sobre p=1/2, la formula en ese caso seria, usando la delta de dirac

P^{1/2}(cruz,cruz)= $\int_0^1 \delta(p-0.5) (1-p)^2 dp$ = 1/4

Pero seria otro cantar. Volvamos al ejemplo y calculemos el segundo de los casos:

P(cruz, cara)=$\int_0^1 p(1-p) dp$= 1/2 – 1/3 = 1/6

Y por supuesto el primer caso

P(cara, cualquiera) =$\int_0^1 p \; dp$ = 1/2

Por cierto que aqui es donde comenta David Ruescas que suele ocurrir otro error, igualar el caso de p desconocida con el de p=1/2, porque para una tirada de una sola moneda (o para tiradas de multiples monedas todas diferentes) es correcto usar 1/2 como reflejo el desconocimento sobre esa moneda. No lo es cuando hacemos multiples tiradas de la misma ni, como en el caso de una votacion, cuando estamos extrayendo una muestra de una unica poblacion, cuyo porcentaje de opiniones, desconocido, equivaldria al p de la moneda.

Es posible, claro esta, hacer una argumentacion “verbal” correcta y decir que tenemos tres casos, 1′) cara y cara, 2′) cara y cruz y 3′) cruz y cruz, dada uno con una probabilidad de 1/3 cuando tomamos el valor de p desconocido. Pero asi de oido, el argumento es igual que el erroneo; lo que le da valor es calcular las integrales: las de 3′ ya las hemos hecho y da 1/3, obviamente lo mismo la de 1′, y la de 2′ s mas sutil pues ha de sumar dos “casos elementales”

P { caras=1, cruces=1 } =$\int_0^1 (p(1-p)+(1-p)p)) dp $ = 1 -2/3 = 1/3

Como era de esperar. Y naturalmente, con una moneda perfectamente equilibrada

P^{1/2}{ caras=1, cruces=1 }= $\int_0^1 \delta(p-0.5)(p(1-p)+(1-p)p))dp $ = 1/4 + 1/4 = 1/2

O con dos monedas desconocidas, por supuesto, seria otra historia:

P^{p,q} { caras=1, cruces=1 } =$\int_0^1 \int_0^1 (p(1-q)+(1-p)q)) dp\;dq$ = 1/2

El señor que propuso este ejemplo y el razonamiento incorrecto que sin embargo daba en una situacion peculiar la solucion correcta (esto es, para una moneda de propiedades desconocidas, pero no para una moneda equilibrada) fue un asambleista revolucionario, un tal D’Alembert. De hecho, intentó añadir a la seccion de “Probabilite” de la Enciclopedia unas cuantas paginas con lo que el veia como paradojas del calculo de probabilidades -más complicadas que esta- pero Diderot le obligó a quitarlas. Con el tiempo, y una vez llegó a tener conocimiento de los escritos de Bayes, D’Alembert suavizo sus posturas, pero al parecer este ejemplo todavia se quedo en la memoria de su discipulo Laplace, que lo empleó en las paginas de introduccion a sus leyes de la probabilidad.

Podeis leer más de la historia de D’Alembert y sus problemas con la probabilidad -no son el tema principal que tocamos aquí- en este trabajo de historia de Michael Paty. En cuanto al texto de Laplace, aunque esta disponible en la wikipedia, quizas sea interesante ponerlo aqui mismo. Tened en cuenta que Laplace esta simplemente hablando del caso con una moneda bien equilibrada y que se limita a referirse a su maestro de pasada, sin concretar las circunstancias concretas. Simplemente he tomado este mismo ejemplo porque parece el mas sencillo con p en una distribucion uniforme pero tres casos no equiprobables.

Principes généraux du Calcul des Probabilités.

I^er Principe.Le premier de ces principes est la définition même de la probabilité qui, comme on l’a vu, est le rapport du nombre des cas favorables à celui de tous les cas possibles.

II^e Principe.Mais cela suppose les divers cas également possibles. S’ils ne le sont pas, on déterminera d’abord leurs possibilités respectives dont la juste appréciation est un des points les plus délicats de la théorie des hasards. Alors la probabilité sera la somme des possibilités de chaque cas favorable. Éclaircissons ce principe par un exemple.

Supposons que l’on projette en l’air une pièce large et très mince dont les deux grandes faces opposées, que nous nommerons croix et pile, soient parfaitement semblables. Cherchons la probabilité d’amener croix, une fois au moins en deux coups. Il est clair qu’il peut arriver quatre cas également possibles, savoir, croix au premier et au second coup ; croix au premier coup etpile au second ; pile au premier coup et croix au second ; enfin pile aux deux coups. Les trois premiers cas sont favorables à l’évènement dont on cherche la probabilité, qui, par conséquent, est égale à $\scriptstyle {\frac {3}{4}}$ ; en sorte qu’il y a trois contre un à parier que croix arrivera au moins une fois en deux coups.

On peut ne compter à ce jeu que trois cas différens, savoir : croix au premier coup, ce qui dispense d’en jouer un second ; pile au premier coup et croix au second ; enfin pile au premier et au second coup. Cela réduirait la probabilité à $\scriptstyle {\frac {2}{3}}$ , si l’on considérait, avec d’Alembert, ces trois cas comme également possibles. Mais il est visible que la probabilité d’amener croix au premier coup est $\scriptstyle {\frac {1}{2}}$ , tandis que celle des deux autres cas est $\scriptstyle {\frac {1}{4}}$ ; le premier cas étant un évènement simple qui correspond aux deux évènemens composés, croix au premier et au second coup, et croix au premier coup, pile au second. Maintenant, si, conformément au second principe, on ajoute la possibilité $\scriptstyle {\frac {1}{2}}$ de croix au premier coup, à la possibilité $\scriptstyle {\frac {1}{4}}$ de pile arrivant au premier coup et croix au second, on aura $\scriptstyle {\frac {3}{4}}$ pour la probabilité cherchée, ce qui s’accorde avec ce que l’on trouve dans la supposition où l’on joue les deux coups. Cette supposition ne change point le sort de celui qui parie pour cet événement : elle sert seulement à réduire les divers cas à des cas également possibles.

2 Comments

Manuel Vilches Pacheco says:

January 5, 2016 at 12:50

El resultado (sí, lo que sea) no es equiparable a los resultados concretos (sí, sí) (no, no). La distribución binomial no distingue el orden en el que los resultados aparecen, solo el resultado final.

Es sin duda un aporte interesante desde el punto de vista de historia y concepto en estadística, pero a mi entender solo añade confusión al hecho que se discutía, restando relevancia al error, este sí dramático, de considerar p=0.5 para el caso de no información, y que fue el argumento empleado para descalificar al profesor Bilbao en las redes.
Manuel Vilches Pacheco says:

January 5, 2016 at 12:40

Pues tengo que discrepar, al menos en parte.

Por supuesto, no puedes hablar de equiprobabilidad si vas a definir los sucesos como te parezca, sobre todo si defines sucesos que no son disjuntos, es decir, cuyas probabilidades no suman la unidad pues resulta evidente que unos incluyen, al menos en parte, a otros.

Cuando el ejemplo de la moneda lo pones “negro sobre blanco” como dios manda, tenemos tres resultados posibles: 2 caras, 2 cruces y 1 cara/1cruz, y cuando p es desconocido y por tanto debemos realizar la integral para p entre 0 y 1, estos tres posibles resultados son equiprobables. Probabilidad de empatar: dos lanzadas, tres eventos equiprobables, solo uno es empate, probabilidad 1/3. ¿me equivoco?

Volviendo al asunto, la pregunta ¿que probabilidad hay de empatar a 1515 en ausencia de información? tiene una respuesta: hay 3031 combinaciones si/no equiprobables y solo 1 es empate, por tanto 1/3031. Justificar por qué esas integrales hacen los resultados equiprobables no cabe en un tuit, el hecho de que lo son, sí. Y el cálculo, por supuesto, aplicación de Laplace, que puede utilizarse para estimar a posteriori a partir de los resultados de un muestreo, o a priori con el espacio de configuraciones. La respuesta de Bilbao fue impecable. No entiendo la insistencia en lo contrario.

This site uses Akismet to reduce spam. Learn how your comment data is processed.

2 Comments

Leave a Reply