Los numeros de Podemos en appgree

Lo cierto es que es impresionante para una app de colaboracion tener canales con mas de diez mil usuarios. La que estamos desarrollando nosotros, thinkhub, (que hemos probado esta semana en las II jornadas de divulgacion innovadora y hace unos meses en el Sonar) tiene la prueba de fuego la semana que viene con solo unos cuantos centenares de alumnos, y nuestro experimento del dilema del prisionero mantuvo simultaneamente 1230 personas y en su tiempo lo llamamos “el mayor experimento socio-económico online”.

A fecha de hoy, el Appgree de “Podemos en los medios” tiene 14891 seguidores y “Podemos” tiene 47.544. Viene a ser la mitad de los seguidores telematicos; la web de podemos.info “#?ASAMBLEACIUDADANA?” tiene unos 130000 inscritos. Son numeros comparables a la movilizacion total que tuvo el #15m en las redes, por ejemplo unos ochenta mil usuarios en twitter, y por lo visto tanto en el 15m como en la elecciones europeas, estos numeros se reflejan en bastantes mas en la calle.

Bueno, de estos cincuenta mil instcritos ¿cuantos han votado hoy activamente, para hacer preguntas? Espero que los desarrolladores de appgree den datos mas concretos. Pero es de agradecer que permiten ver el total de participantes y el numero de votos de algunas respuestas.

Durante la seleccion de preguntas, 2461 participantes, se seleccionaron las 20 mas votadas, la primera tenia 177/216, la vigesima 99/136 (un 72% de votos).

Por comparacion, el barometro del CIS suele tener 2500 participantes, pero todos estan obligados a contestar todas las preguntas. Asi que el metodo de podemos en Appgree alcanza al barometro en cuanto a tamaño del grupo total pero se queda corto para cada pregunta.

a las 12:56, “que saludo” tuvo curiosamente mas participantes, 3833 personas, y la mayor respuesta fue bastante mas minoritaria, 228/365.

a las 22:51, durante toda la tarde, 2870 personas en la respuestas a ¿que cosas se podrian mejorar? La mayor respuesta obtuvo 300 positivos de 341 votos, la siguiente 282 de 330.

Por otro lado hay dias o preguntas en las que apenas participan un par de cientos, por ejemplo el dia 17, “que os gustaria que pasara en el encuentro?” tiene 180 participantes, la primera respuesta 72/78, la decima 43/57

¿Y que cosas podria mejorar Appgree, digo yo? Un problema es el tiempo que se tarda en conocer la tasa de descarte y que las rondas de eliminacion hayan descartado preguntas que en realidad tenian todavia una probabilidad apreciable de estar por encima de esa  tasa. Si una pregunta puede entrar con un 72% de votos, incluso preguntas de 75% tienen una probabilidad alta de tener rafagas de dos o tres votos negativos, y estas rafagas las descartan si ocurren en primera o segunda ronda. Asi que segun se va conociendo el porcentaje autentico de la puntuacion de corte deberian recuperarse preguntas que han sido descartadas por simple fluctuacion estadistica. Naturalmente esto alarga las rondas de votaciones, claro.

En cuanto a la comparacion con metodos tradicionales de encuesta, quizas se podrian plantear una o dos preguntas de “calibracion”, lanzadas a toda la muestra, entremezcladas entre las repescas.

5 Comments

  1. Hola Andrea, gracias mil.

    ¿Donde teneis la sede? Zaragoza nos pilla cerca de casi cualquier sitio, asi que igual podemos quedar algun dia.

    Por cierto, que me parece haber oido que estabais usando scala para el lado del servidor o algo asi.

  2. Hola Alejandro. Soy Andrea Bontempi, responsable de comunicación de Appgree y he encontrado muy interesante tu artículo, las reflexiones que haces son muchas de las que en su momento nosotros hicimos y nos seguimos haciendo. Muchas de las dudas que te surgen te la podríamos explicar nosotros mismos si quieres. Nosotros felices de contarte y escuchar sobre el proyecto en el que te embarcaste thinkhub. Además siempre nos viene bien escuchar a cabezas pensantes externas a Appgree 🙂

    Cuando quieras hablamos.

  3. Otra mejora que se me ocurre es detectar esos cisnes negros (respuestas que se les han ocurrido a pocas personas pero que han tenido bastantes votos) durante la repesca . Para ello habria que clusterizar primero las respuestas por Levenshtein, calcular una puntuacion de votos recibidos por cada cluster, y localizar clusters pequeños en tamaño pero con buena puntuacion. Idealmente, clusters de un solo nodo, aunque si son varios nodos siempre se puede escoger por z-score o similar el mas representativo.

    Ojo, que esto aun no cubre el hecho de que esos clusters pequeños pueden haber tenido mala puntuacion -o buena- ya de partida por las fluctuaciones, y en el caso de fluctuacion a peor haber sido eliminados demasiado pronto. Ver los clusters de Levenshtein completos ayuda a decidir la repesca pero aun hay que hacer bastante estimacion estadistica.

  4. Estaria bien tener una tabla o un grado donde aparecieran todas las preguntas con dos parametros: distancia entre preguntas igual a la de Levehstein, y area del nodo proporcional al total de votos recibidos. Eso nos permitiria visualizar si hay coordinacion de ideas a la hora de responder y ver que tal rendimiento tienen los “cisnes negros” e ideas brillantes que no se aproximan a ninguna otra.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.