Distribución exponencial y curvas de Lorenz

La curva de Lorenz de una distribucion da una idea de la desigualdad entre nodos ricos y nodos pobres, representando la tipica frase “el xxx% de la poblacion posee el yyy% de la riqueza”, que hemos usado en las tablas de los posts anteriores. A partir de ella se puede considerar el índice de Gini, que viene a ser el area entre esta curva y la diagonal.

Una cosa curiosa de una distribucion exponencial, digamos para riqueza media \(k_m\),

\(p(k)= {1 \over k_m} e^{- {k\over k_m}} \)

es que la curva de Lorenz tiene en si misma cierta invarianza de escala, pues es independiente del parametro que gobierna la exponencial. Esto me pilló de sorpresa el otro dia y lo he calculado lo menos cinco o seis veces; de hecho es un ejercicio muy majo y rápido para poner en los problemas de integrales del bachillerato. De todas formas el resultado esta directamente en la wikipedia; el porcentaje R de riqueza poseido por el porcentaje P mas pobre de la poblacion es:

\(R(P)=P + (1 – P) \ln (1-P)\)

Y, claro, esto significa que el coeficiente de Gini es tambien independiente de la riqueza media de la exponencial; es siempre igual a 0.5.

A nosotros nos interesa más bien el porcentaje Y de riqueza poseido por el porcentaje X mas rico de la población, dado que estamos estudiando sobre todo la parte extrema de la distribucion. Obviamente Y=1-R y X=1-P, asi que

\(Y(X) = 1-R(1-X) = X (1 – \ln X)\)

Que es el resultado al que -todavia misteriosamente- parecen converger los dos primeros experimentos de los posts anteriores. Fijaos que esta función es la integral del logaritmo, usease que se da el caso de que la “densidad porcentual” de riqueza es

\(Y'(X) = – \ln X\)

Lo que me lleva a la confusión de llamar de cuando en cuando “distribución logaritmica” a la exponencial, pero es una nomenclatura de la que me estoy corrigiendo (no ocurre lo mismo con el llamar “porcentajes” al tanto por uno, que es lo que he estado haciendo en todo este post, y no tiene visos de cambiar, porque ademas de sonarme muy pedante no esta el simbolo directamente en el teclado)

En general, es curioso esto de pensar en distribuciones de riqueza con la exponencial; es como si la probabilidad de tener un dinero en el rango (el “bin” o cesto) Xn fuera de algun modo proporcional directamente a la probabilidad de tener un dinero en el bin anterior Xn-1. Y los estadisticos tienen un montón de distribuciones alternativas para encajar empiricamente los casos extremos, tirando de Gamma o de Weilbull.

precios fantasma

“Red Plenty”, en castellano “Abundancia Roja“, es una novelización de la historia de la teoria de optimización de Kantorovich, y en general de cómo se produjo el fracaso de los planes quinquenales, que poco a poco fueron frenando su impulso hasta agotarse a la entrada de los setenta, dejando esa URSS anclada en una especie de versión atea de la España de las peliculas de José Luis López Vázquez. Me entere de la existencia de la novela a partir del comentario que Three-Toed Sloth escribio para el seminario de The Crooked Timber, y desde luego que el comentarista, Cosma Shalizi lo borda.

En cuanto al libro en si, casualmente lo he leido en paralelo con otro que emplea la misma tecnica, “Estrella de la Mañana”, sobre Lawrence de Arabia y la implicación inglesa en el nacimiento de los estados arabes. Y seguramente por esta comparación, la parte narrativa se me ha hecho flojica, y eso que los Wu Ming no estan en su mejor forma.

La impresión, mas que una novela, es la de un libro del que hay que aprender algo. Yo no he sacado exactamente diez cosas, y algunas ya las habia aprendido en el viaje de estudios a Minsk en 1988; entonces sufrimos unos cuantos amigos en persona la dificultad de conseguir que un comercial sovietico te venda algo, por mucho que este en existencia y expuesto en el escaparate. En el libro se cuenta una de las paradojas de la fijación arbitraria de precios y objetivos: ocurre que una versión nueva de una maquina puede tener un precio inferior al modelo anterior; si el fabricante necesita cubrir un objetivo de ventas, intentara pues vender el modelo caro: el viejo –entiendase, ninguno de los dos esta en stock, los dos deben construirse–. El punto esta en que aunque el comprador este dispuesto, pues conoce las especificaciones de cada modelo, a pagar el mayor precio por el nuevo, ¡es necesario conseguir que contrate el viejo, porque no se le puede vender el nuevo modelo al precio mayor!

Spufford le da mas importancia a otra consecuencia de la fijacion arbitraria de precios: la matanza de Novocherkassk en 1962, causada por un aumento del precio de una carne que, se habia razonado, de todas formas estaba practicamente fuera de stock y por tanto igualmente inalcanzable para la mayoria de la población. Si cualquier comunista esta ya convencido de principio sobre el error de poner precio a las cosas, sucesos como estos desde luego refuerzan el convencimiento.

‘Oh, Profesor’, he said. ‘You have no idea what the wrong price can do’.

Y en ese panorama llegaban las ideas de Kantorovich, sugiriendo que la ignorancia, a la hora de repartir y asignar recursos, sobre los aspectos microscopicos de cada paso de producción podia solucionarse empleando tecnicas de curvas de oferta y demanda. ¡Precios! Sí, calculados por ordenador y ábaco, trabajados matematicamente y sin especuladores, pero sospechosamente precios al fin y al cabo. Y sin posibilidad de intervenirlos, hacia arriba o hacia abajo, por necesidades políticas.

Por lo que cuenta el libro, lo que se llegó a hacer, al final del plan, fue aceptar los argumentos sobre las ventajas de la contabilidad de precios, de las ventas, a la hora de fijar objetivos, y no dejar que una fábrica produjera tropecientas mil toneladas de acero, o que un tren transportara tantos millones de toneladas por kilometro, sin que nadie los necesitara, sólo por cumplir el objetivo. Pero sin llegar a implementar el cálculo matematico de estos nuevos objetivos ni de los valores unitarios de los productos; todo ello quedó en manos de los artistas del Gosplan, artesanos.

Tambien es llamativo el destino de la informática sovietica, que a la larga fue sustituida por la mera copia de máquinas de IBM con diez años de retraso. Spufford nos hablá, ya en las notas finales, de los informáticos de los sesenta en la ciudad de Akademgorodov y de las becas y los desarrolladores del colectivo “Fakel”. Me pregunto si el Chaos Computer Club aleman es una oscura referencia al Kofeinyi Klub Kibernetiki.

Apple vs el boton único de Samsung

Parece que Apple esta ganando algunos juicios de patentes respecto a sus tablets y móviles:

http://www.meneame.net/story/irregularidades-veredicto-apple-frente-samsung

Naturalmente, se esta aprovechando la confusión, no se si debido a la legislacion USA,
entre patentes como registro de propiedad intelectual y patentes como registro
de la propiedad industrial. Estas ultimas no estan lejanas del registro de marcas,
y asi como a cualquier empresa se le reconoce el derecho a no sufrir marcas clonicas,
sea Caca-Cola, Soni, o Samsong misma, pues tambien es razonable el derecho a mantener
la imagen del producto. En cierto modo defiende tambien al comprador, pues se asume
que la copia de la propiedad industrial tiene un componente de intentar engañar
a la hora de la compra.

Las patentes de “software”, de supuesta propiedad intelectual, son otra cosa, y nada bueno
se puede decir de ellas, sea la accion de hacer zoom en una pantalla tactil multitouch,
o la de actualizar cuando llegas al final de la pantalla. No parece que el I+D invertido
para darte cuenta que conviene actualizar un scroll merezca ser premiado con un
monopolio de 20 años sobre esa idea. Claro que podria ser peor, y podrian llegar
a monopolizarlo por la vida del autor mas 75 años.

Ahora, me ha llamado la atencion una patente que esta entre medio
y que además ha generado el caos en el diseño de aplicaciones android:

Patente D593.087: bordes redondeados y botón de inicio.

Supongo que la D significa “Diseño”, y no se sí por “de inicio” se refieren
al lateral de on-off, que seria raro que pudieran alegar copia, o al
frontal de “inicio/home”, que en los ultimos diseños de Samsung ha ido evolucionando
a parecerse cada vez mas sospechosamente al de Apple. Y de esto es de lo que queria
hablar, porque es cosa curiosa el empeñarse ahora
en tener un solo botón y no tres.

En cierto modo lo que se ha repetido aqui es
el antiguo debate entre los ratones de tres botones (Xerox) y los de un solo
boton (Apple), que Microsoft “soluciono” con sus ratones de dos botones. Parece
una decisión “de diseño”, pero naturalmente hay que crear una homogeneidad de
uso, y asignar funciones al boton derecho y al boton izquierdo (el copy/paste
del boton central ha sido siempre una de las maravillas de Xwindows).

Y el
caso es que con android ya habia una asignacion de funciones, con los
botones de “menu” “inicio/home” y “back”, que empezó a ir camino del desastre a
la hora de interpretar el boton “back”, y que el caprichito de copiar
a Apple y quedarse con un solo botón ha terminado por destrozar, de forma que
los desarrolladores ahora no saben que funciones poner en el boton de menu o
cuales llevarse a la nueva barra superior de menus del Android 4.

No se que fue peor, si poner tres botones por diferenciarse o volverlos a quitar
para parecerse. A fin de cuentas lo primero era una decision logica en el mundo
de los telefonos moviles: En casi todos tenemos esos esos botones izquierdo y derecho que cambian
de función segun el estado del movil, como si fueran las teclas auxiliares
de una HP 48 (idea que a lo que se ve HP nunca patento, o quizas simplemente ya han vencido los años).
Pero una vez acostrumbrados a los tres botoncicos, lo de hacernos volver al boton
unico ha sido una traicion a usuarios y a desarrolladores. Y casi que merece su
castigo.

Ley de potencias para los más ricos?

Igual no se trata tanto de que los ricos juegen en otra liga a la hora de repartir, sino de que la distribución de valores altos es invariante de escala, y no una simple bajada exponencial.
Por cierto, que he de dedicar al menos otro post a las distribuciones que hemos usado antes, y a la propia cuestion de cómo y cuándo las exponenciales sacan condiciones del tipo “el x por ciento de los individuos posee el (1-log x) x de la riqueza”. Me lo apunto.

Al grano. Un articulo de introducción rapida a todas estas distribuciones, que ademas analiza como ejemplo la lista de millonarios de Forbes, es el de Newman “Power laws, Pareto distributions and Zipf’s law“. Tambien, la mayoria de los textos sobre networks suelen llevar alguna descripción; por ejemplo la seccion 2.3.5 de “Complex networks: Structure and dynamics” (uno de sus coautores pertenece al BIFI, asi que esto es propaganda encubierta;-).

La clave de estas distribuciones parece ser combinar preferential attachment “el rico se hace mas rico” con crecimiento “siempre hay pardillos nuevos”. Normalmente se define el tiempo de manera que el crecimiento de la poblacion es constante. Esto saca algunas cosas chocantes en comparacion con los timos, digo con la economia real, porque un nodo va a mejorar de forma tipica con alguna raiz (cuadrada, etc) de ese tiempo. Pero a la hora de hacer calculos se entiende mejor, y a fin de cuentas a lo que vamos es al resultado asintotico.

Pues bueno, lo que se me ha ocurrido es agarrar el python y preparar el siguiente programa:

reparto=10
while True:
  for i in xrange(reparto):
    concede=randint(1,total)
    x, ticks =-1,0
    while ticks < concede:
      x+=1
      ticks+=cantnum[x] # cantidad[x]*numero[x]
    numero[x]-=1
    cantnum[x]-=cantidad[x]
    if (x>0):
       numero[x-1]+=1
       cantnum[x-1]+=cantidad[x-1]
    else:
        numero.insert(x,1)
        cantnum.insert(x,cantidad[x]+1) #ojo, antes de modificar cantidad!!
        cantidad.insert(x,cantidad[x]+1)
    total+=1
    #ahora anadimos un nuevo nodo con cantidad 1
    x=len(cantidad)-1
    numero[x]+=1
    cantnum[x]+=1
    total+=1
  reparto=(reparto*2)%1000000 

Connes-Lott … y Coquereux y más gente.

He mencionado un seminario en Karpatz. No se si sabreís que esta escuela se celebra en Febrero. Allí fuimos Jose Luis Lopez y un servidor, en tren hasta la frontera con Polonia, o Silesia o como se llame, y en un autobus hasta la nieve, que salimos del bus con ropa de verano en medio de lo que parecia una tempestad.

Total, que entre otras charlas había una de Robert Coquereaux sobre Geometría No Commutativa para modelar el Higgs, con unos ejemplos triviales practicamente de matrices 2×2, y me quede convencido. El año de Leipzig mis apuntes de la charla de Connes se habian limitado a dos lineas: el título y una nota: “parece interesante”.

A la vuelta, ¡resulto que el departamento acababa de reclutar a dos investigadores que trabajaban en ese tema! Pepe Gracia-Bondía y Joe Varilly, que pasearon por medio mundo su  “preprint amarillo“. Poco despues, en el verano de 1995, Connes organizaba una sesion de los cursos de verano de Les Houches sobre el tema, y presentaba un nuevo concepto, “reality”, que simplificaba mucho el formalismo. Así que allí acudí y fue un mes bastante intenso, con los nuevos resultados e incluso alguna que otra esperanza, que no cuajo, de acabar encontrando una simetria de quantum group… quizas para las generaciones, pero no lo juraria.

Un resumen de aquellos primeros diez años de geometria no conmutativa podeis consultarlo, de manera bastante incomoda, aqui:
http://dftuz.unizar.es/~rivero/research/ncactors.html

Mis intentos de investigación personal fueron bastante malos; preparé un articulo, hep-th/9605006, sobre la posibilidad de incluir otro boson Z’, pero me desanimé despues de que una crítica bastante contundente de Joe. Mejor terminó el intento de sacar algo en claro del “Tangent Grupoid”, porque se pusieron manos a la obra Pepin, Jesus y Eduardo y finalmente salió un report publicable, aunque con muchas manos para tan poco tema. Lo que a mi me preocubaba del grupoide tangente era su aplicación pata entender la discretización del espacio y por ello de las derivadas. Pensaba que en esa ambiguedad de la derivada no sólo podia encerrarse la ambiguedad en las reglas de cuantización (conmutadores, etc) sino tambien la justificación para necesitar al menos tres generaciones, asociada al hecho de que necesitabamos obtener al menos derivadas segundas en mecanica clásica. Algo de esto lo conté en un borrador hep-th/9804169, y la cuestión de como funciona esta discretización se convirtio en uno de mis motivos subsconcientes -o no tanto-.

Parte del estudio del grupoide tangente lo incorporó otro de los coautores senior, Joe Varilly, en las lecciones que estuvo dando en Monsaraz, en el Alentejo de Portugal. Allí colaboré como tutor, con poco trabajo de mi parte; no había aparecido ninguna posibilidad de hacer estancias de postdoct en este tema y preferí pasar a trabajar en la empresa privada. Posiblemente no fué demasiado buena idea. Es dificil pensar algo de calidad mientras estas currando en cosas diversas; por ello la investigación “amateur” no es una opción demasiado recomendable.

Por cierto que lo de usar NCG para determinar el modelo estandar no es tema cerrado, y hablaré de ello en otros posts. Este año ha habido un par de publicaciones dandle vueltas a las predicciones que se pueden obtener cuando el flujo de renormalizacion se mete por medio:

Ali H. Chamseddine, Alain Connes “Resilience of the Spectral Standard Model
Christopher Estrada, Matilde Marcolli “Asymptotic safety, hypergeometric functions, and the Higgs mass in spectral action models