asortatividad del crimen

Seria interesante construir alguna red de relaciones entre criminales y ver si se forman grupos con alta modularidad, pero esta nota es solo para recordar que acaba de salir un articulo que sin ser propiamente de estudios de genero trata del asunto de los asesinatos entre hombres y mujeres. Se trata del Informe sobre el homicidio 2010-2012. Toda la prensa se ha hecho eco de una de las tablas de contingencia que se deduce del texto,

Casos con...Victima HombreVictima Mujer
Homicida Hombre6228
Homicida Mujer73

Es una tabla dicotomica muy sencilla y por tanto podemos echarle encima todas las medidas de asociacion típicas, incluso coeficientes particulares para variables binarias. Pero claro, es una tabla asimetrica, asi que va a haber multiples interpretaciones segun la forma en la que se empleen los subtotales marginales para normalizarla.

Asi, la Y de Yule es -.0131, y la Kappa de Cohen (el parametro al que normalmente se le llama asortatividad) es  -.0057; ambas indican una anticorrelacion practicamente compatible con cero.

Este es un problema de las tablas asimetricas, o en general de las redes orientadas: los parametros de asociacion pueden venir bien para detectar correlacion o anticorrelacion pura, pero nunca esta claro si estan detectando la suficiente asimetria. Aqui la suma de marginales es 90 contra 10 para homicidas, y 69 contra 31 para victimas. Muchas medidas de asociacion toman ya estos marginales como dados, y en efecto con estos datos la probabilidad H->M por ejemplo es 90 * 31 /100 = 27.9, practicamente similar al valor en la tabla. No todas; para que la asimetria se refleje en el coeficiente, algunas medidas optan por promediar antes los marginales, digamos en este caso 79,5% H y 20.5% M, lo que daria para la probabilidad H->M un 16.3% y aqui ya se aprecia diferencia respecto al 28% de la tabla de contingencias. El problema es que cuanto mas enredas con todo esto para hacer el coeficiente más descriptivo, más complicas el calculo del error.

Parece que para el caso de tabla dicotomica la asortatividad mide la discriminacion escondida, mientras que los marginales muestran las discriminaciones explicitas. Para el caso que nos ocupa, practicamente toda la discriminacion se ve ya en los marginales. Podriamos tener tablas con igualdad perfecta 50/50 en “homicidas” y tambien 50/50 en “victimas” donde los miembros del mismo grupo tendieran a protegerse entre ellos, o a atacarse entre ellos; entonces la correlacion o anticorrelacion la detectarian estos coeficientes de asociacion. Por ejemplo supongamos las siguiente dos tablas, ficticias pero con los mismos totales marginales que la original

69 31
90 69 21
10 0 10
69 31
90 59 31
10 10 0

El coeficiente Y vale 1 en la primera, y -1 en la segunda. Esta tendencia asortativa o disortativa la detecta tambien Kappa, aunque con valores mas modestos, .397 en la primera tabla, -.178 en la segunda. Los casos extremos para Kappa son dificilies de alcanzar, exigen que practicamente se reduzca al coeficiente pi de Scott; la discusion sobre si esto es un defecto o una virtud esta viva en la literatura desde que Cohen redescubrio esta medida de homofilia en los años sesenta.

Por cierto, comentando esta mañana la noticia en el laboratorio otro compañero ha sugerido que posiblemente la agregacion de los datos hacia que se perdiera parte de la información. Ciertamente desagregarlos es un problema, porque nos quedamos con tablas con muy pocos casos y su error puede ser grande; no obstante dado que el informe presenta esa desagregacion podemos calcular Kappa e Y y ciertamente se notan diferencias. Los homicidios de pareja son ciertamente disortativos, pero tambien lo son las parejas en general (los matrimonios en el 2012 tenian un Kappa de -0.955, y aunque le sumemos parejas no declaradas es dificil que baje de -0.9) . Los homicidios de familia son neutrales, y los de conocidos y vecinos muestran mas homofilia que los laborales o comerciales.

relacionH?HH?MM?HM?MYKappaN=
Conocido/vecindad197211650,2630,128239
Amistad390211,0000,48142
Pareja43881-0,794-0,34451
Cónyuge05340-1,000-0,15057
Expareja12650-1,000-0,35532
Separado/divorciado01400 0,00014
total pareja+ex+s/d5131171-0,910-0,242154
Familiar49411713-0,023-0,018120
Laboral/comercial205210,1720,09328
Escolar0001 1
Ninguna1322250-1,000-0,054159
Otra4714540,2420,15170
se desconoce48720-1,000-0,05857
Total5372416626-0,033-0,015870

One Comment

  1. Igual conviene comentar que cuando el grafo es dirigido se pueden inventar un monton de variantes del modelo “Determinante dividido entre normalizacion”. La Kappa de Cohen vista desde esa perspectiva es la normalizacion mas complicada, el promedio (hombre_fila x mujer_columna + hombre_columna x mujer_fila). Si se piensa que lo mas relevante es la fila o la columna se puede obviar el producto y tomar solo datos de ese marginal; esto es por ejemplo lo que hacia Strumia en el grafo de citas.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.