martes, 10 de febrero de 2015

La Wikipedia, ¿cosa de hombres?

Las grandes mujeres están bien representadas en la enciclopedia pero los artículos sobre ellas presentan desigualdades de género, según un estudio de las principales ediciones de la Wiki

 Solo en contados casos, las referencias a su condición de mujer son relevantes en la biografía de las grandes mujeres como es el de Marie Curie, esposa de otro físico y madre de otra premio Nobel. / Wikipedia./elpais.com

Muchas mujeres sufren discriminación en el trabajo, en la política, en la economía y en las relaciones personales. ¿La Wikipedia reproduce también la desigualdad? Un estudio sobre la presencia femenina en los artículos de la gran enciclopedia de este tiempo revela que están bien representadas en la cantidad de los artículos. Pero el análisis de los mismos desvela sesgos de género. En las piezas sobre las grandes mujeres, destacan las referencias a su condición de mujer, lo que no sucede con los hombres.
La Wikipedia la usan millones de personas sin apenas diferencias entre sexos. Sin embargo, de los 300.000 editores que han modificado alguno de sus artículos al menos 10 veces, solo entre el 9% y el 15% (según los estudios) son mujeres. Consciente de que esta diferencia podría afectar al contenido de la enciclopedia, la Fundación Wikimedia ha puesto en marcha varias iniciativas para cerrar la brecha de género. No lo ha conseguido del todo.
Partiendo de esa desigual aportación de base, un grupo de investigadores ha analizado la presencia de las mujeres pero no en la edición sino en los artículos de la Wikipedia. Para comparar con la vida real, entresacaron una lista de más de 100.000 grandes hombres y mujeres de la historia de tres bases de datos diferentes, Freebase, el proyecto del MIT, Pantheon, y la lista de los grandes logros de la Humanidad recogida en el libro Human Accomplishment, del politólogo e historiador, Charles Murray.
En los artículos sobre hombres, las palabras sobre su género apenas son el 1%. En las mujeres, el 30%
Los investigadores, de varias universidades centroeuropeas, midieron la presencia de la mujer en la Wikipedia con cuatro análisis diferentes. Dos más cuantitativos buscaban saber cuántas de las grandes mujeres se han merecido un artículo en la enciclopedia y si algunas de ellas aparecían en la Wikipedia:Today's featured article, una sección de la web que cada día destaca un artículo por su relevancia. Otros dos análisis cualitativos midieron la red de conexiones entre los artículos y su contenido para buscar sesgos de género.
"El resultado es que en unos casos los sesgos son más fuertes, y en otros son más débiles e incluso se están reduciendo", dice el investigador del Instituto Federal de Tecnología de Zúrich (ETH) y coautor del estudio, el español David García. "Los sesgos más fáciles de ver a simple vista, como si hay páginas de mujeres en la pagina principal o si esas páginas tienen buena calidad, se están corrigiendo y son menores que en otras referencias enciclopédicas", añade en alusión a los análisis cuantitativos.
La lista de personajes de Freebase analizados, por ejemplo, incluye a más de 100.000 y solo unos 12.000 son mujeres. De los 11.327 artículos de Pantheon, apenas 1.500 se referían a una mujer. En el caso del libro de Murray, la distancia es aún mayor: 3.578 hombres por 83 mujeres. En la Wikipedia, en cambio, y para sorpresa de los investigadores, la proporción de mujeres referenciadas aunque aún inferior a la de los hombres es hasta un 15% mayor que en las tres bases de datos.
También midieron la extensión de los artículos y vieron que, en general, las entradas sobre mujeres en la Wikipedia eran más largas que las de los hombres. El análisis lo realizaron con las seis ediciones de los principales idiomas europeos, entre ellas la edición en español. Mientras que en la edición inglesa o en la alemana, el sesgo en favor de los hombres se mantenía, en las ediciones latinas (francés, italiano y español), las referencias a personajes femeninos superan a las que aparecen en las bases de datos comparadas.
Los sesgos más sutiles, como el uso de palabras sobre el género o las tendencias de enlaces, son todavía cosa de hombres", dicen los autores
Lo mismo sucede con los artículos destacados en la portada de la Wikipedia. Aunque la mayoría se refieren a acontecimientos históricos y no a personajes, cuando destacan a alguno, la ratio de hombres y mujeres ronda el 60:40, muy cerca de la paridad. Como escriben los autores, "esto posiblemente sea el resultado del esfuerzo de los wikipedianos por mejorar la cobertura de las minorías, en este caso, las mujeres".
Pero, al afinar el análisis la desigualdad reaparece. "Los sesgos más sutiles, como el uso de palabras sobre el género o las tendencias de enlaces, son todavía cosa de hombres", comenta el investigador español. En cuanto a los enlaces, los científicos estudiaron dos aspectos claves en la teoría de redes. Por un lado, la centralidad de un nodo (en este caso, el artículo sobre un personaje). Los más relevantes tienden a recibir más enlaces, mientras que los menos, aparecen en la periferia de la red. Por otro lado, está lo que llaman asortatividad, "una propiedad de las redes en las que nodos de cierto tipo tienden a conectar entre ellos", explica García.
En la Wikipedia encontraron asortatividad de género. Las páginas de hombres tienden a enlazar a páginas de hombres y las de mujeres a las de mujeres. Pero en su análisis, publicado en el repositorio científico Arxiv, vieron que un enlace que llega al artículo sobre un hombre tiene más probabilidad de proceder de un artículo sobre una mujer que al revés.
El último análisis fue el de las palabras. "Para analizar el texto usamos una técnica de lingüística computacional que detecta las palabras que predicen clases de textos. En este caso la clase es si la página es sobre un hombre o una mujer, y los términos más discriminantes son los que ayudan a un predictor automático a saber solo con el texto si la página es de un hombre o una mujer", explica el investigador español.
Arriba, la casi nula proporción de palabras sobre su condición masculina en los artículos sobre hombres en las seis ediciones analizadas. Abajo, el porcentaje de 'palabras femeninas' en los artículos sobre mujeres. / Claudia Wagner et al.
Los investigadores buscaron la presencia de palabras que dieran pistas sobre el género del protagonista del artículo (hombre, mujer, caballero, señora...), sobre sus relaciones personales (casado, divorciada, esposa, marido...) y otras relacionadas con la familia (hijo, madre, abuelo...). Así, hasta tener una lista de 150 palabras más relevantes para determinar el género. Los resultados apabullan.
En las seis ediciones analizadas, alrededor del 30% de las palabras en los artículos protagonizados por mujeres hacían referencia su condición de mujer, madre, esposa... En el caso de los artículos sobre los hombres, entre el 0% y el 3% de las palabras destacaban su condición como tal. Lo relevante en este enorme sesgo es que aparece en artículos redactados para la Wikipedia, es decir, son, como dice García, "palabras que diferencian sexos en Wikipedia, no se refieren a procesos sociales de discriminación".
Aunque no hay muchas diferencias entre unos idiomas u otros, las ediciones de la Wikipedia en ruso, alemán e inglés presentan un mayor sesgo de género que las escritas en italiano, francés y español. Para los investigadores, los editores de la Wikipedia deberían intentar balancear tanto los enlaces como el vocabulario de los artículos. En caso contrario y como concluyen en su estudio, seguirán reproduciendo la desigualdad: "como los sistemas de búsqueda actuales y los algoritmos de recomendación se apoyan tanto en la información estructural como léxica de la Wikipedia, las mujeres podrían ser discriminadas en la clasificación de los artículos sobre personas relevantes".