Muchas mujeres sufren discriminación en el trabajo, en la política,
en la economía y en las relaciones personales. ¿La Wikipedia reproduce
también la desigualdad? Un estudio sobre la presencia femenina en los
artículos de la gran enciclopedia de este tiempo revela que están bien
representadas en la cantidad de los artículos. Pero el análisis de los
mismos desvela sesgos de género. En las piezas sobre las grandes
mujeres, destacan las referencias a su condición de mujer, lo que no
sucede con los hombres.
La Wikipedia la usan millones de personas sin apenas diferencias
entre sexos. Sin embargo, de los 300.000 editores que han modificado
alguno de sus artículos al menos 10 veces, solo entre el 9% y el 15%
(según los estudios) son mujeres. Consciente de que esta diferencia
podría afectar al contenido de la enciclopedia, la Fundación Wikimedia
ha puesto en marcha varias iniciativas para cerrar la brecha de género. No lo ha conseguido del todo.
Partiendo de esa desigual aportación de base, un grupo de
investigadores ha analizado la presencia de las mujeres pero no en la
edición sino en los artículos de la Wikipedia. Para comparar con la vida
real, entresacaron una lista de más de 100.000 grandes hombres y
mujeres de la historia de tres bases de datos diferentes, Freebase, el proyecto del MIT, Pantheon, y la lista de los grandes logros de la Humanidad recogida en el libro Human Accomplishment, del politólogo e historiador, Charles Murray.
En los artículos sobre hombres, las palabras sobre su género apenas son el 1%. En las mujeres, el 30%
Los investigadores, de varias universidades centroeuropeas, midieron
la presencia de la mujer en la Wikipedia con cuatro análisis diferentes.
Dos más cuantitativos buscaban saber cuántas de las grandes mujeres se
han merecido un artículo en la enciclopedia y si algunas de ellas
aparecían en la Wikipedia:Today's featured article,
una sección de la web que cada día destaca un artículo por su
relevancia. Otros dos análisis cualitativos midieron la red de
conexiones entre los artículos y su contenido para buscar sesgos de
género.
"El resultado es que en unos casos los sesgos son más fuertes, y en
otros son más débiles e incluso se están reduciendo", dice el
investigador del Instituto Federal de Tecnología de Zúrich (ETH) y
coautor del estudio, el español David García.
"Los sesgos más fáciles de ver a simple vista, como si hay páginas de
mujeres en la pagina principal o si esas páginas tienen buena calidad,
se están corrigiendo y son menores que en otras referencias
enciclopédicas", añade en alusión a los análisis cuantitativos.
La lista de personajes de Freebase analizados, por ejemplo, incluye a
más de 100.000 y solo unos 12.000 son mujeres. De los 11.327 artículos
de Pantheon, apenas 1.500 se referían a una mujer. En el caso del libro
de Murray, la distancia es aún mayor: 3.578 hombres por 83 mujeres. En
la Wikipedia, en cambio, y para sorpresa de los investigadores, la
proporción de mujeres referenciadas aunque aún inferior a la de los
hombres es hasta un 15% mayor que en las tres bases de datos.
También midieron la extensión de los artículos y vieron que, en
general, las entradas sobre mujeres en la Wikipedia eran más largas que
las de los hombres. El análisis lo realizaron con las seis ediciones de
los principales idiomas europeos, entre ellas la edición en español.
Mientras que en la edición inglesa o en la alemana, el sesgo en favor de
los hombres se mantenía, en las ediciones latinas (francés, italiano y
español), las referencias a personajes femeninos superan a las que
aparecen en las bases de datos comparadas.
Los sesgos más sutiles, como el uso de palabras
sobre el género o las tendencias de enlaces, son todavía cosa de
hombres", dicen los autores
Lo mismo sucede con los artículos destacados en la portada de la
Wikipedia. Aunque la mayoría se refieren a acontecimientos históricos y
no a personajes, cuando destacan a alguno, la ratio de hombres y mujeres
ronda el 60:40, muy cerca de la paridad. Como escriben los autores,
"esto posiblemente sea el resultado del esfuerzo de los wikipedianos por mejorar la cobertura de las minorías, en este caso, las mujeres".
Pero, al afinar el análisis la desigualdad reaparece. "Los sesgos más
sutiles, como el uso de palabras sobre el género o las tendencias de
enlaces, son todavía cosa de hombres", comenta el investigador español.
En cuanto a los enlaces, los científicos estudiaron dos aspectos claves
en la teoría de redes. Por un lado, la centralidad de un nodo (en este
caso, el artículo sobre un personaje). Los más relevantes tienden a
recibir más enlaces, mientras que los menos, aparecen en la periferia de
la red. Por otro lado, está lo que llaman asortatividad, "una propiedad de las redes en las que nodos de cierto tipo tienden a conectar entre ellos", explica García.
En la Wikipedia encontraron asortatividad de género. Las
páginas de hombres tienden a enlazar a páginas de hombres y las de
mujeres a las de mujeres. Pero en su análisis, publicado en el
repositorio científico Arxiv,
vieron que un enlace que llega al artículo sobre un hombre tiene más
probabilidad de proceder de un artículo sobre una mujer que al revés.
El último análisis fue el de las palabras. "Para analizar el texto
usamos una técnica de lingüística computacional que detecta las palabras
que predicen clases de textos. En este caso la clase es si la página es
sobre un hombre o una mujer, y los términos más discriminantes son los
que ayudan a un predictor automático a saber solo con el texto si la
página es de un hombre o una mujer", explica el investigador español.
Los investigadores buscaron la presencia de palabras que dieran pistas sobre el género del protagonista del artículo (hombre, mujer, caballero, señora...), sobre sus relaciones personales (casado, divorciada, esposa, marido...) y otras relacionadas con la familia (hijo, madre, abuelo...). Así, hasta tener una lista de 150 palabras más relevantes para determinar el género. Los resultados apabullan.
En las seis ediciones analizadas, alrededor del 30% de las palabras
en los artículos protagonizados por mujeres hacían referencia su
condición de mujer, madre, esposa... En el caso de los artículos sobre
los hombres, entre el 0% y el 3% de las palabras destacaban su condición
como tal. Lo relevante en este enorme sesgo es que aparece en artículos
redactados para la Wikipedia, es decir, son, como dice García,
"palabras que diferencian sexos en Wikipedia, no se refieren a procesos
sociales de discriminación".
Aunque no hay muchas diferencias entre unos idiomas u otros, las
ediciones de la Wikipedia en ruso, alemán e inglés presentan un mayor
sesgo de género que las escritas en italiano, francés y español. Para
los investigadores, los editores de la Wikipedia deberían intentar
balancear tanto los enlaces como el vocabulario de los artículos. En
caso contrario y como concluyen en su estudio, seguirán reproduciendo la
desigualdad: "como los sistemas de búsqueda actuales y los algoritmos
de recomendación se apoyan tanto en la información estructural como
léxica de la Wikipedia, las mujeres podrían ser discriminadas en la
clasificación de los artículos sobre personas relevantes".