Discriminación indirecta por razón de sexo: ¿la prueba mediante datos estadísticos se está aplicando correctamente?

 

El objeto de esta entrada es someter a escrutinio la prueba estadística que se ha llevado a cabo en ciertos casos de discriminación indirecta. Especialmente porque, tal y como se está aplicando, aparentemente podrían estar arrojando conclusiones controvertidas.

 

A. Discriminación indirecta por razón de sexo y prueba mediante datos estadísticos

El TJUE ha establecido (por ejemplo, en el asunto Villar Laíz, entre otros) que la discriminación indirecta por razón de sexo se refiere a

«una situación en la que una disposición, un criterio o una práctica aparentemente neutros sitúan a personas de un sexo determinado en desventaja particular con respecto a personas del otro sexo, salvo que tal disposición, criterio o práctica pueda justificarse objetivamente con una finalidad legítima y que los medios para alcanzar dicha finalidad sean adecuados y necesarios».

Y ha concretado que la existencia de tal desventaja particular podría quedar demostrada, entre otras formas, probando que una normativa o disposición afecta negativamente a una proporción de personas de un sexo significativamente más alta que la de las personas del otro sexo.

Esto es que, como se recoge en el reciente asunto Schuch-Ghannadan (sentencia 3 de octubre 2019, C‑274/18)

«es posible demostrar la discriminación indirecta por cualquier medio, incluso a partir de datos estadísticos».

De modo que, volviendo a Villar Laíz,

«si se dispone de datos estadísticos, el mejor método de comparación consiste en confrontar, por un lado, las proporciones respectivas de trabajadores que quedan y que no quedan afectados por la norma en cuestión dentro de la mano de obra masculina y, por otro lado, las mismas proporciones dentro de la mano de obra femenina.

No basta con considerar el número de personas afectadas, ya que dicho número depende del número de trabajadores activos en todo el Estado miembro, así como de la proporción de trabajadores masculinos y de trabajadores femeninos en dicho Estado miembro»

Y estos datos estadísticos deben ser válidos, representativos y significativos (C-167/97, Seymour-Smith y Pérez):

«A este respecto, corresponde al órgano jurisdiccional nacional apreciar en qué medida los datos estadísticos presentados ante él, que representan la situación de la mano de obra, son válidos y si se pueden tomar en consideración, es decir, si no constituyen la expresión de fenómenos meramente fortuitos o coyunturales y si, de manera general, resultan significativos»

Y, finalmente, apunta

«Si datos estadísticos aportados, junto otros elementos pertinentes (según el caso) concluyen que la norma sitúa a las mujeres, en particular, en una posición menos ventajosa que la de los hombres, tal normativa sería contraria al Derecho UE, salvo que esté justificada por factores objetivos y ajenos a toda discriminación por razón de sexo.

Tal sería el caso cuando los medios elegidos responden a una finalidad legítima de la política social del Estado miembro cuya legislación se cuestiona, son adecuados para alcanzar el objetivo perseguido por esta y son necesarios a tal fin»

Así, por ejemplo, los siguientes datos han sido suficientes para confirmar la existencia de una discriminación indirecta (ATJUE 15 de octubre 2019, C‑439/18 y C‑472/18AEAT):

«a los datos disponibles en las páginas oficiales de transparencia del Gobierno español, según los cuales, a fecha de 31 de diciembre de 2016, el personal fijo discontinuo de la AEAT estaba integrado por 898 mujeres y 252 hombres, es decir, un 78,09 % de mujeres y un 21,91 % de hombres, proporción que se mantiene estable con respecto a los años anteriores. Pues bien, esta proporción entre los sexos es significativamente diferente de la del personal a tiempo completo de la AEAT, que emplea, por lo que respecta a los funcionarios, a un 53,88 % de mujeres por un 46,12 % de hombres y, en lo que atañe a los contratados laborales, a un 35,21 % de mujeres por un 64,39 % de hombres. Además, según el tribunal remitente, esta situación se compadece con la proporción general de las trabajadoras a tiempo parcial en todos los empleos. Así, según los datos de la última encuesta de población activa (correspondiente al primer trimestre de 2018), de los 2 814 300 trabajadores a tiempo parcial, 2 104 100 eran mujeres, mientras que 710 200 eran hombres. El examen de la evolución de estas cifras a lo largo del tiempo arroja la conclusión de que esta proporción oscila alrededor del 75 % de mujeres, habiendo alcanzado en algunas ocasiones el 80 %»

Y, de hecho, recientemente, el TJUE en el caso Schuch-Ghannadan ha dado un paso más en esta doctrina al concluir que puede fundamentarse una presunción de discriminación

«basándose en datos estadísticos generales relativos al mercado de trabajo en el Estado miembro de que se trate, en el supuesto de que no quepa esperar que el interesado presente datos más concretos relativos al grupo de trabajadores pertinente, por ser difícilmente accesibles o incluso no estar disponibles».

 

B. ¿Las pruebas estadísticas son fiables?

Si son fiables. No obstante, a mi entender, tal y como está siendo aplicado el criterio interpretativo propuesto por el TJUE, pueden plantear algunos problemas desde un punto de vista estadístico.

Vaya por delante que no soy un experto en esta materia y, por consiguiente, formulo estas valoraciones con la más absoluta de las cautelas (exponiéndome, por consiguiente, a formular algunas afirmaciones o conclusiones erróneas).

En ese caso, pido disculpas por anticipado y les ruego que valoren mis eventuales errores como una fase de más de un proceso de «prospección» o «tanteo» académico (a modo de «ensayo-error»).

Permítanme que inicie mi exposición a partir de un conocido caso de posible discriminación por razón de sexo en la política de admisiones de la Universidad de Berkeley.

 

1. Admisión en la Universidad de Berkeley y la «paradoja de Simpson»

Siguiendo con la exposición de SOBER y SLOAN WILSON (p. 10 y 11), en los años setenta, surgieron dudas sobre la posible discriminación a las mujeres en la admisión de licenciados por parte de la Universidad de Berkeley en California. El porcentaje de solicitudes admitidas de mujeres era menor que el porcentaje de hombres y la diferencia era lo bastante significativa como para entender que, quizás, no era una casualidad.

El análisis por parte de la Universidad de lo que estaba sucediendo evidenció que la admisión de mujeres arrojaba peores resultados que los hombres en un modo global, pero no en los departamentos individualmente considerados.

En concreto, imaginen que 90 mujeres y 10 hombres solicitan su admisión en un departamento con una proporción de admisiones de un 30%. En este departamento se procede a la elección sin ningún criterio discriminatorio y, por consiguiente, acepta a 27 mujeres (descartando al 70%) y a 3 hombres (descartando al 70%).

Imaginen que en otro departamento la proporción de aceptaciones es del 60% y recibe la solicitud de 10 mujeres y 90 hombres. En este departamento se procede a la selección sin seguir un criterio discriminatorio y, por consiguiente, acepta a 6 mujeres (rechazando al 40%) y 54 hombres (rechazando al 40%).

Raparen que se han presentado 200 candidatos (100 mujeres y 100 hombres) y que el número de mujeres aceptadas han sido 33 (27 en el primer departamento y 6 en el segundo); mientras que el número de hombres aceptados ha ascendido a 57 hombres (3 en el primero y 54 en el segundo).

Reparen que en este proceso de selección es determinante el % de aceptación de cada departamento y la tendencia de las mujeres a presentarse a uno u otro (en este caso, principalmente al primero – con un índice de admisión más bajo).

Analizados los datos de cada departamento por separado no es posible apreciar la existencia de discriminación alguna. No obstante, si se suman los resultados de admisión de ambos departamentos aparece un posible sesgo. Y esto es así porque los departamentos contribuyen de forma desigual al número total de solicitudes que se aceptan (fenómeno que se conoce como la «paradoja de Simpson»).

Por consiguiente, a la luz de este ejemplo, puede colegirse que, en determinadas circunstancias, los datos estadísticos sobre un índice alto o bajo de feminización podría no ser suficiente para confirmar estadísticamente que se está ante un comportamiento indirectamente discriminatorio (salvo que, obviamente, se hayan tenido en cuenta variables de control clave).

Lo que nos permite alcanzar otra dimensión especialmente relevante: la «correlación ilusoria» o el «pensamiento mágico»

 

2. Correlación estadística y el «pensamiento mágico»

Siguiendo con la exposición de PIATELLI PALMARINI (p. 113 a 115 y 122 y 123), si un test, una prueba clínica o un testimonio de un testigo fuera 100 % fiable, entonces, podríamos estar seguros de que la información que nos suministran es absolutamente cierta. Es decir, es condición suficiente para determinar con certeza la verdad de la información que suministra (no es necesario acudir a más datos y, además, no hay opción que nos ofrezca información «no cierta»).

En definitiva, no podría darnos ni «falsos positivos» ni «falsos negativos». Sin embargo, es obvio que son pocos los test que contienen esta fiabilidad (quizás, de los que más se aproximan son los de ADN, aunque se dan algunos errores de manipulación en el laboratorio – MDOLINOW, p. 46 y ss.).

El problema es que, desde un punto de vista psicológico, tendemos a pensar que si la fiabilidad de estos indicadores (test, pruebas, testimonios, etc.) es, por ejemplo, del 87%, éstos nos muestran un 87% de «certeza» (del mismo modo que si fuera, en otro ejemplo, del 56%, pensamos que será del 56%).

Ahora bien, tengan en cuenta que lo que es correcto en el límite extremo (100%, o sea, seguridad total – como el test de ADN) no es extrapolable a los casos que se aproximan a este límite. Ni siquiera en casos muy próximos al mismo (por ejemplo, del 95%). Sin embargo, intuitivamente consideramos que esta información es «fiable» y actuamos como si fueran una «certeza ‘algo menos cierta'».

Permítanme que les exponga un simple ejemplo para tratar de ilustrar lo expuesto

 

i. Un ejemplo clínico: síntomas y enfermedades y la importancia de los casos negativos

Imagínense que queremos saber (hipótesis) si un determinado síntoma es un indicador fiable de contraer una enfermedad.

Por ejemplo (siguiendo a SUTHERLAND, p. 210), si un médico hace una prueba clínica a 80 pacientes que tienen un determinado síntoma y, posteriormente, desarrollan la enfermedad y, en cambio, 20 no lo hacen, podríamos concluir que este síntoma es un buen indicador de la presencia de esta enfermedad (de hecho, reparen que un número cuatro veces mayor que tienen el síntoma la contraen).

Sin embargo, las reglas estadísticas evidencian que no es posible alcanzar conclusión alguna si sólo nos fijamos en los pacientes que presentan el síntoma.

Esto es así porque puede haber personas que no lo presenten y que, en cierta proporción, también enfermen.

Si centramos la atención en los pacientes que no presentan el síntoma, imaginen que hay 40 que han contraído la enfermedad y que otros 10 no lo han hecho.

Llegados a esta situación tampoco podríamos concluir que la hipótesis es cierta, esto es, que el síntoma es un buen indicador. Y no lo sería aunque el doble de pacientes (80) que lo tienen acaban enfermando y la mitad (40) lo hacen sin tenerlo.

Reparen que, en este caso, el síntoma no es un indicador válido de la enfermedad porque el 80% de los pacientes que lo tienen han enfermado (80 de 100) y el 80% de los que no lo tienen (40 de 50) también.

En definitiva, para poder evaluar si el síntoma es un buen indicador de la enfermedad (la hipótesis) tiene que establecerse una correlación entre todas las situaciones posibles:

Situación A: existencia de síntoma y se contrae enfermedad (80).

Situación B: existencia de síntoma y no se contrae la enfermedad (20) [esto es, un «Falso Positivo»]

Situación C: no existencia de síntoma y se contrae la enfermedad (40) [esto es, un «Falso Negativo»]

Situación D: no existencia de síntoma y no se contrae la enfermedad (50)

El problema es que tendemos a fijarnos principalmente en los datos que nos suministra la Situación A. Y, olvidándonos de la posible correlación estadística, no se repara en los datos relativos a los falsos positivos (Situación B) ni tampoco en los casos en los que no concurre el síntoma (Situaciones C y D).

 

ii. El pensamiento mágico (y los sesgos de disponibilidad y de confirmación)

Ciertamente, lamento comunicarles que cuando hacemos esto (PIATTELLI PALMARINI, p. 122), somos víctimas de una «correlación ilusoria» y que en la jerga se denomina un «pensamiento mágico«. Y lo peor es que lo hacemos muchas más veces de lo que sería deseable.

Y (como apunta SUTHERLAND, p. 212) esta intuición «tan humana» tiene una relación directa con el sesgo de disponibilidad al que hacía referencia en otras entradas del blog. La «ocurrencia» de un hecho nos llama más la atención que su no ocurrencia. De ahí que focalicemos la atención en esta dimensión y no en los casos negativos.

Lo que, a su vez, tiene una relación directa con el sesgo de confirmación (y el descuido de refutación) al que me refería recientemente en una entrada (y podría cuestionar el sentido de algunas cuestiones prejudiciales).

Así pues, desde un punto de vista estadístico, no podemos llegar a ninguna conclusión sólo observando los datos descritos en la Situación A, sino que deben comparar los datos de todas estas situaciones A, B, C y D (a través de lo que se conoce como «Ley de Bayes»).

Otro ejemplo, puede ayudar a exponer este efecto: si no sabemos cuántos conductores borrachos conducen, no es posible saber en qué medida conducir en este lamentable estado provoca accidentes.

O, dicho de otro modo, si no se hace, se corre el riesgo de alcanzar conclusiones absolutamente erróneas.

Y ahora, permítanme que vuelva a los casos de discriminación indirecta.

 

iii. Volvamos a la discriminación indirecta

En términos generales, como se ha expuesto en el ejemplo anterior, (SUTHERLAND, p. 211) no es posible llegar a conclusión alguna sobre la asociación entre dos hechos, a menos de que se tengan en cuenta las cifras numéricas que representan las frecuencias de presencia y ausencia de tales hechos.

Y si lo trasladamos al ámbito de la discriminación indirecta, si queremos establecer una asociación entre los hechos «índice de feminización» y «discriminación», parece que, si no queremos alcanzar conclusiones precipitadas, no tenemos más remedio que comparar las 4 situaciones posibles.

Para facilitar la exposición, permítanme que siga con el símil médico. Así pues, imaginen que el «síntoma» (tenerlo o no) sería el índice de feminización (alto o bajo); y la «enfermedad» (tenerla o no) sería la discriminación (que haya o que no haya).

De este modo, las situaciones posibles serían las siguientes:

Situación A: alto índice de feminización y discriminación.

Situación B: alto índice de feminización y no discriminación.

Situación C: bajo índice de feminización y discriminación.

Situación D: bajo índice de feminización y no discriminación.

Si nos fijamos en el criterio interpretativo del TJUE, parece que únicamente nos estamos fijando en escenarios que se identificarían con la Situación A (y obviando el resto de situaciones, especialmente, las negativas – C y D).

 

Valoración final: necesaria comprensión de los argumentos estadísticos

Si no estoy errado en mi exposición, creo que puede colegirse que, tal y como se están empleando las estadísticas en este ámbito específico (esto es, sin prestar excesiva atención a los diversos escenarios posibles y al establecimiento de variables de control), la fundamentación de las resoluciones que estiman que existe una discriminación indirecta tienen una solidez controvertida.

De hecho, es posible que sea difícil solventar las deficiencias que he descrito, pues, el problema es que, más allá de la Situación A, es posible que sea difícil acceder a datos numéricos sobre las Situaciones B, C y D. De hecho, como en el asunto Schuch-Ghannadan es posible que ni en la A. Lo que, a la luz de los expuesto, ciertamente, plantea serias dudas sobre su consistencia.

En cualquier caso, espero que no se malinterprete el contenido de esta entrada. El objetivo de la misma no es cuestionar la capacidad explicativa de las técnicas estadísticas ni tampoco negar la existencia de este tipo de trato discriminatorio ni obviamente los estereotipos y roles de género existentes (de hecho, he defendido su existencia extensamente aquí).

No obstante, creo que convendrán conmigo que, teniendo en cuenta el extraordinario impacto de algunas de estas resoluciones (sin ir más lejos, los asuntos AEAT o Villar Laíz), convendría que en el mundo jurídico (como apunta MLODINOW, p. 51) creciera la comprensión sobre los argumentos estadísticos.

De otro modo, seremos incapaces de revelar las capas ocultas de verdad.

 

 

 


Bibliografía citada

  • MLODINOW, L. (2019). El andar del borracho. Crítica.
  • PIATTELLI PALMARINI, M. (1995). Los túneles de la mente. Crítica.
  • SOBER, E. y SLOAN WILSON, D. (2000). El comportamiento altruista. Siglo XXI.
  • SUTHERLAND, S. (2015). Irracionalidad: el enemigo interior. Alianza Editorial.

 

 

 

 

 

 

 

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.