La paradoja de Simpson es un fenómeno estadístico que ocurre cuando una correlación presente en diferentes grupos se invierte al combinar los grupos.
El siguiente diagrama ilustra cómo aparece una tendencia positiva para dos grupos (rojo y azul) y cuando se combinan los datos (línea de puntos negra) aparece una tendencia negativa.
Veamos un ejemplo explicativo. 26 estudiantes solicitan una beca para estudiar Física y Matemáticas; 13 son chicos y 13 son chicas; 13 solicitan la beca para estudiar Matemáticas y 13 solicitan la beca para estudiar Física con la siguiente distribución:
8 chicos solicitan la beca para estudiar Matemáticas y 5 chicos la solicitan para estudiar Física; 5 chicas solicitan la beca para estudiar Matemáticas y 8 chicas la solicitan para estudiar Física.
Los estudiantes se presentan a un examen obteniendo los siguientes resultados. 6 chicas y 4 chicos obtienen beca para estudiar Física, es decir, un 75% de las chicas y un 80% de los chicos. 1 chica y 2 chicos obtienen beca para estudiar Matemáticas, es decir, un 20% de las chicas y un 25% de los chicos.
Cuando se combinan los resultados en Física y Matemáticas se obtiene un resultado sorprendente. 7 de las 13 chicas (es decir, aproximadamente un 54% de las chicas) obtienen beca para estudiar Física o Matemáticas, mientras que 6 de los trece chicos (es decir, aproximadamente un 46% de los chicos) obtienen beca para estudiar Física o Matemáticas.
Aunque la proporción de chicos que obtuvieron la beca para estudiar Matemáticas es mayor que la proporción de chicas que ganaron esa beca, y la proporción de chicos que obtuvieron la beca para estudiar Física es mayor que la proporción de chicas que ganaron esa beca, la proporción de chicos que obtuvieron una beca es menor que la proporción de chicas que obtuvieron una beca.