¿Qué es la correlación espuria?
En estadística, una correlación espuria, o espuria, se refiere a una conexión entre dos variables que parece causal pero no lo es. Las relaciones espurias a menudo tienen la apariencia de una variable que afecta a otra. Esta correlación espuria a menudo es causada por un tercer factor que no es aparente en el momento del examen, a veces llamado factor de confusión.
Para llevar clave
- La correlación espuria, o espuria, es cuando dos factores aparecen casualmente relacionados, pero no lo están. La aparición de una relación causal a menudo se debe a un movimiento similar en un gráfico que resulta ser casual o causado por un tercer factor de "confusión". a menudo puede ser causado por tamaños de muestra pequeños o puntos finales arbitrarios.
Cómo funciona la correlación espuria
Cuando dos variables aleatorias se rastrean estrechamente entre sí en un gráfico, es fácil sospechar una correlación o una relación entre los dos factores, donde un cambio afecta al otro. Dejando de lado la "causalidad", otro tema, esta observación puede llevar al lector del gráfico a creer que el movimiento de la variable A está vinculado al movimiento en la variable B o viceversa. pero a veces, tras un examen estadístico más detallado, los movimientos alineados son coincidentes o causados por un tercer factor que afecta a los dos primeros. Esta es una correlación espuria. La investigación realizada con tamaños de muestra pequeños o puntos finales arbitrarios es particularmente susceptible a la espuria.
Ejemplo de correlaciones espurias
No es demasiado difícil descubrir correlaciones interesantes. Sin embargo, muchos resultarán espurios. Para las especies masculinas en Wall Street, dos correlaciones espurias populares involucran mujeres y deportes. La teoría de la longitud del faldón se originó en la década de 1920 y sostiene que las longitudes del faldón y la dirección del mercado de valores están correlacionadas. Si las faldas son largas, eso significa que el mercado de valores está bajando; Si son cortos, el mercado está subiendo. A finales de enero se habla sobre el llamado indicador del Super Bowl, que sugiere que una victoria del equipo de la AFC probablemente signifique que el mercado de valores caerá en el próximo año, mientras que una victoria del equipo de la NFC augura un aumento en el mercado. Desde 1966, el indicador ha tenido una tasa de precisión del 80%. Es un tema de conversación divertido, pero probablemente no sea algo que un asesor financiero serio recomendaría como estrategia de inversión para los clientes.
Aquí hay algunos ejemplos más de correlaciones espurias comunes:
- Los ahogamientos aumentan cuando aumentan las ventas de helados. Puede parecer que el aumento en las ventas de helados causa más ahogamiento, pero en realidad, el aumento del calor puede causar que más personas naden, así como comprar más helados. uso. Los ejecutivos que dicen por favor y gracias más a menudo disfrutan de un mejor rendimiento compartido. Las personas que usan el equipo del equipo Oakland Raiders tienen más probabilidades de cometer delitos.
Cómo detectar correlaciones espurias
Los estadísticos y otros científicos que analizan datos deben estar atentos a las relaciones espurias todo el tiempo. Existen numerosos métodos que utilizan, que incluyen:
- Asegurar una muestra representativa adecuada. Obtener un tamaño de muestra adecuado. Tener cuidado con los puntos finales arbitrarios. Controlar tantas variables externas como sea posible. Usar una hipótesis nula y verificar un valor p fuerte.