¿Qué es el análisis de varianza (ANOVA)?
El análisis de varianza (ANOVA) es una herramienta de análisis utilizada en estadísticas que divide una variabilidad agregada observada dentro de un conjunto de datos en dos partes: factores sistemáticos y factores aleatorios. Los factores sistemáticos tienen una influencia estadística en el conjunto de datos dado, mientras que los factores aleatorios no. Los analistas usan la prueba ANOVA para determinar la influencia que las variables independientes tienen sobre la variable dependiente en un estudio de regresión.
Los métodos de prueba t y z desarrollados en el siglo XX se usaron para el análisis estadístico hasta 1918, cuando Ronald Fisher creó el método de análisis de varianza. ANOVA también se denomina análisis de varianza de Fisher, y es la extensión de las pruebas t y z. El término se hizo conocido en 1925, después de aparecer en el libro de Fisher, "Métodos estadísticos para investigadores". Fue empleado en psicología experimental y luego se expandió a temas que eran más complejos.
La fórmula para ANOVA es:
F = MSEMST donde: F = coeficiente ANOVA MST = suma de cuadrados promedio debido al tratamiento MSE = suma de cuadrados promedio debido a error
¿Qué revela el análisis de varianza?
La prueba ANOVA es el paso inicial para analizar los factores que afectan un conjunto de datos dado. Una vez finalizada la prueba, un analista realiza pruebas adicionales sobre los factores metódicos que contribuyen de manera medible a la inconsistencia del conjunto de datos. El analista utiliza los resultados de la prueba ANOVA en una prueba f para generar datos adicionales que se alinean con los modelos de regresión propuestos.
La prueba ANOVA permite una comparación de más de dos grupos al mismo tiempo para determinar si existe una relación entre ellos. El resultado de la fórmula ANOVA, el estadístico F (también llamado índice F), permite el análisis de múltiples grupos de datos para determinar la variabilidad entre muestras y dentro de las muestras.
Si no existe una diferencia real entre los grupos probados, lo que se denomina hipótesis nula, el resultado del estadístico de la relación F de ANOVA será cercano a 1. Las fluctuaciones en su muestreo probablemente seguirán la distribución de Fisher F. Este es en realidad un grupo de funciones de distribución, con dos números característicos, llamados grados de libertad del numerador y grados de libertad del denominador.
Para llevar clave
- El análisis de varianza, o ANOVA, es un método estadístico que separa los datos de varianza observados en diferentes componentes para usar en pruebas adicionales. Se utiliza un ANOVA unidireccional para tres o más grupos de datos, para obtener información sobre la relación entre el dependiente y variables independientes. Si no existe una verdadera variación entre los grupos, la relación F de ANOVA debería ser igual a 1.
Ejemplo de cómo usar ANOVA
Un investigador podría, por ejemplo, evaluar a estudiantes de varias universidades para ver si los estudiantes de una de las universidades superan constantemente a los estudiantes de las otras universidades. En una aplicación comercial, un investigador de I + D puede probar dos procesos diferentes de creación de un producto para ver si un proceso es mejor que el otro en términos de rentabilidad.
El tipo de prueba ANOVA utilizada depende de varios factores. Se aplica cuando los datos deben ser experimentales. El análisis de varianza se emplea si no hay acceso al software estadístico que resulta en el cálculo manual de ANOVA. Es simple de usar y se adapta mejor a muestras pequeñas. Con muchos diseños experimentales, los tamaños de muestra tienen que ser los mismos para las diversas combinaciones de niveles de factores.
ANOVA es útil para probar tres o más variables. Es similar a múltiples pruebas t de dos muestras. Sin embargo, da como resultado menos errores de tipo I y es apropiado para una variedad de problemas. ANOVA agrupa las diferencias al comparar las medias de cada grupo e incluye la distribución de la varianza en diversas fuentes. Se emplea con sujetos, grupos de prueba, entre grupos y dentro de grupos.
ANOVA unidireccional versus ANOVA bidireccional
Hay dos tipos de ANOVA: unidireccional (o unidireccional) y bidireccional. Unidireccional o bidireccional se refiere al número de variables independientes en su análisis de prueba de varianza. Un ANOVA unidireccional evalúa el impacto de un único factor en una única variable de respuesta. Determina si todas las muestras son iguales. El ANOVA unidireccional se utiliza para determinar si existen diferencias estadísticamente significativas entre las medias de tres o más grupos independientes (no relacionados).
Un ANOVA de dos vías es una extensión del ANOVA de una vía. Con un solo sentido, tiene una variable independiente que afecta a una variable dependiente. Con un ANOVA de dos vías, hay dos independientes. Por ejemplo, un ANOVA de dos vías permite a una empresa comparar la productividad de los trabajadores en función de dos variables independientes, como el salario y el conjunto de habilidades. Se utiliza para observar la interacción entre los dos factores y prueba el efecto de dos factores al mismo tiempo.