¿Qué es un factor de inflación de varianza?
Inflación de varianza f El factor de inflación de varianza (VIF) es una medida de la cantidad de multicolinealidad en un conjunto de variables de regresión múltiple. Matemáticamente, el VIF para una variable de modelo de regresión es igual a la razón de la varianza general del modelo a la varianza de un modelo que incluye solo esa variable independiente única. Esta relación se calcula para cada variable independiente. Un VIF alto indica que la variable independiente asociada es altamente colineal con las otras variables en el modelo.
Para llevar clave
- Un factor de inflación de varianza (VIF) proporciona una medida de multicolinealidad entre las variables independientes en un modelo de regresión múltiple. La detección de multicolinealidad es importante porque si bien no reduce el poder explicativo del modelo, sí reduce la significación estadística de las variables independientes. Un VIF grande en una variable independiente indica una relación altamente colineal con las otras variables que deben considerarse o ajustarse en la estructura del modelo y la selección de variables independientes.
Comprender un factor de inflación de varianza
Se utiliza una regresión múltiple cuando una persona quiere probar el efecto de múltiples variables en un resultado particular. La variable dependiente es el resultado sobre el que actúan las variables independientes, que son las entradas al modelo. La multicolinealidad existe cuando hay una relación lineal, o correlación, entre una o más de las variables o entradas independientes. La multicolinealidad crea un problema en la regresión múltiple porque, dado que todas las entradas se influyen entre sí, en realidad no son independientes, y es difícil probar cuánto afecta la combinación de las variables independientes a la variable dependiente, o resultado, dentro del modelo de regresión. En términos estadísticos, un modelo de regresión múltiple donde existe una alta multicolinealidad hará que sea más difícil estimar la relación entre cada una de las variables independientes y la variable dependiente. Pequeños cambios en los datos utilizados o en la estructura de la ecuación del modelo pueden producir cambios grandes y erráticos en los coeficientes estimados en las variables independientes.
Para garantizar que el modelo se especifica correctamente y funciona correctamente, hay pruebas que se pueden ejecutar para la multicolinealidad. El factor de inflación de varianza es una de esas herramientas de medición. El uso de factores de inflación de varianza ayuda a identificar la gravedad de cualquier problema de multicolinealidad para que el modelo pueda ajustarse. El factor de inflación de la varianza mide cuánto influye o se infla el comportamiento (varianza) de una variable independiente por su interacción / correlación con las otras variables independientes. Los factores de inflación de la varianza permiten medir rápidamente cuánto contribuye una variable al error estándar en la regresión. Cuando existen problemas significativos de multicolinealidad, el factor de inflación de varianza será muy grande para las variables involucradas. Después de identificar estas variables, se pueden utilizar varios enfoques para eliminar o combinar variables colineales, resolviendo el problema de multicolinealidad.
Si bien la multicolinealidad no reduce el poder predictivo general de un modelo, puede producir estimaciones de los coeficientes de regresión que no son estadísticamente significativos. En cierto sentido, puede considerarse como una especie de doble conteo en el modelo. Cuando dos o más variables independientes están estrechamente relacionadas o miden casi lo mismo, entonces el efecto subyacente que miden se explica dos veces (o más) entre las variables, y se hace difícil o imposible decir qué variable está realmente influyendo en el variable independiente. Este es un problema porque el objetivo de muchos modelos econométricos es probar exactamente este tipo de relación estadística entre las variables independientes y la variable dependiente.
Por ejemplo, si un economista quiere probar si existe una relación estadísticamente significativa entre la tasa de desempleo (como una variable independiente) y la tasa de inflación (como la variable dependiente). La inclusión de variables independientes adicionales que están relacionadas con la tasa de desempleo, tales nuevas solicitudes iniciales de desempleo, probablemente introduciría multicolinealidad en el modelo. El modelo general puede mostrar un poder explicativo fuerte y estadísticamente suficiente, pero no puede identificar si el efecto se debe principalmente a la tasa de desempleo o a las nuevas solicitudes iniciales de desempleo. Esto es lo que detectaría el VIF, y sugeriría posiblemente eliminar una de las variables del modelo o encontrar alguna forma de consolidarlas para capturar su efecto conjunto, dependiendo de la hipótesis específica que el investigador esté interesado en probar.