¿Qué son los grados de libertad?
Grados de libertad se refiere al número máximo de valores lógicamente independientes, que son valores que tienen la libertad de variar, en la muestra de datos.
Para llevar clave
- Grados de libertad se refiere al número máximo de valores lógicamente independientes, que son valores que tienen la libertad de variar, en la muestra de datos. Los grados de libertad se discuten comúnmente en relación con diversas formas de prueba de hipótesis en estadística, como un Chi Cuadrado: calcular grados de libertad es clave cuando se trata de comprender la importancia de una estadística de Chi-cuadrado y la validez de la hipótesis nula.
Comprender los grados de libertad
La manera más fácil de entender los grados de libertad conceptualmente es a través de un ejemplo:
- Considere una muestra de datos que consta, por simplicidad, de cinco enteros positivos. Los valores pueden ser cualquier número sin relación conocida entre ellos. Esta muestra de datos tendría, en teoría, cinco grados de libertad. Cuatro de los números en la muestra son {3, 8, 5 y 4} y el promedio de toda la muestra de datos se revela que es 6. Esto debe significar que el el quinto número tiene que ser 10. No puede ser nada más. No tiene la libertad de variar, por lo que los grados de libertad para esta muestra de datos son 4.
La fórmula para Grados de libertad es igual al tamaño de la muestra de datos menos uno:
Df = N − 1 donde: Df = grados de libertad N = tamaño de muestra
Los grados de libertad se discuten comúnmente en relación con diversas formas de prueba de hipótesis en estadística, como un Chi-Square. Es esencial calcular los grados de libertad cuando se trata de comprender la importancia de una estadística de Chi-cuadrado y la validez de la hipótesis nula.
Pruebas de chi-cuadrado
Hay dos tipos diferentes de pruebas de Chi-Square: la prueba de independencia, que hace una pregunta de relación, como "¿Existe una relación entre los puntajes de género y SAT?"; y la prueba de bondad de ajuste, que pregunta algo como "Si se lanza una moneda 100 veces, ¿saldrá cara 50 veces y cola 50 veces?"
Para estas pruebas, se utilizan grados de libertad para determinar si una determinada hipótesis nula puede rechazarse en función del número total de variables y muestras dentro del experimento. Por ejemplo, al considerar a los estudiantes y la elección del curso, un tamaño de muestra de 30 o 40 estudiantes probablemente no sea lo suficientemente grande como para generar datos significativos. Obtener los mismos resultados o resultados similares de un estudio que utiliza un tamaño de muestra de 400 o 500 estudiantes es más válido.
Historia de los grados de libertad
El concepto más temprano y más básico de Grados de libertad se observó a principios de 1800, entrelazado en los trabajos del matemático y astrónomo Carl Friedrich Gauss. El uso y la comprensión modernos del término fueron expuestos primero por William Sealy Gosset, un estadístico inglés, en su artículo "El error probable de una media", publicado en Biometrika en 1908 bajo un seudónimo para preservar su anonimato.
En sus escritos, Gosset no utilizó específicamente el término "Grados de libertad". Sin embargo, dio una explicación del concepto a lo largo del desarrollo de lo que eventualmente se conocería como distribución T de Student. El término real no se hizo popular hasta 1922. El biólogo y estadístico inglés Ronald Fisher comenzó a usar el término "Grados de libertad" cuando comenzó a publicar informes y datos sobre su trabajo en el desarrollo de chi-cuadrados.