¿Qué es un cuartil?
Un cuartil es un término estadístico que describe una división de observaciones en cuatro intervalos definidos basados en los valores de los datos y cómo se comparan con todo el conjunto de observaciones.
Cuartiles de comprensión
Para entender el cuartil, es importante entender la mediana como una medida de tendencia central. La mediana en estadística es el valor medio de un conjunto de números. Es el punto en el que exactamente la mitad de los datos se encuentra por debajo y por encima del valor central.
Entonces, dado un conjunto de 13 números, la mediana sería el séptimo número. Los seis números que preceden a este valor son los números más bajos en los datos, y los seis números después de la mediana son los números más altos en el conjunto de datos dado. Debido a que la mediana no se ve afectada por valores extremos o valores atípicos en la distribución, a veces se prefiere a la media.
La mediana es un estimador robusto de la ubicación, pero no dice nada acerca de cómo se distribuyen o dispersan los datos a ambos lados de su valor. Ahí es donde interviene el cuartil. El cuartil mide la distribución de valores por encima y por debajo de la media dividiendo la distribución en cuatro grupos.
Para llevar clave
- El cuartil mide la extensión de los valores por encima y por debajo de la media dividiendo la distribución en cuatro grupos. Un cuartil divide los datos en tres puntos: un cuartil inferior, una mediana y un cuartil superior, para formar cuatro grupos del conjunto de datos. para calcular el rango intercuartil, que es una medida de variabilidad alrededor de la mediana.
Cómo funcionan los cuartiles
Al igual que la mediana divide los datos a la mitad para que el 50% de la medición se encuentre por debajo de la mediana y el 50% se encuentre por encima de ella, el cuartil divide los datos en cuartos para que el 25% de la medición sea menor que el cuartil inferior, 50 % son menores que la media, y 75% son menores que el cuartil superior.
Un cuartil divide los datos en tres puntos: un cuartil inferior, una mediana y un cuartil superior, para formar cuatro grupos del conjunto de datos. El cuartil inferior o primer cuartil se denota como Q1 y es el número medio que se encuentra entre el valor más pequeño del conjunto de datos y la mediana. El segundo cuartil, Q2, es también la mediana. El cuartil superior o tercero, denotado como Q3, es el punto central que se encuentra entre la mediana y el número más alto de la distribución.
Ahora, podemos mapear los cuatro grupos formados a partir de los cuartiles. El primer grupo de valores contiene el número más pequeño hasta Q1; el segundo grupo incluye Q1 a la mediana; el tercer conjunto es la mediana de Q3; la cuarta categoría comprende Q3 hasta el punto de datos más alto de todo el conjunto.
Cada cuartil contiene el 25% del total de observaciones. En general, los datos se organizan de menor a mayor:
- Primer cuartil: el 25% más bajo de números Segundo cuartil: entre 25.1% y 50% (hasta la mediana) Tercer cuartil: 51% a 75% (por encima de la mediana) Cuarto cuartil: el 25% más alto de números
Ejemplo de cuartil
Trabajemos con un ejemplo. Supongamos que la distribución de los puntajes de matemáticas en una clase de 19 estudiantes en orden ascendente es:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Primero, marque la mediana, Q2, que en este caso es el décimo valor: 75.
Q1 es el punto central entre la puntuación más pequeña y la mediana. En este caso, Q1 cae entre el primer y quinto puntaje: 68..
Q3 es el valor medio entre Q2 y la puntuación más alta: 84..
Ahora que tenemos nuestros cuartiles, interpretemos sus números. Un puntaje de 68 (Q1) representa el primer cuartil y es el percentil 25. 68 es la mediana de la mitad inferior de la puntuación establecida en los datos disponibles, es decir, la mediana de las puntuaciones de 59 a 75.
Q1 nos dice que el 25% de los puntajes son menores que 68 y el 75% de los puntajes de la clase son mayores. Q2 (la mediana) es el percentil 50 y muestra que el 50% de los puntajes son inferiores a 75, y el 50% de los puntajes son superiores a 75. Finalmente, Q3, el percentil 75, revela que el 25% de los puntajes son mayor y 75% son menores de 84.
Consideraciones Especiales
Si el punto de datos para Q1 está más alejado de la mediana que Q3 de la mediana, entonces podemos decir que hay una mayor dispersión entre los valores más pequeños del conjunto de datos que entre los valores más grandes. La misma lógica se aplica si Q3 está más lejos de Q2 que Q1 de la mediana.
Alternativamente, si hay un número par de puntos de datos, la mediana será el promedio de los dos números del medio. En nuestro ejemplo anterior, si tuviéramos 20 estudiantes en lugar de 19, la mediana de sus puntajes será el promedio aritmético del décimo y el undécimo número.
Los cuartiles se usan para calcular el rango intercuartil, que es una medida de variabilidad alrededor de la mediana. El rango intercuartil simplemente se calcula como la diferencia entre el primer y el tercer cuartil: Q3 - Q1. En efecto, es el rango de la mitad media de los datos lo que muestra cuán dispersos están los datos.
Para grandes conjuntos de datos, Microsoft Excel tiene una función CUARTIL para calcular cuartiles.