¿Qué es el intervalo de confianza?
Un intervalo de confianza, en estadística, se refiere a la probabilidad de que un parámetro de población caiga entre dos valores establecidos durante una cierta proporción de veces. Los intervalos de confianza miden el grado de incertidumbre o certeza en un método de muestreo. Un intervalo de confianza puede tomar cualquier cantidad de probabilidades, siendo la más común un nivel de confianza del 95% o 99%.
El intervalo de confianza y el nivel de confianza están interrelacionados, pero no son exactamente iguales.
Comprender el intervalo de confianza
Los estadísticos usan intervalos de confianza para medir la incertidumbre. Por ejemplo, un investigador selecciona diferentes muestras al azar de la misma población y calcula un intervalo de confianza para cada muestra. Los conjuntos de datos resultantes son todos diferentes; algunos intervalos incluyen el verdadero parámetro de población y otros no.
Un intervalo de confianza es un rango de valores que probablemente contendría un parámetro de población desconocido. El nivel de confianza se refiere al porcentaje de probabilidad, o certeza, de que el intervalo de confianza contendría el parámetro de población real cuando se extrae una muestra aleatoria muchas veces. O, en la lengua vernácula, "estamos 99% seguros ( nivel de confianza) de que la mayoría de estos conjuntos de datos (intervalos de confianza) contienen el parámetro de población real".
Para llevar clave
- Un intervalo de confianza calcula la probabilidad de que un parámetro de población caiga entre dos valores establecidos. Los intervalos de confianza miden el grado de incertidumbre o certeza en un método de muestreo. La mayoría de las veces, los intervalos de confianza reflejan niveles de confianza del 95% o 99%.
Cálculo de un intervalo de confianza
Supongamos que un grupo de investigadores está estudiando las alturas de los jugadores de baloncesto de la escuela secundaria. Los investigadores toman una muestra aleatoria de la población y establecen una altura media de 74 pulgadas. La media de 74 pulgadas es una estimación puntual de la media de la población. Una estimación puntual en sí misma es de utilidad limitada porque no revela la incertidumbre asociada con la estimación; no tiene una buena idea de cuán lejos puede estar esta media muestral de 74 pulgadas de la media poblacional. Lo que falta es el grado de incertidumbre en esta muestra única.
Los intervalos de confianza proporcionan más información que las estimaciones puntuales. Al establecer un intervalo de confianza del 95% utilizando la media y la desviación estándar de la muestra, y suponiendo una distribución normal representada por la curva de campana, los investigadores llegan a un límite superior e inferior que contiene la media real el 95% del tiempo. Suponga que el intervalo es entre 72 pulgadas y 76 pulgadas. Si los investigadores toman 100 muestras aleatorias de la población de jugadores de baloncesto de la escuela secundaria en su conjunto, la media debería caer entre 72 y 76 pulgadas en 95 de esas muestras.
Si los investigadores desean una confianza aún mayor, pueden ampliar el intervalo al 99% de confianza. Hacerlo invariablemente crea un rango más amplio, ya que deja espacio para un mayor número de medias de muestra. Si establecen el intervalo de confianza del 99% entre 70 y 78 pulgadas, pueden esperar que 99 de 100 muestras evaluadas contengan un valor medio entre estos números. Un nivel de confianza del 90% significa que esperaríamos que el 90% de las estimaciones de intervalo incluyeran el parámetro de población. Del mismo modo, un nivel de confianza del 99% significa que el 95% de los intervalos incluirían el parámetro.
Conceptos erróneos comunes sobre el intervalo de confianza
El error más grande con respecto a los intervalos de confianza es que representan el porcentaje de datos de una muestra dada que se encuentra entre los límites superior e inferior. Por ejemplo, uno podría interpretar erróneamente el mencionado intervalo de confianza del 99% de 70 a 78 pulgadas como indicativo de que el 99% de los datos en una muestra aleatoria se encuentra entre estos números. Esto es incorrecto, aunque existe un método separado de análisis estadístico para hacer tal determinación. Hacerlo implica identificar la media y la desviación estándar de la muestra y trazar estas cifras en una curva de campana.
