¿Qué es la distribución de muestreo?
Una distribución de muestreo es una distribución de probabilidad de una estadística obtenida a través de una gran cantidad de muestras extraídas de una población específica. La distribución muestral de una población dada es la distribución de frecuencias de un rango de resultados diferentes que podrían ocurrir para una estadística de una población.
Comprender la distribución de muestreo
Una gran cantidad de datos extraídos y utilizados por académicos, estadísticos, investigadores, especialistas en marketing, analistas, etc., son en realidad muestras, no poblaciones. Una muestra es un subconjunto de una población. Por ejemplo, un investigador médico que quisiera comparar el peso promedio de todos los bebés nacidos en América del Norte entre 1995 y 2005 con los nacidos en América del Sur dentro del mismo período de tiempo no puede extraer datos de la población completa de toda la población de más de un millón de partos que ocurrieron durante el período de diez años. En cambio, solo usará el peso de, digamos, 100 bebés, en cada continente para llegar a una conclusión. El peso de 200 bebés utilizados es la muestra y el peso promedio calculado es la media de la muestra.
Ahora suponga que en lugar de tomar solo una muestra de 100 pesos de recién nacidos de cada continente, el investigador médico toma muestras aleatorias repetidas de la población general y calcula la media muestral para cada grupo de muestra. Entonces, para América del Norte, extrae datos de 100 pesos de recién nacidos registrados en los EE. UU., Canadá y México de la siguiente manera: cuatro 100 muestras de hospitales seleccionados en los Estados Unidos, cinco 70 muestras de Canadá y tres 150 registros de México, para un total de 1200 pesos de recién nacidos agrupados en 12 juegos. También recopila una muestra de datos de 100 pesos de nacimiento de cada uno de los 12 países de América del Sur.
Cada muestra tiene su propia media muestral y la distribución de las medias muestrales se conoce como distribución muestral.
El peso promedio calculado para cada conjunto de muestra es la distribución muestral de la media. No solo se puede calcular la media a partir de una muestra. Otras estadísticas, como la desviación estándar, la varianza, la proporción y el rango se pueden calcular a partir de datos de muestra. La desviación estándar y la varianza miden la variabilidad de la distribución de muestreo.
El número de observaciones en una población, el número de observaciones en una muestra y el procedimiento utilizado para dibujar los conjuntos de muestras determinan la variabilidad de una distribución de muestreo. La desviación estándar de una distribución de muestreo se denomina error estándar. Si bien la media de una distribución de muestreo es igual a la media de la población, el error estándar depende de la desviación estándar de la población, el tamaño de la población y el tamaño de la muestra.
Saber qué tan separadas están la media de cada uno de los conjuntos de muestras entre sí y de la media de la población dará una indicación de qué tan cerca está la media de la muestra de la media de la población. El error estándar de la distribución de muestreo disminuye a medida que aumenta el tamaño de la muestra.
Consideraciones Especiales
Una población o un conjunto de números de muestra tendrá una distribución normal. Sin embargo, debido a que una distribución de muestreo incluye múltiples conjuntos de observaciones, no necesariamente tendrá una forma curva de campana.
Siguiendo nuestro ejemplo, el peso promedio de la población de bebés en América del Norte y América del Sur tiene una distribución normal porque algunos bebés tendrán bajo peso (por debajo de la media) o sobrepeso (por encima de la media), y la mayoría de los bebés caerán en el medio (alrededor de la media) Si el peso promedio de los recién nacidos en América del Norte es de siete libras, el peso medio de la muestra en cada uno de los 12 conjuntos de observaciones de muestra registradas para América del Norte también será cercano a las siete libras.
Sin embargo, si grafica cada uno de los promedios calculados en cada uno de los 1, 200 grupos de muestra, la forma resultante puede resultar en una distribución uniforme, pero es difícil predecir con certeza cuál será la forma real. Cuantas más muestras use el investigador de la población de más de un millón de cifras de peso, más comenzará el gráfico a formar una distribución normal.
- Una distribución de muestreo es una distribución de probabilidad de una estadística obtenida a través de un gran número de muestras tomadas de una población específica. La distribución de muestreo de una población dada es la distribución de frecuencias de un rango de resultados diferentes que posiblemente podrían ocurrir para una estadística de población.Una gran cantidad de datos extraídos y utilizados por académicos, estadísticos, investigadores, especialistas en marketing y analistas son en realidad muestras, no poblaciones.