¿Qué son las estadísticas no paramétricas?
Las estadísticas no paramétricas se refieren a un método estadístico en el que no se requiere que los datos se ajusten a una distribución normal. Las estadísticas no paramétricas utilizan datos que a menudo son ordinales, lo que significa que no se basan en números, sino en una clasificación u orden de tipo. Por ejemplo, una encuesta que transmita las preferencias de los consumidores que van desde me gusta a no me gusta se consideraría como datos ordinales.
La estadística no paramétrica incluye estadística descriptiva no paramétrica, modelos estadísticos, inferencia y pruebas estadísticas. La estructura del modelo de los modelos no paramétricos no se especifica a priori, sino que se determina a partir de los datos. El término no paramétrico no implica que tales modelos carezcan por completo de parámetros, sino que el número y la naturaleza de los parámetros son flexibles y no están fijados de antemano. Un histograma es un ejemplo de una estimación no paramétrica de una distribución de probabilidad.
Comprender las estadísticas no paramétricas
En estadística, la estadística paramétrica incluye parámetros como la media, la mediana, la desviación estándar, la varianza, etc. Esta forma de estadística utiliza los datos observados para estimar los parámetros de la distribución. Bajo estadísticas paramétricas, se supone que los datos se ajustan a una distribución normal con parámetros desconocidos μ (media poblacional) y σ 2 (varianza poblacional), que luego se estiman utilizando la media muestral y la varianza muestral.
Las estadísticas no paramétricas no asumen el tamaño de la muestra o si los datos observados son cuantitativos.
Las estadísticas no paramétricas no asumen que los datos se extraen de una distribución normal. En cambio, la forma de la distribución se estima bajo esta forma de medición estadística. Si bien hay muchas situaciones en las que se puede suponer una distribución normal, también hay algunos escenarios en los que no será posible determinar si los datos se distribuirán normalmente.
Ejemplos de estadísticas no paramétricas
En el primer ejemplo, considere que un investigador que quiere una estimación del número de bebés en Norteamérica que nacen con ojos marrones puede decidir tomar una muestra de 150, 000 bebés y realizar un análisis del conjunto de datos. La medida que obtengan se utilizará como una estimación de la población total de bebés con ojos marrones nacidos al año siguiente.
Para un segundo ejemplo, considere un investigador diferente que quiera saber si ir a la cama temprano o tarde está relacionado con la frecuencia con la que uno se enferma. Suponiendo que la muestra se elija al azar de la población, se puede suponer que la distribución del tamaño de la muestra de la frecuencia de la enfermedad es normal. Sin embargo, no se puede suponer que un experimento que mide la resistencia del cuerpo humano a una cepa de bacterias tenga una distribución normal.
Esto se debe a que los datos de una muestra seleccionada al azar pueden ser resistencia a la tensión. Por otro lado, si el investigador considera factores como la composición genética y el origen étnico, puede encontrar que un tamaño de muestra seleccionado usando estas características puede no ser resistente a la cepa. Por lo tanto, uno no puede asumir una distribución normal.
Este método es útil cuando los datos no tienen una interpretación numérica clara y es mejor usarlos con datos que tengan una clasificación de tipo. Por ejemplo, una prueba de evaluación de la personalidad puede tener una clasificación de sus métricas establecidas como totalmente en desacuerdo, en desacuerdo, indiferente, de acuerdo y totalmente de acuerdo. En este caso, se deben utilizar métodos no paramétricos.
Consideraciones Especiales
Las estadísticas no paramétricas han ganado reconocimiento debido a su facilidad de uso. A medida que se alivia la necesidad de parámetros, los datos se vuelven más aplicables a una mayor variedad de pruebas. Este tipo de estadísticas se puede usar sin la media, el tamaño de la muestra, la desviación estándar o la estimación de cualquier otro parámetro relacionado cuando no hay información disponible.
Dado que las estadísticas no paramétricas hacen menos suposiciones sobre los datos de la muestra, su aplicación tiene un alcance más amplio que las estadísticas paramétricas. En los casos en que las pruebas paramétricas son más apropiadas, los métodos no paramétricos serán menos eficientes. Esto se debe a que los resultados obtenidos de las estadísticas no paramétricas tienen un menor grado de confianza que si los resultados se obtuvieran utilizando estadísticas paramétricas.
Para llevar clave
- Las estadísticas no paramétricas son fáciles de usar, pero no ofrecen la precisión precisa de otros modelos estadísticos. Este tipo de análisis es más adecuado cuando se considera el orden de algo, donde incluso si los datos numéricos cambian, los resultados probablemente se mantendrán igual.