¿Qué es la media de Winsorized?
La media Winsorizada es un método de promediación que inicialmente reemplaza los valores más pequeños y más grandes con las observaciones más cercanas a ellos. Esto se hace para limitar el efecto de valores extremos anormales, o valores atípicos, en el cálculo. Después de reemplazar los valores, la fórmula de la media aritmética se usa para calcular la media winorizada.
La fórmula para la media de Winsorized es
Media Winsorizada = Nxn… xn + 1 + xn + 2… xn donde: n = El número de puntos de datos más grandes y más pequeños que se reemplazarán por la observación
Los medios de Winsorized se expresan de dos maneras. Una media winorizada "k n " se refiere al reemplazo de las observaciones 'k' más pequeñas y más grandes, donde 'k' es un número entero. Una media winorizada "X%" implica reemplazar un porcentaje dado de valores de ambos extremos de los datos.
Cómo calcular la media de Winsorized
La media winorizada se calcula reemplazando los puntos de datos más pequeños y más grandes, luego sumando todos los puntos de datos y dividiendo la suma por el número total de puntos de datos.
¿Qué le dice el medio Winsorized?
La media winorizada es menos sensible a los valores atípicos porque puede reemplazarlos con valores menos extremos. Es decir, es menos susceptible a los contornos que a la media. Sin embargo, si una distribución tiene colas gruesas, el efecto de eliminar los valores más altos y más bajos en la distribución tendrá poca influencia debido al alto número de variabilidad en las cifras de distribución.
Para llevar clave
- Un método de promedio que incluye reemplazar los valores más pequeños y más grandes con las observaciones más cercanas a ellos. Menos sensible a los valores atípicos porque puede reemplazarlos con valores menos extremos. Es diferente a la media recortada, que implica eliminar puntos de datos, aunque el resultado de los dos tienden a estar cerca
Ejemplo de cómo usar la media Winsorizada
Se puede calcular la media winorizada para el siguiente conjunto de datos: 1, 5, 7, 8, 9, 10, 14. En este ejemplo, asumimos que la media winorizada está en el primer orden, reemplazamos los valores más pequeños y más grandes por sus observaciones más cercanas
El conjunto de datos ahora aparece de la siguiente manera: 5, 5, 7, 8, 9, 10, 10. Tomar un promedio aritmético del nuevo conjunto produce una media winorizada de 7.7, o (5 + 5 + 7 + 8 + 9 + 10 + 10) dividido por 7.
O considere una media de 20% winorized que toma el 10% superior y el 10% inferior y los reemplaza con su próximo valor más cercano. Vamos a clasificar los siguientes conjuntos de datos: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Los dos los puntos de datos más pequeños y más grandes, o 10%, serán reemplazados por su próximo valor más cercano. Por lo tanto, el nuevo conjunto de datos es: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. la media es 33.9, o el total de los datos (678) dividido por el número total de puntos de datos (20).
La diferencia entre la media de Winsorized y la media recortada
La media winorizada incluye la modificación de puntos de datos, mientras que la media recortada implica la eliminación de puntos de datos. Es común que la media winorizada y la media recortada estén cercanas.
Limitaciones del uso de la media Winsorizada
Una desventaja importante para los medios winorizados es que introducen sesgos en el conjunto de datos. Por supuesto, el conjunto de datos es idealmente menos sesgado después de la modificación que si se dejaran los valores atípicos.
Aprenda más sobre la media de Winsorized
Para obtener información relacionada, sobre las diferencias entre los cálculos medios clave.