La fórmula de distribución normal se basa en dos parámetros simples, la media y la desviación estándar, que cuantifican las características de un conjunto de datos dado. Mientras que la media indica el valor "central" o promedio de todo el conjunto de datos, la desviación estándar indica la "extensión" o variación de los puntos de datos alrededor de ese valor medio.
Considere los siguientes 2 conjuntos de datos:
Conjunto de datos 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Conjunto de datos 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Para Dataset1, media = 10 y desviación estándar (stddev) = 0
Para Dataset2, media = 10 y desviación estándar (stddev) = 2.83
Tracemos estos valores para DataSet1:
De manera similar para DataSet2:
La línea horizontal roja en los dos gráficos anteriores indica la "media" o el valor promedio de cada conjunto de datos (10 en ambos casos). Las flechas rosadas en el segundo gráfico indican la extensión o variación de los valores de datos del valor medio. Esto está representado por un valor de desviación estándar de 2, 83 en el caso de DataSet2. Dado que DataSet1 tiene todos los valores iguales (como 10 cada uno) y sin variaciones, el valor stddev es cero y, por lo tanto, no son aplicables las flechas rosadas.
El valor stddev tiene algunas características significativas y útiles que son extremadamente útiles en el análisis de datos. Para una distribución normal, los valores de los datos se distribuyen simétricamente a ambos lados de la media. Para cualquier conjunto de datos normalmente distribuido, graficar el gráfico con stddev en el eje horizontal y no. de valores de datos en eje vertical, se obtiene el siguiente gráfico.
Propiedades de una distribución normal
- La curva normal es simétrica respecto a la media; la media está en el medio y divide el área en dos mitades; el área total debajo de la curva es igual a 1 para media = 0 y stdev = 1; la distribución se describe completamente por su media y stddev
Como se puede ver en el gráfico anterior, stddev representa lo siguiente:
- El 68.3% de los valores de datos están dentro de 1 desviación estándar de la media (-1 a +1) El 95.4% de los valores de datos están dentro de 2 desviaciones estándar de la media (-2 a +2) El 99.7% de los valores de datos están dentro de 3 desviaciones estándar de la media (-3 a +3)
El área debajo de la curva en forma de campana, cuando se mide, indica la probabilidad deseada de un rango dado:
- menor que X: - por ejemplo, la probabilidad de que los valores de datos sean menores de 70 mayor que X - por ejemplo, la probabilidad de que los valores de datos sean mayores que 95 entre X 1 y X 2 - por ejemplo, la probabilidad de valores de datos entre 65 y 85
donde X es un valor de interés (ejemplos a continuación).
Trazar y calcular el área no siempre es conveniente, ya que los diferentes conjuntos de datos tendrán valores medios y estándar diferentes. Para facilitar un método estándar uniforme para cálculos fáciles y aplicabilidad a problemas del mundo real, se introdujo la conversión estándar a valores Z, que forman parte de la Tabla de Distribución Normal.
Z = (X - media) / stddev, donde X es la variable aleatoria.
Básicamente, esta conversión obliga a la media y stddev a estandarizarse a 0 y 1 respectivamente, lo que permite utilizar un conjunto estándar definido de valores Z (de la tabla de distribución normal) para cálculos sencillos. Una instantánea de la tabla de valores z estándar que contiene valores de probabilidad es la siguiente:
z |
0.00 |
0, 01 |
0, 02 |
0, 03 |
0, 04 |
0, 05 |
0, 06 |
0.0 |
0.00000 |
0.00399 |
0.00798 |
0, 01197 |
0, 01595 |
0, 01994 |
… |
0.1 |
0, 0398 |
0, 04380 |
0, 04776 |
0, 05172 |
0, 05567 |
0, 05966 |
… |
0.2 0.2 |
0, 0793 |
0, 08317 |
0, 08706 |
0, 09095 |
0, 09483 |
0, 09871 |
… |
0, 3 |
0.11791 |
0.12172 |
0, 12552 |
0, 12930 |
0.13307 |
0.13683 |
… |
0.4 0.4 |
0.15542 |
0.15910 |
0.16276 |
0.16640 |
0.17003 |
0.17364 |
… |
0.5 0.5 |
0.19146 |
0.19497 |
0.19847 |
0.20194 |
0.20540 |
0.20884 |
… |
0.6 |
0.22575 |
0.22907 |
0.23237 |
0.23565 |
0.23891 |
0.24215 |
… |
0.7 |
0.25804 |
0.26115 |
0.26424 |
0.26730 |
0.27035 |
0.27337 |
… |
... |
… |
… |
… |
… |
… |
… |
… |
Para encontrar la probabilidad relacionada con el valor z de 0.239865, primero redondee a 2 decimales (es decir, 0.24). Luego verifique los primeros 2 dígitos significativos (0.2) en las filas y el dígito menos significativo (0.04 restante) en la columna. Eso conducirá a un valor de 0.09483.
La tabla de distribución normal completa, con precisión de hasta 5 puntos decimales para valores de probabilidad (incluidos los valores negativos), se puede encontrar aquí.
Veamos algunos ejemplos de la vida real. La altura de los individuos en un grupo grande sigue un patrón de distribución normal. Supongamos que tenemos un conjunto de 100 individuos cuyas alturas se registran y la media y el estándar se calculan en 66 y 6 pulgadas respectivamente.
Aquí hay algunas preguntas de muestra que pueden responderse fácilmente usando la tabla de valores z:
- ¿Cuál es la probabilidad de que una persona en el grupo tenga 70 pulgadas o menos?
La pregunta es encontrar el valor acumulativo de P (X <= 70), es decir, en todo el conjunto de datos de 100, cuántos valores estarán entre 0 y 70.
Primero vamos a convertir el valor X de 70 al valor Z equivalente.
Z = (X - media) / stddev = (70-66) / 6 = 4/6 = 0.66667 = 0.67 (redondeado a 2 decimales)
Ahora necesitamos encontrar P (Z <= 0.67) = 0. 24857 (de la tabla z de arriba)
es decir, hay una probabilidad del 24.857% de que un individuo en el grupo sea menor o igual a 70 pulgadas.
Pero espera, lo anterior está incompleto. Recuerde, estamos buscando la probabilidad de todas las alturas posibles hasta 70, es decir, de 0 a 70. Lo anterior solo le da la porción del valor medio al deseado (es decir, 66 a 70). Necesitamos incluir la otra mitad, de 0 a 66, para llegar a la respuesta correcta.
Dado que 0 a 66 representa la media porción (es decir, una media extrema a media), su probabilidad es simplemente 0.5.
Por lo tanto, la probabilidad correcta de que una persona mida 70 pulgadas o menos = 0.24857 + 0.5 = 0. 74857 = 74.857%
Gráficamente (calculando el área), estas son las dos regiones sumadas que representan la solución:
- ¿Cuál es la probabilidad de que una persona mida 75 pulgadas o más?
es decir, encontrar P acumulativo complementario (X> = 75).
Z = (X - media) / stddev = (75-66) / 6 = 9/6 = 1.5
P (Z> = 1.5) = 1- P (Z <= 1.5) = 1 - (0.5 + 0.43319) = 0.06681 = 6.681%
- ¿Cuál es la probabilidad de que una persona tenga entre 52 y 67 pulgadas?
Encuentre P (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2.33 <= Z <= 0.17)
= P (Z <= 0.17) –P (Z <= -0.233) = (0.5 + 0.56749) - (.40905) =
Esta tabla de distribución normal (y valores z) comúnmente se utiliza para cualquier cálculo de probabilidad de movimientos de precios esperados en el mercado de valores para acciones e índices. Se utilizan en el comercio basado en el rango, identificando tendencias alcistas o bajistas, niveles de soporte o resistencia, y otros indicadores técnicos basados en conceptos de distribución normal de media y desviación estándar.
Comparar cuentas de inversión × Las ofertas que aparecen en esta tabla son de asociaciones de las cuales Investopedia recibe compensación. Nombre del proveedor DescripciónArtículos relacionados
Comercio de educación básica
Prueba de hipótesis en finanzas: concepto y ejemplos
Gestión de riesgos
Optimice su cartera utilizando la distribución normal
Análisis Técnico Educación Básica
La regresión lineal del tiempo y el precio
Gestión de riesgos
Los usos y límites de la volatilidad
Análisis financiero
Cómo calcular el valor en riesgo (VaR) en Excel
Herramientas para el análisis fundamental