La varianza es una medida de la extensión entre números en un conjunto de datos. La varianza mide cuán lejos está cada número del conjunto de la media.
Usando un gráfico de conjunto de datos, podemos observar cuál es la relación lineal de los diversos puntos de datos o números. Hacemos esto dibujando una línea de regresión, que intenta minimizar la distancia de cualquier punto de datos individual de la línea misma. En el cuadro a continuación, los puntos de datos son los puntos azules, la línea naranja es la línea de regresión y las flechas rojas son la distancia de los datos observados y la línea de regresión.
Imagen de Julie Bang © Investopedia 2020
Cuando calculamos una varianza, estamos preguntando, dada la relación de todos estos puntos de datos, ¿cuánta distancia esperamos en el siguiente punto de datos? Esta "distancia" se llama el término de error, y es lo que mide la varianza.
Por sí sola, la variación no suele ser útil porque no tiene una unidad, lo que hace que sea difícil de medir y comparar. Sin embargo, la raíz cuadrada de la varianza es la desviación estándar, y eso es práctico como medida.
Cálculo de varianza en Excel
Calcular la varianza en Excel es fácil si ya tiene el conjunto de datos ingresado en el software. En el siguiente ejemplo, calcularemos la variación de 20 días de rendimientos diarios en el muy cotizado fondo cotizado en bolsa (ETF) denominado SPY, que invierte en el S&P 500.
- La fórmula es = VAR.S (seleccionar datos)
La razón por la que desea usar VAR.S y no VAR.P (que es otra fórmula ofrecida) es que a menudo no tiene toda la población de datos para medir. Por ejemplo, si tuviéramos todos los retornos en la historia del SPY ETF en nuestra tabla, podríamos usar la medición de población VAR.P, pero dado que solo estamos midiendo los últimos 20 días para ilustrar el concepto, usaremos VAR.S.
Como puede ver, el valor de varianza calculado de.000018674 nos dice poco sobre el conjunto de datos, por sí mismo. Si pasamos a la raíz cuadrada de ese valor para obtener la desviación estándar de los retornos, eso sería más útil.