¿Qué es el abandono del tamaño de la muestra?
El descuido del tamaño de la muestra es un sesgo cognitivo famoso estudiado por Amos Tversky y Daniel Kahneman. Ocurre cuando los usuarios de información estadística hacen conclusiones falsas al no considerar el tamaño de la muestra de los datos en cuestión.
La causa subyacente de la negligencia en el tamaño de la muestra es que las personas a menudo no comprenden que es más probable que ocurran altos niveles de variación en muestras pequeñas. Por lo tanto, es crítico determinar si el tamaño de la muestra utilizada para producir una estadística dada es lo suficientemente grande como para permitir conclusiones significativas.
Saber cuándo un tamaño de muestra es suficientemente grande puede ser un desafío para aquellos que no tienen una buena comprensión de los métodos estadísticos.
Para llevar clave
- El descuido del tamaño de la muestra es un sesgo cognitivo estudiado por Amos Tversky y Daniel Kahneman. Consiste en sacar conclusiones falsas de la información estadística, debido a que no se han considerado los efectos del tamaño de la muestra. Aquellos que deseen reducir el riesgo de descuido del tamaño de la muestra deben recordar que los tamaños de muestra están asociados con resultados estadísticos más volátiles, y viceversa.
Comprender la negligencia del tamaño de la muestra
Cuando un tamaño de muestra es demasiado pequeño, no se pueden sacar conclusiones precisas y confiables. En el contexto de las finanzas, esto puede engañar a los inversores de varias maneras.
Por ejemplo, un inversor podría ver un nuevo fondo de inversión, jactándose de haber generado un rendimiento anualizado del 15% desde su inicio. El inversor podría incluir rápidamente que este fondo es su boleto para la generación rápida de riqueza. Sin embargo, esta conclusión podría estar peligrosamente equivocada si el fondo no ha estado invirtiendo durante mucho tiempo. En ese caso, los resultados podrían deberse a anomalías a corto plazo y tienen poco que ver con la metodología de inversión real del fondo.
El descuido del tamaño de la muestra a menudo se confunde con el descuido de la tasa base, que es un sesgo cognitivo separado. Mientras que el Descuido del tamaño de la muestra se refiere a la falta de consideración del papel de los tamaños de muestra en la determinación de la confiabilidad de las declaraciones estadísticas, el Descuido de la tasa base se relaciona con la tendencia de las personas a descuidar el conocimiento existente sobre un fenómeno al evaluar nueva información.
Ejemplo del mundo real de negligencia en el tamaño de la muestra
Para comprender mejor la negligencia en el tamaño de la muestra, considere el siguiente ejemplo, extraído de la investigación de Amos Tversky y Daniel Kahneman:
Se le pide a una persona que extraiga de una muestra de cinco bolas, y descubre que cuatro son rojas y una es verde.
Una persona toma una muestra de 20 bolas y descubre que 12 son rojas y ocho son verdes.
¿Qué muestra proporciona mejor evidencia de que las bolas son predominantemente rojas?
La mayoría de las personas dice que la primera muestra más pequeña proporciona evidencia mucho más sólida porque la proporción de rojo a verde es mucho más alta que la muestra más grande. Sin embargo, en realidad, la proporción más alta se ve compensada por el tamaño de muestra más pequeño. La muestra de 20 en realidad proporciona evidencia mucho más fuerte.
Otro ejemplo de Amos Tversky y Daniel Kahneman es el siguiente:
Una ciudad es servida por dos hospitales. En el hospital más grande, nacen un promedio de 45 bebés cada día, y en el hospital más pequeño nacen aproximadamente 15 bebés cada día. Aunque el 50% de todos los bebés son niños, el porcentaje exacto fluctúa de un día a otro.
Durante un año, cada hospital registró los días en que más del 60% de los bebés eran niños. ¿Qué hospital registró más días así?
Cuando se les hizo esta pregunta, el 22% de los encuestados dijo que el hospital más grande informaría más de esos días, mientras que el 56% dijo que los resultados serían los mismos para ambos hospitales. De hecho, la respuesta correcta es que el hospital más pequeño registraría más días, porque su tamaño más pequeño produciría una mayor variabilidad.
Como notamos anteriormente, la raíz de la negligencia en el tamaño de la muestra es que las personas a menudo no entienden que es más probable que ocurran altos niveles de variación en muestras pequeñas. Al invertir, esto puede ser muy costoso.