¿Qué es una prueba de dos colas?
En estadística, una prueba de dos colas es un método en el que el área crítica de una distribución es de dos lados y prueba si una muestra es mayor o menor que un cierto rango de valores. Se utiliza en pruebas de hipótesis nulas y pruebas de significación estadística. Si la muestra que se prueba cae en cualquiera de las áreas críticas, se acepta la hipótesis alternativa en lugar de la hipótesis nula. La prueba de dos colas recibe su nombre de la prueba del área bajo ambas colas de una distribución normal, aunque la prueba se puede usar en otras distribuciones no normales.
Para llevar clave
- En estadística, una prueba de dos colas es un método en el que el área crítica de una distribución es de dos lados y prueba si una muestra es mayor o menor que un cierto rango de valores. Se utiliza en pruebas y pruebas de hipótesis nula para la significación estadística. Si la muestra que se analiza cae en cualquiera de las áreas críticas, se acepta la hipótesis alternativa en lugar de la hipótesis nula. Por convención, se utilizan pruebas de dos colas para determinar la significación al nivel del 5%, es decir, a cada lado de la la distribución se corta al 2.5%.
Tenga cuidado de observar si una prueba estadística es de una o dos colas, ya que esto influirá en gran medida en la interpretación de un modelo.
Prueba de dos colas para la significación. Investopedia
Cómo funciona una prueba de dos colas
Un concepto básico de estadística inferencial es la prueba de hipótesis, que se realiza para determinar si una afirmación es verdadera o no, dado un parámetro de población. Una prueba programada para mostrar si la media de una muestra es significativamente mayor y significativamente menor que la media de una población se conoce como prueba de dos colas.
Una prueba de dos colas está diseñada para examinar ambos lados de un rango de datos especificado según lo designado por la distribución de probabilidad involucrada. La distribución de probabilidad debe representar la probabilidad de un resultado específico basado en estándares predeterminados. Esto requiere el establecimiento de un límite que designe los valores de las variables aceptadas más altas (o superiores) y más bajas (o más bajas) incluidas dentro del rango. Cualquier punto de datos que exista por encima del límite superior o por debajo del límite inferior se considera fuera del rango de aceptación y en un área denominada rango de rechazo.
No existe un estándar inherente con respecto al número de puntos de datos que deben existir dentro del rango de aceptación. En casos donde se requiere precisión, como en la creación de medicamentos farmacéuticos, se puede instituir una tasa de rechazo de 0.001% o menos. En los casos en que la precisión es menos crítica, como la cantidad de alimentos en una bolsa de productos, puede ser apropiado una tasa de rechazo del 5%.
Un ejemplo de una prueba de dos colas
Como ejemplo hipotético, imagine que un nuevo corredor de bolsa (XYZ) afirma que sus tarifas de corretaje son más bajas que las de su corredor de bolsa actual (ABC). Los datos disponibles de una firma de investigación independiente indican que la media y la desviación estándar de todos los clientes de corredores ABC son de $ 18 y $ 6, respectivamente.
Se toma una muestra de 100 clientes de ABC y se calculan los cargos de corretaje con las nuevas tarifas del corredor XYZ. Si la media de la muestra es de $ 18.75 y la desviación estándar de la muestra es de $ 6, ¿se puede hacer alguna inferencia sobre la diferencia en la factura promedio de corretaje entre el corredor ABC y XYZ?
- H 0: Hipótesis nula: media = 18H 1: Hipótesis alternativa: media <> 18 (Esto es lo que queremos probar). Región de rechazo: Z <= - Z 2.5 y Z> = Z 2.5 (suponiendo un nivel de significancia del 5%, dividir 2.5 en cada lado).Z = (muestra media - media) / (std-dev / sqrt (no. de muestras)) = (18.75 - 18) / (6 / (sqrt (100)) = 1.25
Este valor Z calculado se encuentra entre los dos límites definidos por: - Z 2.5 = -1.96 y Z 2.5 = 1.96.
Esto concluye que no hay pruebas suficientes para inferir que hay alguna diferencia entre las tasas de su corredor actual y el nuevo corredor. Alternativamente, el valor p = P (Z <-1.25) + P (Z> 1.25) = 2 * 0.1056 = 0.2112 = 21.12%, que es mayor que 0.05 o 5%, lleva a la misma conclusión.
Consideraciones especiales: muestreo aleatorio
Una prueba de dos colas también se puede utilizar prácticamente durante ciertas actividades de producción en una empresa, como la producción y el envasado de dulces en una instalación en particular. Si la instalación de producción designa como objetivo 50 caramelos por bolsa, con una distribución aceptable de 45 a 55 caramelos, cualquier bolsa encontrada con una cantidad inferior a 45 o superior a 55 se considera dentro del rango de rechazo
Para confirmar que los mecanismos de empaque están calibrados adecuadamente para cumplir con la salida esperada, se puede tomar un muestreo aleatorio para confirmar la precisión. Para que los mecanismos de envasado se consideren precisos, se desea un promedio de 50 caramelos por bolsa con una distribución adecuada. Además, el número de bolsas que caen dentro del rango de rechazo debe caer dentro del límite de distribución de probabilidad considerado aceptable como una tasa de error.
Si se descubre una tasa de rechazo inaceptable, o un promedio que se desvía demasiado de la media deseada, pueden ser necesarios ajustes en la instalación o el equipo asociado para corregir el error. El uso regular de métodos de prueba de dos colas puede ayudar a garantizar que la producción se mantenga dentro de los límites a largo plazo.
Prueba de dos colas versus una de una cola
Cuando se configura una prueba de hipótesis para mostrar que la media de la muestra sería mayor o menor que la media de la población, esto se conoce como prueba de una cola. La prueba de una cola recibe su nombre de la prueba del área debajo de una de las colas (lados) de una distribución normal. Cuando se usa una prueba de una cola, un analista está probando la posibilidad de la relación en una dirección de interés y haciendo caso omiso de la posibilidad de una relación en otra dirección.
Si la muestra que se prueba cae en el área crítica unilateral, se aceptará la hipótesis alternativa en lugar de la hipótesis nula. Una prueba de una cola también se conoce como hipótesis direccional o prueba direccional.