|
XXI. PRUEBAS DE HIPÓTESIS
|
|
1. Concepto Una prueba de hipótesis estadística
es una conjetura de una o más
poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad
de una hipótesis estadística, a no ser que se examine la población entera.
Esto por su puesto sería impractico en la mayoría de las situaciones.
En su lugar, se toma una muestra aleatoria de la población de interés
y se utilizan los datos que contiene tal muestra para proporcionar evidencia
que confirme o no la hipótesis. La evidencia de la muestra que es un
constante con la hipótesis planteada conduce a un rechazo de la misma
mientras que la evidencia que apoya la hipótesis conduce a su aceptación. Definición
de prueba de hipótesis estadística es que cuantifica el proceso de toma
de decisiones. Por cada
tipo de prueba de hipótesis se puede calcular una prueba estadística
apropiada. Esta prueba estadística mide el acercamiento del calor de
la muestra (como un promedio) a la hipótesis nula. La prueba estadística,
sigue una distribución estadística bien conocida (normal, etc.) o se
puede desarrollar una distribución para la prueba estadística particular. La distribución
apropiada de la prueba estadística se divide en dos regiones: una región
de rechazo y una de no
rechazo. Si la prueba estadística cae en esta última región no se
puede rechazar la hipótesis nula y se llega a la conclusión de que el
proceso funciona correctamente. Al tomar
la decisión con respecto a la hipótesis nula, se debe determinar el
valor crítico en la distribución estadística que divide la región del
rechazo (en la cual la hipótesis nula no se puede rechazar) de la región
de rechazo. A hora bien el valor crítico depende del tamaño de la región
de rechazo. PASOS DE
LA PRUEBA DE HIPÓTESIS
2. Tipos
de error y nivel de significancia Si rechazamos una hipótesis cuando
debiera ser aceptada diremos que se ha cometido un error de tipo
I. Por otra parte si aceptamos una hipótesis que debiera ser rechazada,
diremos que se ha cometido un error de tipo II. En ambos casos
se ha producido un juicio erróneo. Para que las reglas de decisión sean
buenas, deben diseñarse de modo que minimicen los errores de decisión,
y no es una cuestión sencilla, por que para cualquier tamaño de la muestra,
un intento de disminuir un tipo de error suele ir acompañado de un crecimiento
del otro tipo. En la práctica un tipo de error puede ser más grave que
el otro, y debe alcanzarse un compromiso que disminuya el error más
grave , la única forma de disminuir ambos a la vez es aumentar el tamaño
de la muestra, que no siempre es posible. NIVEL DE SIGNIFICANCIA Al contrastar una cierta hipótesis,
la máxima probabilidad con la que estamos dispuestos a correr el riesgo
de cometer un error de tipo I se llama nivel de significancia.
Esta probabilidad se denota por En la práctica es frecuente un nivel
de significancia de 0.05 ó 0.01, si bien se usan otros valores. Si,
por ejemplo, se escoge un nivel de significancia del 5% ó 0.05 al diseñar
una regla de decisión entonces hay unas cinco oportunidades entre cien
de rechazar la hipótesis cuando debiera haberse aceptado; es decir,
tenemos un 95% de confianza de que hemos adoptado la decisión correcta.
En tal caso decimos que la hipótesis a sido rechazada al nivel de significancia
0.05 lo cual quiere decir que la hipótesis tiene una probabilidad del
5% de ser falsa. 3. Curva característica operativa y curva de potencia Podemos limitar
un error de tipo I eligiendo adecuadamente el nivel de significancia.
Es posible evitar el riesgo de cometer el error tipo II simplemente
no aceptando nunca la hipótesis, pero en muchas aplicaciones prácticas
esto es inviable. En tales casos, se suele recurrir a curvas características
de operación o curvas de potencia que son gráficos que muestran las
probabilidades de error de tipo II bajo diversas hipótesis. Proporcionan
indicaciones de hasta que punto un test dado nos permitirá evitar un
error de tipo II; es decir, nos indicarán la potencia de un test a la
hora de prevenir decisiones erróneas. Son útiles en el diseño de experimentos
por que sugieren entre otras cosas el tamaño de muestra a manejar. 4. Pruebas de hipótesis para la media y proporciones Debido a la dificultad de explicar este tema se enfocará un
problema basado en un estudio en una fabrica de llantas. En este problema la fabrica de llantas tiene dos turnos de
operarios, turno de día y turno mixto. Se selecciona una muestra aleatoria
de 100 llantas producidas por cada turno para ayudar al gerente a sacar
conclusiones de cada una de las siguientes preguntas: 1.-¿ Es la duración promedio de las llantas producidas en el
turno de día igual a 25 000 millas? 2.- ¿Es la duración promedio de las llantas producidas en el
turno mixto menor de 25 000 millas? 3.-¿ Se revienta
más de un
8% de las llantas producidas por el turno de día antes de las 10 000
millas? PRUEBA DE HIPÓTESIS PARA LA MEDIA En la fabrica de llantas las hipótesis nula y alternativa para
el problema se plantearon como sigue: Ho: μ =
25 000 H1: μ ≠ 25 000 Si se considera la desviación estándar
σ las llantas producidas en el turno de día, entonces, con base
en el teorema de limite central, la distribución en el muestreo de la
media seguiría la distribución normal, y la prueba estadística que esta
basada en la diferencia entre la media
Si el tamaño de la región
α de rechazo se
estableciera en 5% entonces se podrían determinar los valores críticos
de la distribución. Dado que la región de rechazo esta dividida en las
dos colas de la distribución, el 5% se divide en dos partes iguales
de 2.5%. Dado que ya se tiene la distribución
normal, los valores críticos se pueden expresar en unidades de
desviación. Una región de rechazo de 0.25 en cada cola de la distribución
normal, da por resultado un área de .475 entre la media hipotética y
el valor crítico. Si se busca está área en la distribución normal, se
encuentra que los valores críticos que dividen las regiones de rechazo
y no rechazo son + 1.96 y
- 1.96
Por tanto, la regla para decisión sería: Rechazar
Ho si Z > + 1.96 o si Z < - 1.96 de lo contrario,
no rechazar Ho No obstante, en la mayor parte de los casos se desconoce la
desviación estándar
Para una muestra de
100, si se selecciona un nivel de significancía
como esta prueba de dos colas, la región de rechazo de .05
se vuelve a dividir en dos partes iguales de .025 cada una. Con el uso
de las tablas para t, los valores críticos son
–1.984 y +1.984. la regla para la decisión es: Rechazar
Ho si O si De lo contrario,
no rechazar Ho
los resultados de la muestra para el turno de día fueron
= Dado que Por ello, la de cisión de no rechazar la hipótesis nula Ho.
En conclusión es que la duración promedio de las llantas es 25 000 millas.
A fin de tener en cuenta la posibilidad de un error de tipo II , este
enunciado se puede redactar como “no hay pruebas de que la duración
promedio de las llantas sea diferente a 25 000 millas en las llantas
producidas en el turno de día”. PRUEBA DE HIPÓTESIS PARA PROPORCIÓNES El concepto de prueba de hipótesis se puede utilizar para probar
hipótesis en relación con datos cualitativos. Por ejemplo, en el problema
anterior el gerente de la fabrica de llantas quería determinar la proporción
de llantas que se reventaban antes de 10,000 millas. Este es un ejemplo
de una variable cualitativa, dado que se desea llegar a conclusiones
en cuanto a la proporción de los valores que tienen una característica
particular. El gerente de la fábrica de llantas quiere que la calidad de
llantas producidas, sea lo bastante alta para que muy pocas se
revienten antes de las 10,000 millas. Si más de un 8% de las llantas
se revientan antes de las 10,000 millas, se llegaría a concluir que
el proceso no funciona correctamente. La hipótesis nula y alternativa
se pueden expresar como sigue: Ho: p
H1: p
> .08 (no funciona
correctamente) La prueba estadística se puede expresar en términos de la proporción
de éxitos como sigue:
En donde
p = proporción
de éxitos de la hipótesis nula Ahora se determinará si el proceso funciona correctamente para
las llantas producidas para el turno de día. Los resultados del turno
de día índican que cinco llantas en una muestra de 100 se reventaron
antes de 10,000 millas para este problema, si se selecciona un nivel
de significancía
y la regla de decisión sería: Rechazar
Ho si Con los datos que se tienen,
y entonces,
Z La hipótesis nula no se rechazaría por que la prueba estadística
no ha caído en la región de rechazo. Se llegaría a la conclusión de
que no hay pruebas de que más del 8% de las llantas producidas en el
turno de día se revienten antes de 10,000 millas. El gerente no ha encontrado
ninguna prueba de que ocurra un número
excesivo de reventones en las llantas producidas en el turno de día.
|