XXI. PRUEBAS DE HIPÓTESIS

  • 1. Concepto
  • 2. Tipos de error y nivel de significancia
  • 3. Curva característica operativa y curva de potencia
  • 4. Pruebas de hipótesis para la media y proporciones

 

1.  Concepto

            Una prueba de hipótesis estadística es una conjetura  de una o más poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad de una hipótesis estadística, a no ser que se examine la población entera. Esto por su puesto sería impractico en la mayoría de las situaciones. En su lugar, se toma una muestra aleatoria de la población de interés y se utilizan los datos que contiene tal muestra para proporcionar evidencia que confirme o no la hipótesis. La evidencia de la muestra que es un constante con la hipótesis planteada conduce a un rechazo de la misma mientras que la evidencia que apoya la hipótesis conduce a su aceptación.

 

Definición de prueba de hipótesis estadística es que cuantifica el proceso de toma de decisiones.

 

Por cada tipo de prueba de hipótesis se puede calcular una prueba estadística apropiada. Esta prueba estadística mide el acercamiento del calor de la muestra (como un promedio) a la hipótesis nula. La prueba estadística, sigue una distribución estadística bien conocida (normal, etc.) o se puede desarrollar una distribución para la prueba estadística particular.

 

La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de  no rechazo. Si la prueba estadística cae en esta última región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente.

 

Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región de rechazo.

 

PASOS DE LA PRUEBA DE HIPÓTESIS

  1. Expresar la hipótesis nula
  2. expresar la  hipótesis alternativa
  3. especificar el nivel de significancía
  4. determinar el tamaño de la muestra
  5. establecer los valores criticos que establecen las regiones de rechazo de las de no rechazo.
  6. determinar la prueba estadística.
  7. coleccionar los datos y calcular el valor de la muestra de la prueba estadística apropiada.
  8. determinar si la prueba estadística ha sido en la zona de rechazo a una de no rechazo.
  9. determinar la decisión estadística.
  10. expresar la decisión estadística en términos del problema.

 

 

 

2. Tipos de error y nivel de significancia

            Si rechazamos una hipótesis cuando debiera ser aceptada diremos que se ha cometido un error de tipo I. Por otra parte si aceptamos una hipótesis que debiera ser rechazada, diremos que se ha cometido un error de tipo II. En ambos casos se ha producido un juicio erróneo.

            Para que las reglas de decisión sean buenas, deben diseñarse de modo que minimicen los errores de decisión, y no es una cuestión sencilla, por que para cualquier tamaño de la muestra, un intento de disminuir un tipo de error suele ir acompañado de un crecimiento del otro tipo. En la práctica un tipo de error puede ser más grave que el otro, y debe alcanzarse un compromiso que disminuya el error más grave , la única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra, que no siempre es posible.

 

 

NIVEL DE SIGNIFICANCIA

            Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos dispuestos a correr el riesgo de cometer un error de tipo I se llama nivel de significancia. Esta probabilidad se denota por , se suele especificar antes de la muestra, de manera que los resultados no influyan en nuestra elección.

            En la práctica es frecuente un nivel de significancia de 0.05 ó 0.01, si bien se usan otros valores. Si, por ejemplo, se escoge un nivel de significancia del 5% ó 0.05 al diseñar una regla de decisión entonces hay unas cinco oportunidades entre cien de rechazar la hipótesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis a sido rechazada al nivel de significancia 0.05 lo cual quiere decir que la hipótesis tiene una probabilidad del 5% de ser  falsa.

 

 

 

3. Curva característica operativa y curva de potencia

Podemos limitar  un error de tipo I eligiendo adecuadamente el nivel de significancia. Es posible evitar el riesgo de cometer el error tipo II simplemente no aceptando nunca la hipótesis, pero en muchas aplicaciones prácticas esto es inviable. En tales casos, se suele recurrir a curvas características de operación o curvas de potencia que son gráficos que muestran las probabilidades de error de tipo II bajo diversas hipótesis. Proporcionan indicaciones de hasta que punto un test dado nos permitirá evitar un error de tipo II; es decir, nos indicarán la potencia de un test a la hora de prevenir decisiones erróneas. Son útiles en el diseño de experimentos por que sugieren entre otras cosas el tamaño de muestra a manejar.

 

 

 

4. Pruebas de hipótesis para la media y proporciones

Debido a la dificultad de explicar este tema se enfocará un problema basado en un estudio en una fabrica de llantas.

En este problema la fabrica de llantas tiene dos turnos de operarios, turno de día y turno mixto. Se selecciona una muestra aleatoria de 100 llantas producidas por cada turno para ayudar al gerente a sacar conclusiones de cada una de las siguientes preguntas:

 

1.-¿ Es la duración promedio de las llantas producidas en el turno de día igual a 25 000

millas?

 

2.- ¿Es la duración promedio de las llantas producidas en el turno mixto menor de 25 000 millas?

 

3.-¿ Se  revienta  más  de  un 8% de las llantas producidas por el turno de día antes de las 10 000 millas?

 

PRUEBA DE HIPÓTESIS PARA LA MEDIA

 

En la fabrica de llantas las hipótesis nula y alternativa para el problema se plantearon como sigue:

 

Ho: μ = 25 000

H1: μ  ≠ 25 000

 

Si se considera la desviación estándar σ las llantas producidas en el turno de día, entonces, con base en el teorema de limite central, la distribución en el muestreo de la media seguiría la distribución normal, y la prueba estadística que esta basada en la diferencia entre la media de  la muestra y la media μ hipotética se encontrara como sigue:

 

 

Si el tamaño de la región  α  de rechazo se estableciera en 5% entonces se podrían determinar los valores críticos de la distribución. Dado que la región de rechazo esta dividida en las dos colas de la distribución, el 5% se divide en dos partes iguales de 2.5%.

 

Dado que ya se tiene la  distribución  normal, los valores críticos se pueden expresar en unidades de desviación. Una región de rechazo de 0.25 en cada cola de la distribución normal, da por resultado un área de .475 entre la media hipotética y el valor crítico. Si se busca está área en la distribución normal, se encuentra que los valores críticos que dividen las regiones de rechazo y no rechazo son + 1.96  y  - 1.96

 

Por tanto, la regla para decisión sería:

 

Rechazar Ho si Z > + 1.96

o si  Z < - 1.96

de lo contrario, no rechazar  Ho

 

 

 

No obstante, en la mayor parte de los casos se desconoce la desviación estándar  de la población. La desviación estándar se estima al calcular S, la desviación estándar de la muestra. Si se supone que la población es normal la distribución en el muestreo de la media seguiría una distribución t con  n-1 grados de libertad. En la práctica, se a encontrado que siempre y cuando el tamaño de la muestra no sea muy pequeño y la población no este muy sesgada, la distribución t da una buena aproximación a la distribución de muestra de la media. La prueba estadística para determinar  la diferencia entre la media  de la muestra y la media  de la población cuando se utiliza la desviación estándar S de la muestra, se expresa con:

 

=

 

Para una muestra  de 100, si se selecciona un nivel de significancía de .05, los valores críticos de la distribución t con 100-1= 99 grados de libertad se puede obtener como se indica en la siguiente tabla:

 

 

como esta prueba de dos colas, la región de rechazo de .05 se vuelve a dividir en dos partes iguales de .025 cada una. Con el uso de las tablas para t, los valores críticos son  –1.984 y +1.984. la regla para la decisión es:

 

 

 

Rechazar Ho si >+1.984

O si  - 1.984

De lo contrario, no rechazar Ho

 

 

 

los resultados de la muestra para el turno de día fueron =25 430 millas,=4 000 millas y = 100. Puesto que se esta probando si la media es diferente a 25 000 millas, se tiene con la ecuación

 

=

 

=

 

=  = + 1.075

 

Dado que = 1.075, se ve que  -1.984 < +1.075 < + 1.984, entonces no se rechaza Ho.

 

Por ello, la de cisión de no rechazar la hipótesis nula Ho. En conclusión es que la duración promedio de las llantas es 25 000 millas. A fin de tener en cuenta la posibilidad de un error de tipo II , este enunciado se puede redactar como “no hay pruebas de que la duración promedio de las llantas sea diferente a 25 000 millas en las llantas producidas en el turno de día”.

 

PRUEBA DE HIPÓTESIS PARA  PROPORCIÓNES

El concepto de prueba de hipótesis se puede utilizar para probar hipótesis en relación con datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fabrica de llantas quería determinar la proporción de llantas que se reventaban antes de 10,000 millas. Este es un ejemplo de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a la proporción de los valores que tienen una característica particular.

 

El gerente de la fábrica de llantas quiere que la calidad de  llantas producidas, sea lo bastante alta para que muy pocas se revienten antes de las 10,000 millas. Si más de un 8% de las llantas se revientan antes de las 10,000 millas, se llegaría a concluir que el proceso no funciona correctamente. La hipótesis nula y alternativa se pueden expresar como sigue:

 

Ho: p .08      (funciona correctamente)

H1: p > .08  (no funciona correctamente)

 

La prueba estadística se puede expresar en términos de la proporción de éxitos como sigue:

 

 

 

 

En donde

 

==

 

p = proporción de éxitos de la hipótesis nula

 

 

Ahora se determinará si el proceso funciona correctamente para las llantas producidas para el turno de día. Los resultados del turno de día índican que cinco llantas en una muestra de 100 se reventaron antes de 10,000 millas para este problema, si se selecciona un nivel de significancía de .05, las regiones de rechazo y no rechazo se establecerían como a continuación se muestra:

 

 

y la regla de decisión sería:

 

Rechazar Ho si > + 1.645; de lo contrario no rechazar Ho.

 

Con los datos que se tienen,

 

=  = .05

 

y entonces,

 

= =   =  = -1.107

 

 

 

Z -1.107 < + 1.645;  por tanto no rechazar Ho.

 

La hipótesis nula no se rechazaría por que la prueba estadística no ha caído en la región de rechazo. Se llegaría a la conclusión de que no hay pruebas de que más del 8% de las llantas producidas en el turno de día se revienten antes de 10,000 millas. El gerente no ha encontrado ninguna prueba de que ocurra un  número excesivo de reventones en las llantas producidas en el turno de día.