[Vuelve a INICIO] [Va a Estimación de Parámetros] [Va a Test de Hipótesis II]

PARTE 2: TEST DE HIPÓTESIS

Tema 2: Test de Hipótesis de un parámetro

Índice: Actividades complementarias:
Trabajo práctico
Autoevaluación
Evaluación

INTRODUCCIÓN

Recuérdese que muchas veces el objetivo de la Estadística es hacer inferencias con respecto a parámetros poblacionales desconocidos, basadas en la información obtenida mediante datos muestrales. Estas inferencias se expresan en una de dos maneras, como estimaciones de los parámetros respectivos o como pruebas de hipòtesis referentes a sus valores. En este capítulo o parte se estudiará el tema de la prueba (o contraste, o test) de hipótesis.

Con frecuencia, los problemas a los que se enfrenta el científico o el experimentador no se refieren sólo a la estimación de un parámetro poblacional como se indicó en el capítulo precedente, sino, y es aún más frecuente en los problemas prácticos, el que se tenga que formular un procedimiento de decisión basado en los datos que conduzcan a una conclusión acerca de algún planteamiento científico. Esta es la situación en que se encuentra, por ejemplo, un investigador que pretende demostrar que la droga A es más efectiva para el tratamiento de cierta enfermedad que la droga B; cuando un sicólogo desea comprobar si cierto formato de instrucción incrementará la eficiencia en el aprendizajes; cuando un ingeniero agrónomo desea comprobar si una nueva distancia de siembra entre surcos, para un cultivo, produce mejores rendimientos que las distancias que se usaban comúnmente en la zona; cuando el jefe de marketing asegura que determinado producto se aceptado por el 60% de la población consumidora, etc.

En cada uno de los anteriores casos el responsable del estudio postula o conjetura algo acerca de un sistema. Estos constituyen enunciados provisionales, puesto que al no poder integrar el cúmulo de sus conocimientos todo lo concerniente a la situación, aparece la incertidumbre. La función de la estadística en su aspecto inferencial es la de apoyar el razonamiento para llegar a decisiones sólidas a pesar de la incertidumbre. Al respecto, es tan importante el papel que desempeña la estadística en estas situaciones que se suele hablar de la estadística moderna como "el estudio de las decisiones ante la incertidumbre".

Se puede decir que se llaman decisiones estadísticas a las decisiones que deben tomarse con respecto a las poblaciones a partir de una información obtenida de una muestra de las mismas. Por ejemplo, a partir de los datos del muestreo podemos querer llegar a decidir si un suero nuevo es realmente efectivo para la cura de una enfermedad, si un sistema educacional es mejor que otro, si una moneda está o no cargada, etc.

En los casos que se han señalado se observa que se deben tomar decisiones con base en datos experimentales. Y si hay que tomar decisiones es porque hay alternativas; cada una de estas alternativas es formalizada como una hipótesis estadística y el proceso mediante el cual se enfrentan o confrontan las hipótesis al tomar como punto de apoyo los datos muestrales constituye lo que se denomina prueba o contraste de hipótesis.

[Vuelve al índice]

ELEMENTOS DE UN TEST DE HIPÓTESIS.

Una hipótesis es una suposición sobre la naturaleza de una población. Las hipótesis generalmente están expresadas en términos de parámetros poblacionales.

Las siguientes son algunos ejemplos de hipótesis:

Ä m = 5 (la media poblacional es igual a 5)

Ä m < 67 (la media poblacional es menor que 67)

Ä 2 = 4 (la variancia poblacional es igual a 4)

Ä 2 >11 (la variancia poblacional es mayor que 11)

Un test de una hipótesis es un procedimiento estadístico usado para tomar una decisión sobre el valor de un parámetro poblacional.

La hipótesis nula (H0) especifica el valor de un parámetro poblacional. Se conduce un experimento para ver si el valor especificado no es razonable.

Ejemplo :Un semillero publicita que el peso promedio de una espiga de una cierta variedad es de 180 gramos con una desvío estándar de 30 gramos. Un productor de avanzada sospecha que el peso es distinto de 180 gramos, decide por lo tanto conducir un experimento. El propósito del mismo es ver si el peso de 180 gramos es incorrecto. Por lo tanto la hipótesis nula de interés es:

H0 : m = 180 gramos

La hipótesis alternativa (H1) da una suposición opuesta a aquella presentada en la hipótesis nula. El experimento se lleva a cabo para conocer si la hipótesis alternativa puede ser sustentada.

En el ejemplo previo el productor sospecha que el peso medio es distinto de 180 gramos. Esta es la hipótesis a ser sustentada y así la hipótesis alternativa es:

H1 m > 180 gramos ó m < 180 gramos ó 180 gramos

Se puede ver que las hipótesis son excluyentes. La hipótesis alternativa frecuentemente se llama hipótesis de investigación, porque este tipo de hipótesis expresa la teoría que el investigador o experimentador cree va a ser verdadera.

Un test estadístico es una cantidad calculada de la muestra y se usa cuando se va a hacer una decisión sobre la hipótesis de interés.

Después que el productor de este ejemplo prueba la variedad en 50 parcelas sembradas al azar, seleccionando un conjunto de espigas por parcela, el test estadístico debe ser calculado. Por ejemplo la media de la muestra se podría usar como test estadístico para tomar una decisión acerca del valor de m , o si se obtiene una muestra suficientemente grande se podría utilizar una estadística z para comparar el valor observado de con respecto a 180 gramos especificado en la hipótesis nula. Así un posible test estadístico cuando 2 se conoce, sería :

Para interpretar el valor del test estadístico es necesario introducir un elemento más al test de hipótesis: la región de rechazo, que especifica los valores del test estadístico para los cuales la hipótesis nula es rechazada ( y para los cuales la hipótesis alternativa no es rechazada).

La región de rechazo identifica los valores del test estadístico que sostienen o sustentan la alternativa y serían improbables, (raros) si la hipótesis nula fuera verdadera.

Ya que no se espera observar sucesos raros (valores improbables del test estadístico) la hipótesis nula se rechazará cuando la muestra produzca un valor tal.

Para el ejemplo si la media fuera menor que 180 gr o mayor que 180 gr esta sustentaría la hipótesis alternativa

(m 180) y un valor de más de 2, (1,96) errores estándares por debajo o por encima de 180 sería raro o poco probable.

El propósito de cualquier test de hipótesis es decidir cual hipótesis - la nula o la alternativa - sería rechazada. Ya que cualquier decisión estará basada sobre información parcial de una población, contenida en una muestra, habrá siempre una posibilidad de una decisión incorrecta. La siguiente tabla resume cuatro posibles situaciones que pueden surgir en un test de hipótesis.

 

Verdadero estado de la población

Decisión posible

H0 es cierta

H1 es cierta

Se rechazo H0

Error de tipo I (a )

Decisión correcta

No se rechaza H0

Decisión correcta

Error de tipo II (b )

Si la hipótesis nula es rechazada y de hecho, la hipótesis nula es verdadera, se cometió un error, que se llama Error de tipo I ().

Un Error de tipo II () ocurriría si la hipótesis nula fuera aceptada y de hecho, la hipótesis alternativa es verdadera.

Ya que nunca se puede eliminar la posibilidad de cometer un error de tipo I o un error de tipo II cuando se usan muestras para hacer inferencias, se considerarán las posibilidades de cometer estos errores.

= P (error de tipo I)

P (rechazar H0 si H0 es verdadera)

= P (error de tipo II)

P (aceptar H0 si H0 es falsa)

Es deseable que tanto como estén próximos a cero pero en general esto no es posible, ya que el experimentador desea concluir que H1 es verdadera (rechazar H0 ) el interés está en que tenga una probabilidad pequeña tal como 0,01 ó 0,05. En otras palabras , se desea estar seguro que si H0 es verdadera, será muy raro que sea rechazada. El experimentador es libre de elegir el valor de , esto es, determinar cuán raro un suceso observado debe ser para rechazar H0. Determinar si el valor de estará presente para el test de hipótesis es algo más complicado, de modo que no se intentará su cálculo.

Manteniendo pequeño se evita aceptar la hipótesis de investigación (alternativa) si la hipótesis nula es verdadera. De otra forma se induciría a la crítica de que se ha sesgado la investigación para probar la alternativa. El sacrificio de mantener pequeña es que la "chance" de aceptar la hipótesis nula, si la hipótesis de investigación es verdadera (), puede ser mayor de lo que se desea.

Resumiendo, en el ejemplo considerado el productor aceptando un error de 0,05 (5%), conocido también como nivel de significación y utilizando la estadística z, plantearía la hipótesis como sigue:

H0 : m = 180 gramos

H1 : m 180 gramos

Suponiendo que los resultados del experimento produjeron una media muestral de 187 gramos, el test estadístico se construiría como:

donde : 187 = media de la muestra (= 187)

180 = media hipotética (poblacional = 180)

30 = desvío estándar poblacional (conocido) (=30)

50 = tamaño de la muestra o repeticiones (n=50)

Para decidir si la hipótesis nula (H0) se rechaza o no se compara el valor de z calculado ( 1,65) con el valor de z tabulado N (0,1), para un nivel de probabilidad = 0,05. Por tratarse de una prueba bilateral, indicado por la desigualdad de la hipótesis alternativa (¼ 180) el valor de se particiona en dos /2 = 0,025, lo que implica que la probabilidad con la que se busca el valor de z, en la tabla de la distribución normal es 0,975, el valor de z correspondiente a esta probabilidad es 1,96.

Gráficamente las zonas de rechazo y aceptación serían:

como el valor de z calculado= 1,65 es menor que l,96 o sea cae en la región de aceptación , no hay evidencias sufucientes como para rechazar la hipótesis de que la media de la población es igual a 180.

Conclusión: la publicidad que hace el semillero de que el peso promedio de las espigas de una cierta variedad es de 180 gramos, es correcta, aunque podría existir una probabilidad de error tipo II, si de hecho la media de tal variedad no fuera 180 gramos

[Vuelve al índice]

HIPÓTESIS UNILATERALES

Si en el mismo ejemplo, el productor, basándose en algún conocimiento de la variedad en cuestión sospechara que el peso promedio de las espigas es menor que 180, las hipótesis se plantearían como:

H0: m = 180 gramos o H0 : m > 180 gramos

H1: m < 180 gramos

 = 0,05

En este caso la desigualdad de la hipótesis alternativa indica cuál sería la zona de rechazo, el valor de ya no se particiona sino que se acumula todo hacia un solo lado, el izquierdo en este ejemplo y el valor tabulado de z se busca en la tabla con un valor de probabilidad del 95% siendo z= -1,64 (el signo negativo no figura en la tabla ya que siendo la distribución normal simétrica, lo que se hace es anteponer el signo negativo al valor de z que corresponde al nivel de probabilidad especificado)

Si por otra parte, el productor sospechara que el peso promedio es mayor que 180 gramos, la hipótesis y la zona de rechazo se plantearían como:

H0: m = 180 gramos ó H0: m < 180 gramos

H1: m > 180 gramos

 = 0,05

en ambas situaciones el test estadístico se construye como:

cuando se desconose, el test estadístico se construye como:

Este valor difiere del anterior en que, en lugar de aparecer la desviación estándar de la población, nos encontramos con su estimador muestral insesgado S, que se distribuye, t de Student (t ~ t(n-1))

[Vuelve al índice]

POTENCIA DEL CONTRASTE

Partiendo del planteo de las siguientes hipótesis:

H0 : m = m 0

H1 : m m 0

La probabilidad de error tipo I () está dada por el nivel de significación; en cambio, la probabilidad del error tipo II () ya no es una cantidad determinada para cada nivel de significación, sino que depende del valor de m .

La probabilidad del error tipo II () para valores de m próximos a m 0 es grande en comparación con la probabilidad de este error para valores de m que están alejados de m 0.

Por ejemplo, si H0 afirma que la media es igual a 20, la probabilidad de no rechazar H0 es evidentemente mayor si la verdadera media es 25 que si es 30. Esto se detalla con mayor claridad en la siguiente figura en el que el área rayada indica la probabilidad de error tipo II ().

Por supuesto se puede calcular la probabilidad de error tipo II para cualquier valor de m . Cuanto menor sea esta probabilidad mejor será el contraste para distinguir entre hipótesis ciertas y falsas, o sea, cuanto menor sea la probabilidad de no rechazar H0, cuando esta sea falsa, más "potente" es el contraste. La potencia de un contraste se mide por la probabilidad de rechazar H0 cuando sea falsa. Al ser la probabilidad de no rechazar H0 cuando esta es falsa, la potencia del contraste es igual a: 1 - P ( error tipo II )

[Vuelve al índice]

ESQUEMA PARA CONTRASTAR HIPÓTESIS

Cuando se tiene que contrastar una hipótesis estadística es conveniente seguir un esquema, el cual debe incluir las siguientes etapas:

1) Enunciado de la hipótesis nula y alternativa

2) Elección del nivel de significación ()

3) Selección del estadístico de prueba.

4) Determinación de la región crítica.

5) Cálculo del estadístico.

6) Exposición de las conclusiones.

[Vuelve al índice]

CONTRASTE DE HIPÓTESIS RESPECTO A UNA MEDIA POBLACIONAL (s desconocido)

Las hipótesis se plantean de forma similar al caso en que s es conocido, pero la estadística de prueba es la "t" de Student.

Ejemplo: Para estimar el rendimiento de parcelas plantadas con papa de una cierta variedad, se cosecharon ocho de ellas, obteniéndose la siguiente información expresada en kg/parcela:

4,5 5,3 5,4 4,9 5,3 5,7 6,2 4,8

¿Se puede asegurar, con a =0,05, de que esta variedad de papas tiene un rendimiento promedio de 5,25 kg?

H0 : m = 5,25

H1 : m 5,25

A partir de los datos se calcula y S², para este ejemplo = 5,5625 y S² =0,2884.

=

Como el valor de t calculado cae entre –2,365 y 2,365 (valor tabulado de t para 7 grados de libertad y a = 0,025, no se rechaza la hipótesis nula.

Conclusión: No hay duficiente evidencia, a partir de los datos de la muestra, para decir que el rendimiento de papa por parcela no es igual a 5,25.

[Vuelve al índice]

CONTRASTE DE HIPÓTESIS REFERENTES A UNA PROPORCIÓN POBLACIONAL (P)

Las hipótesis formuladas son:

H0: P P0

H1: P < P0

: 0,05

En el caso del parámetro poblacional "P", cuando el tamaño de la muestra es grande, la variable aleatoria proporción muestral "p" se distribuye aproximadamente normal con esperanza igual a P y desviación estandar igual

Por eso se puede utilizar "p" como criterio de test para probar la hipótesis con respecto al parámetro proporción poblacional. El test estadísto z se calcula:

Gráficamente podemos establecer la correspondiente región de rechazo de H0 en la cola de la distribución normal

Ejemplo: Se supone que en un cierto partido de la provincia de Buenos Aires, el 90% de los productores cultivan maíz. De 110 productores de la zona que se encuestaron, 95 hacen maíz. ¿Está este resultado en conformidad con el valor supuesto?. (a = 0,05)

H0: P = 0,90

H1: P ¹ 0,90

Como el valor calculado de Z = –0,97 reside entre los valores tabulados –1,96 y 1,96 (valores críticos de la distribucion normal ) no se rechaza H0.

Conclusión, la información proporcionada por la muestra no es suficiente como para decir que la proporción de productes de tal partido que cultivan maíz es distinto de 90%.

[Vuelve al índice]

CONTRASTE DE HIPÓTESIS REFERENTES AL PARÁMETRO VARIANZA POBLACIONAL

Por ejemplo, un operador en la bolsa de cereales, aconseja a un cliente con respecto a una inversión de compra y destaca la poca variabilidad de dicha cotización. De acuerdo a lo estipulado por él, esta acción presentaría una varianza en las cotizaciones diarias = 0,2.

El cliente, quien debe realizar una fuerte inversión, decide poner a prueba la hipótesis del operador, estableciendo las siguientes hipótesis estadísticas:

H0) 0,2

H1) > 0,2

Fijamos: = 0,05, como nivel de significación.

Para probar esta hipótesis selecciona una muestra de 15 días donde se registra la cotización diaria. El cálculo de la varianza en la muestra es S2 = 0,4.

El test estadístico es:

que se distribuye como una con (n - 1) grados de libertad.

Se calcula el valor del estadístico planeado:

Gráficamente se tendrá:

Como se puede observar, el estadístico utilizado como criterio para realizar el test, cae en la zona de rechazo de la hipótesis nula.

Conclusión: La evidencia muestral parece indicar que el operador estaba equivocado y que en realidad la cotización diaria es bastante más variable de lo que él cree.

[Vuelve al índice]

[Vuelve a INICIO] [Va a Estimación de Parámetros] [Va a Test de Hipótesis II]