Descargar

Teoría de la decisión estadística, ensayos de hipótesis y significación (página 2)

Enviado por gus_wolvering


Partes: 1, 2

En la práctica se acostumbra a utilizar niveles de significación del 0.05 ó 0.01, aunque igualmente pueden emplearse otros valores. Si, por ejemplo, se elige un nivel de significación del 0.05 ó 5 % al diseñar un ensayo de hipótesis, entonces hay aproximadamente 5 ocasiones en 100 en que se rechazaría la hipótesis cuando debería ser aceptada, es decir, se está con un 95 % de confianza de que se toma la decisión adecuada. En tal caso se dice que la hipótesis ha sido rechazada al nivel de significación del 0.05, lo que significa que se puede cometer error con una probabilidad de 0.05.

Ensayos referentes a la distribución normal

edu.red

Para aclarar las ideas anteriores, supóngase que con una hipótesis dada, la distribución muestral de un estadístico S es una distribución normal con media µs Y desviación típica uso Entonces la distribución de la variable tipificada (representada por z) dada por z = (S –µs) /ss, es una normal tipificada (media 0, varianza 1) y se muestra en la figura.

Como se indica en la figura, se puede estar con el 95 % de confianza de que, si la hipótesis es cierta, el valor de z obtenido de una muestra real para el estadístico S se encontrará entre -1.96 y 1.96 (puesto que el área bajo la curva normal entre estos valores es 0.95).

Sin embargo, si al elegir una muestra al azar se encuentra que z para ese estadístico se halla fuera del rango -1.96 a 1.96, lo que quiere decir que es un suceso con probabilidad de solamente 0.05 (área sombreada de la figura) si la hipótesis fuese verdadera. Entonces puede decirse que esta z difiere significativamente de la que cabía esperar bajo esta hipótesis y se estaría inclinado a rechazar la hipótesis.

El área total sombreada 0.05 es el nivel de significación del ensayo. Representa la probabilidad de cometer error al rechazar la hipótesis es decir, la probabilidad de cometer error del Tipo I. Así, pues, se dice que la hipótesis se rechaza al nivel de significación del 0.05 o que la z obtenida del estadístico muestral dado es significativa al nivel de significación del 0.05.

El conjunto de las z que se encuentran fuera del rango -1.96 a 1.96 constituyen lo que se llama región crítica o región de rechace de la hipótesis o región de significación. El conjunto de las z que se encuentran dentro del rango -1,96 a 1,96 podía entonces llamarse región de aceptación de la hipótesis o región de no significación.

De acuerdo con lo dicho hasta ahora; se puede formular la siguiente regla de decisión o ensayo de hipótesis o significación.

(a) Se rechaza la hipótesis al nivel de significación del 0.05 si la z obtenida para el estadístico S se encuentra fuera del rango -1.96 a 1.96 (es decir, z > 1,96 o z < -1,96). Esto equivale a decir que el estadístico muestral observado es significativo al nivel del 0,05.

(b) Se acepta la hipótesis (o si se desea no se toma decisión alguna) en caso contrario.

A causa de su importante papel en los ensayos de hipótesis y significación, z recibe también el nombre de ensayo estadístico.

edu.red

Debe ponerse de manifiesto que pueden igualmente emplearse otros niveles de significación. Por ejemplo, si se utilizase el nivel del 0.01 se sustituiría 1.96 en todo lo visto anteriormente por 2.58 (véase Tabla).

Ensayos de una y dos colas

En el ensayo anterior se atendía a los valores extremos del estadístico S o su correspondiente z a ambos lados de la media, es decir, en las dos «colas» de la distribución. Por esta razón, tales ensayos se llaman ensayos de dos colas o ensayos bilaterales.

Sin embargo, con frecuencia, se puede estar solamente interesado en los valores extremos a un solo lado de la media, es decir, en una «cola» de la distribución, como, por ejemplo, cuando se están ensayando la hipótesis de que un proceso es mejor que otro (que es diferente a ensayar si un proceso es mejor o peor que otro). Tales ensayos se llaman ensayos de una cola o ensayos unilaterales. En tales casos, la región crítica es una región a un lado de la distribución, con área igual al nivel de significación.

La Tabla anterior, que da los valores críticos de z para ensayos de una y dos colas a distintos niveles de significación, será de utilidad para propósitos de referencia. Valores críticos de z para otros niveles de significación, se pueden encontrar utilizando la tabla que da las áreas bajo la curva normal.

Ensayos especiales

Para muestras grandes, las distribuciones muestrales de muchos estadísticos son distribuciones normales (o al menos casi normales) con media µs y desviación típica ss. En tales casos, se pueden utilizar los resultados anteriores para formular reglas de decisión o ensayos de hipótesis y significación. Los siguientes casos especiales, son solamente unos pocos de los estadísticos de interés práctico. En cada caso, los resultados son para poblaciones infinitas o para muestreo con reemplazo. Para muestreo sin reemplazo de poblaciones finitas los resultados deberán modificarse.

l. Medias. Aquí S = x, la media muestral; µs = µx = µ, media poblacional; ss = sx = s/vN, donde µ es la desviación típica poblacional y N es el tamaño de la muestra. El valor de z viene dado por

edu.red

Donde se utiliza la desviación muestral s o S para estimar s.

2. Proporciones. Aquí S = P, la proporción de «éxitos» en una muestra; µ s = µ p = p, donde p es la proporción de éxitos en la población y N es el tamaño de la muestra; ss = sp = vpq/N, donde q = 1 – p. El valor de z viene dado por

edu.red

En el caso de que P = X/N, donde X es el número real de éxitos en una muestra, z se convierte en

edu.red

Análogamente pueden obtenerse los resultados para otros estadísticos.

Curvas características de operación. Potencia de un ensayo

Se ha visto cómo el error del Tipo I puede limitarse eligiendo adecuadamente un nivel de significación. Es posible evitar el riesgo de error del Tipo II totalmente, simplemente no aceptando nunca la hipótesis. Sin embargo, en muchos casos prácticos esto no puede hacerse. En tales casos, se utilizan a menudo curvas características de la operación o curvas OC, que son gráficos que muestran las probabilidades de errores del Tipo II bajo diferentes hipótesis. Estos suministran información de cómo en ensayos dados se logra minimizar los errores del Tipo II, es decir, indican la potencia de un ensayo para evitar el tomar decisiones equivocadas. Son útiles en diseño de experimentos por mostrar, por ejemplo, qué tamaños de muestras deben emplearse.

GRAFICOS DE CONTROL

Es a menudo en la práctica importante conocer cuándo un proceso ha cambiado suficientemente, de modo que puedan darse los pasos necesarios para remediar la situación. Tales problemas aparecen, por ejemplo, en el control de calidad, donde uno debe, a veces rápidamente, decidir si los cambios observados se deben simplemente a fluctuaciones aleatorias o a cambios reales en el proceso de fabricación a causa de deterioro en las máquinas, errores de los empleados, etc. Los gráficos de control suministran un método útil y sencillo para tratar tales problemas.

Ensayos de significación en relación con diferencias muestrales

1. Diferencias de medias

Sean X 1 Y X 2 las medias muestrales obtenidas en dos muestras grandes de tamaño N 1 Y N 2 extraídas de poblaciones respectivas que tienen de media µ1 y µ2 Y desviaciones típicas s1 Y s2. Considérese la hipótesis nula de que no hay diferencia entre las medias poblacionales, es decir, µ1 = µ2 o que las muestras son extraídas de dos poblaciones que tienen la misma media.

Haciendo µ1 = µ2 se ve que la distribución muestral de la diferencia de medias se distribuye aproximadamente como una normal con media y desviación típica dadas por

edu.red

donde se puede, si es necesario, utilizar las desviaciones típicas muestrales S1 y S2 como estimas de s1 y s2.

Con la variable tipificada z que viene dada por

edu.red

se puede ensayar la hipótesis nula contra la hipótesis alternativa (o la significación de una diferencia observada) a un nivel de significación apropiado.

2. Diferencias de proporciones

Sean P1 y P2 las proporciones muestrales de dos grandes muestras de tamaños N1 y N2 extraídas de poblaciones respectivas que tienen proporciones P1 y P2. Considérese la hipótesis nula de que no hay diferencia entre los parámetros poblacionales, es decir, P1 = P2, Y así las muestras son realmente ex- traídas de la misma población.

Haciendo P1 = P2 = P, se ve que la distribución muestral de la diferencia de proporciones se distribuye aproximadamente como una normal con media y desviación típica dadas por

edu.red

donde

edu.red

se utiliza como una estima de la proporción poblacional, y q = 1 – p.

Con la variable tipificada z dada por

edu.red

se puede ensayar las diferencias observadas a un nivel de significación apropiado y de este modo ensayar la hipótesis nula.

Ensayos referentes a otros estadísticos pueden diseñarse análogamente.

Ensayos referentes a la distribución binomial

Ensayos que envuelven a la distribución binomial así como otras distribuciones, pueden diseñar- se de una manera análoga a los utilizados para la distribución normal, los principios básicos son esencialmente los mismos.

Bibliografía

Murray R. Spiegel, Estadística, teoría y 875 problemas resueltos. Mc Graw Hill, México 1970, pp 167 – 187.

 

 

 

 

 

 

Autor:

Martin del Campo Becerra Gustavo Daniel

Universidad de Guadalajara

CUCEI

Departamento de Matemáticas

Elementos de Probabilidad y Estadística

Maestra: Rosalía Buenrostro Arceo

Sec. D08

Gustavo Daniel Martín del Campo Becerra

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente