Decisión | ||
Si Ho es: | Rechazar | No Rechazar |
Verdadera | Error Tipo I | Acción correcta |
Falsa | Acción correcta | Error Tipo II |
Es importante medir las magnitudes de eso errores e intentar que sean las menores posibles, es decir que la probabilidad de cometerlo sea suficientemente pequeña, aunque es imposible reducir ambas tanto como se quiera, puesto que la disminución en una, en general, es el aumento de la otra.
Como consecuencia de la aleatoriedad de las observaciones muestrales es posible que la estimación obtenida se desvíe considerablemente de lo esperado por lo que se tome la decisión, siendo cierta Ho, de rechazarla. Es lógico o conveniente por tanto que la probabilidad de que esto suceda sea pequeña. Dentro de esta metodología, esta probabilidad, se denota por a y recibe el nombre de Nivel de Significación.
El nivel de significación, es un valor arbitrario, en el sentido de que es seleccionado a priori por el investigador de acuerdo a su experiencia y deseo. Siendo una probabilidad, puede asignársele cualquier valor entre 0 y 1, pero como es importante usar una cifra pequeña, los valores que con más frecuencia se utilizan son 0.05 y 0.01 o inclusive mas pequeños, aunque poco frecuentes en la practica usual .
Es conveniente notar que el uso del término, significación, es debido a que la diferencia entre, el valor hipotético (también llamado, teórico) y el hallado en la muestra (conocido como, práctico), se considera suficientemente grande, como para que no sea solamente atribuible al azar; es decir, que el concepto se refiere al estado de ser, estadísticamente significativo, y no es utilizado en el sentido funcional habitual de la palabra.
El conjunto de valores muéstrales que conducen a rechazar Ho se denomina o conoce como, región crítica o de rechazo, de la prueba de hipótesis.
Sea H una Hipótesis. Si la distribución muestral de un estadígrafo S es una distribución normal con media (S y desviación estándar ?s , entonces la distribución de la variable estandarizada (o puntuación Z) viene dada por Z=(S-(S)/?s , que es la distribución normal estandarizada ( media 0 y varianza 1)(Murray R Spiegel).
Como fue indicado en la anterior figura, se tendrá una confianza de un 95%, si la hipótesis H es verdadera, de que la puntuación de Z de un estadígrafo muestral S estará entre k1 y k2, ya que el área bajo la curva normal entre k1 y k2 es 0.95.
Como la distribución normal es simétrica, se distribuye a partes iguales la probabilidad de rechazar Ho, cuando esta es verdadera, entre las dos colas de la curva, y entonces rechazaremos Ho sólo si Z < k1 ó Z > k2, donde k1,2 están reflejados en la tabla que se muestra a continuación. La región crítica o de rechazo, entonces estará constituida por el conjunto de las todas muestras de un tamaño n, dado tales que el valor observado de Z cumpla con una de las dos siguientes condiciones: Z < k1 ó Z > k2.
Nivel de significación a | 0.10 | 0.05 | 0.01 | 0.005 | 0.002 | |
Valores críticos de k para pruebas de una cola | -1.28 ó 1.28 | -1.645 ó 1.654 | -2.33 ó 2.33 | -2.58 ó 2.58 | -2.88 ó 2.88 | |
Valores críticos de k para pruebas de dos colas | -1.645 y 1.645 | -1.96 y 1.96 | -2.58 y 2.58 | -2.81 y 2.81 | -3.08 y 3.08 |
Si, por otra parte, Z no se ubica en alguna de estas zonas, lo que sucede con probabilidad 1 – ?, entonces en este caso se decide no rechazar Ho, y en consecuencia a esa región central bajo la curva normal se le llama, región de no rechazo. En muchos textos de estadística se le denomina región de aceptación.
La siguiente tabla muestra en situaciones diferentes el modo de calcular el estadígrafo de prueba, según algunos textos:
Situación | Distribución | Estadígrafo |
Para ( y ( conocida | Normal estándar | |
( desconocida y n ( 30 | Normal estándar | |
( desconocida y n ( 30 | t-Student | |
Proporciones para muestras grandes | Normal estándar | Z = |
Para muestras grandes las distribuciones muestrales de muchos estadígrafos Z, son distribuciones normales con media (x y desviación estándar (S.
Los casos siguientes son de interés práctico, pero para poblaciones infinitas o para muestreos con reemplazo. Para Medias y Proporciones se puede calcular Z según se indica a continuación:
Media. Sea S = la media muestral, (x = ( la media poblacional, (x = (/ donde ( es la desviación estándar de la población y N el tamaño de la muestra. Entonces Z=
Proporción. Sea P la proporción de «éxito» en una muestra; (p = p, donde p es la proporción de éxito de la población y N es el tamaño de la muestra; (p =, donde q=1-p. El valor de Z se expresa por Z= . En el caso en que P=X/N donde X es el número real de éxito en una muestra, el valor de Z se expresa por Z= , donde (x = (=Np, y (x = (= .
Ejemplo.
El fabricante de una medicina ME, patentada, adujo que la misma era efectiva un 90 % en la cura de una dolencia. En una muestra de 200 pacientes con la dolencia y que fueron tratados con ME, se curaron 160. Determinar si lo alegado por el fabricante es legítimo.
Solución:
Sea p la probabilidad de ser curado por la medicina ME patentada por el fabricante.
Formulación de las hipótesis Ho y H1: Ho: p=0.9 vs H1: p
Si se condensan los resultados hasta aquí obtenidos, a manera de conclusiones se puede abordar, que todo problema de prueba de hipótesis consiste en lo siguiente:
1. Identificar una variable aleatoria X que tiene una distribución conocida, es decir, que pertenece a una clase determinada, por ejemplo a las del tipo normal, y con relación a la cual se quiere tomar una decisión respecto al valor de un parámetro desconocido, pero asociado a ella, digamos (, (, …,etc
2. Se plantea una hipótesis nula, donde se asume un valor para el parámetro; y una hipótesis alternativa donde se contradice lo expresado en la hipótesis nula.
3. Se escoge el nivel de significación a, que es la probabilidad de rechazar la hipótesis nula siendo esta cierta.
4. Se selecciona una muestra de tamaño n para estimar el parámetro desconocido y poder posteriormente decidir si se rechaza o no H0.
5. Se define la región crítica para la prueba de hipótesis de interés.
6. Se toma la decisión de rechazar H0, con un nivel de significación a si el valor estimado del parámetro está en la región crítica y de no rechazar H0 si este valor no está en la región crítica.
TAPIA B María Antonieta. APUNTES Metodología de la Investigación. INACAP. Ingeniería en Gestión Informática. Sede Temuco. Santiago, 2000.
CÓRDOVA MARTÍNEZ, Carlos A. Consideraciones sobre la Metodología de la Investigación. Centro de Estudios sobre la Cultura e Identidad. Universidad de Holguín "Oscar Lucero Moya". Holguín.
ALVAREZ GONZÁLEZ Alfredo. Informática e Investigación I. Guías de Estudios. Instituto Superior de Ciencias Médicas de La Habana. Facultad de Tecnología de la Salud. La Habana. 2006.
MURRAY R. SPIEGEL. Teoría y Problemas de Estadística. Dirección General de de Formación y Perfeccionamiento de Personal Pedagógico. La Habana. 1979
GUERRA BUSTILLO Caridad W, MENENDEZ ACUÑA Ernesto, BARRERO MORERA Rolando. EGAÑA MORALES Esteban. Estadística. Editorial Pueblo y Educación. La Habana. 1991
TORRICELLA MORALES Raúl G. Elaboración de Bibliografías. Descripción simplificada del formato ISO 690:1997. Dpto. de Alimentos. Instituto de Farmacia y Alimentos. Universidad de la Habana. La Habana.
Autor:
Ms C. Rolando Su?rez Guillard
Instituci?n: Sede Universitaria Municipal "Julio Antonio Mella".
Municipio: Antilla.
Provincia: Holgu?n.
Pa?s: Cuba.
Fecha de elaboraci?n del art?culo: Febrero de 2009
Graduado en 1989 de Licenciatura en Educaci?n, especialidad Matem?tica, en el ISP de Holgu?n. Graduado de Master en "Nuevas Tecnolog?as para la Educaci?n" en el 2007. Se desempe?a como profesor de la Sede Universitaria "Julio Antonio Mella ", tarea que ha desempe?ado con resultados satisfactorios en la tutor?a, en la docencia, es vicepresidente de una C?tedra Honor?fica y responsable de extensi?n universitaria de la carrera de Estudios Socioculturales. Ha participado adem?s en eventos cient?ficos. Posee amplia experiencia en investigaciones de car?cter hist?rico-social.
Página anterior | Volver al principio del trabajo | Página siguiente |