- Marco Teórico
- Antecedentes Bibliográficos.
- Planeamiento o Formulación.
- Objetivos.
- Hipótesis
- Diseño de la Muestra
- Análisis Interpretación de Resultados
- Conclusiones.
- Recomendaciones
- Bibliografía.
El análisis de varianza (ANOVA) es una prueba, un cálculo que nos permite medir la variación de las respuestas numéricas como valores de evaluación de diferentes variables nominales.
La prueba a realizar en el Análisis de Varianza es de sí existe diferencia en los promedios para la los diferentes valores de las variables nominales; esta prueba se realiza para variables donde una tiene valores nominales y la otra tiene valores numéricos.
En el siguiente ejemplo de aplicación, se tiene la medición de las Señales de Recepción en el medio Ambiente de Celulares lo que se intenta es probar si existe o no diferencias en las diferentes lecturas tomados en diferentes distritos. (Variable nominal ).
Para analizar si existe diferencia en los promedios se procede a realizar una prueba F que se explica posteriormente n el siguiente trabajo de investigación para observar como las señales varían según el recorrido constante y variable en el entorno para medir las señales de recepción .
ANALISIS DE VARIANZA
LA DISTRIBUCION F
ANOVA, del inglés Análisis Of VAriance, es un test estadístico ideado por Fisher, gran genio inglés que pensó hace más de 60 años como analizar datos simultáneamente cuando tenemos varios grupos y así poder ahorrar tiempo y dinero. Este análisis por lo tanto permite comprobar si existen diferencias entre promedios de tres o más tratamientos y para ello se calcula el valor de F, y es equivalente al test de Student, salvo que éste último solamente sirve para dos grupos. Desde ya tenemos que dejar establecido que cuando encontramos el valor de F sabremos si existen diferencias entre los grupos, pero no nos dice entre cuales grupos.
La comparación simultanea de varias medias poblacionales se denomina Análisis de Varianza ( ANOVA de analisys of variante ).
Para los casos, las poblaciones deben ser normales y los datos, por lo menos deben estar en el nivel de intervalos.
- Los Grados de Libertad en el numerador y los Grados de Libertad en el denominador
- La distribución F es continua, significa que puede tomar una cantidad infinita de valores entre 0 y mas infinito.
- La distribución F no puede ser negativa. Dado que el menor valor de F es cero.
- La distribución F es positivamente sesgada, dado que la cola larga de la distribución se encuentra a la derecha , conforme el número de Grado de Libertad aumenta, tanto el numerador como el denominador, la distribución se aproxima a una distribución normal.
- La distribución F es asintótica, conforme lo valores de X aumentan , la curva de la distribución F se aproxima al eje X , pero nunca lo toca.
Grados de Libertad (n1/n2)
El uso de la distribución F es la técnica del análisis de varianza (ANOVA), con lo q se comparan tres o mas medias poblacionales para determinar si son iguales. Para usar el ANOVA se considera lo siguiente:
- Las poblaciones están distribuidas normalmente.
- Las poblaciones tienen desviaciones estándar iguales (s).
- Las muestras se seleccionan independientemente.
Cuando se satisface estas condiciones, F se utiliza como la distribución del estadístico de prueba.
Paso1: Plantear la Hipótesis nula y la Hipótesis alternativa.
Ho : u1=u2=u3=u4 hipótesis Nula
H1 : u1≠u2≠u3≠u4 hipótesis alternativa
Si no se rechaza la hipotes Nula (Ho), se concluye que no hay diferencia en los promedios. Si se rechaza Ho, se concluye que hay diferencia al menos un par de promedios.
Paso 2: Seleccionar el nivel de significancia, puede elegirse 0.01 , 0.05, etc.
Paso 3: Determinar el estadístico de prueba, el estadístico de prueba sigue la distribución F.
Paso 4: Establecer la regla de decisión. Para establecer esta regla se necesita el valor crítico. El valor critico del Estadístico en base a los grados de libertad. Donde el número de grados de libertad del numerador es igual al número de tratamientos designado por ( K-1 ). El numero de grados de libertad en denominador es igual al numero de observaciones n menos el numero de tratamientos.( n- k )
Paso5: Seleccionar la muestra , realizar los cálculos y tomar una decisión. Es decir es conveniente reunir los cálculos del estadístico F en una tabla ANOVA. El Formato de la Tabla ANOVA es el siguiente:
TABLA ANOVA | ||||
FUENTE DE VARIACION | Suma de Cuadrados | Grados de Libertad | Media de Cuadrados | F |
Tratamientos | SST | k-1 | SST/(k-1)=MST | MST/MSE |
Error | SSE | n-k | SSE/(n-k)=MSE | |
Total | SS Total | n-1 |
Hay tres valores llamados Suma de cuadrados ( SS, de sumo f squares) usados para hallar el F Calculado y compararlo con el F teórico según el Grado de Libertad hallados en las tablas de Valores críticos de Distribución F para valores de significancia al 5% o al 1%
Si {Fcalculado > F teórico } se rechaza la H1, en caso contrario se acepta.
Tabla de Valores Críticos de la Distribución F para un Nivel de Significancia 1%
Tabla de Valores Críticos de la Distribución F para un Nivel de Significancia 5%
3.- Antecedentes Bibliográficos.
- Análisis estadístico de un diseño sistemático de Nelder basado en un modelo de Ante dependencia por radiación.
Mora Garcés -Julio, 1998- Junio, 1999
Instituto de Investigaciones para el Desarrollo Forestal (INDEFOR), Facultad de Ciencias Forestales y Ambientales. Universidad de Los Andes. Mérida, Venezuela. Apdo Postal 5101.
- "Asymptotic properties of an estimator in a nonlinear mixed effects model.", Comptes rendus de l'Académie des sciences. Série 1, Mathématiques, (1998) , vol. 326/3, pp. 381-384.
- "Calibration for nonlinear mixed effects models. An application to the withdrawal time prediction", (con D. Concordet). Biometrics, (2000), Vol. 56/4, pp. 1040-1046
- "A simulated Pseudo-maximum likelihood estimator for nonlinear mixed models" (con D. Concordet). Computational Statistics & Data Analysis, (2002), vol 39/2, pp. 187-201.
4.-Planeamiento o Formulación.
Se realiza un estudio para comparar la respuesta de las señales del Celular Nokia 2112 en el Centro Comercial MEGAPLAZA de la Panamericana en un recorrido aleatorio .Se emplean tres recorridos de la siguiente forma en el lugar y tiempo:
I.- La Primera ruta se realizo en las cercanía del centro comercial MegaPlaza en una zona de bajo trafico de personas se realizaron llamadas de duración a media hora , dichas muestras fueron tomadas en la mañana de un día Lunes.
II.- La Segunda ruta se realizo en las Laderas del centro comercial MegaPlaza con una zona de moderado trafico de personas se realizaron llamadas de duración a media hora , dichas muestras fueron tomadas en la mañana y medio día de un día Jueves.
III.- La Tercera ruta se realizo en los interiores del centro comercial MegaPlaza con una zona de alto trafico se realizaron llamadas de duración a media hora , dichas muestras fueron tomadas en la mañana de un día Domingo por el medio día.
Se comparan estos tres Lecturas en cuanto a sus respuestas en la recepción de la señal a un numero de medidas tomadas en los tres instantes en lugares donde la concurrencia de personas en numeroso. En el estudio participaban ciento cincuenta muestras. Se les separó aleatoriamente en tres subgrupos de tamaño 50. A uno de los subgrupos se le asignó las Muestras DIA Lunes, a otro las muestras DIA Jueves y al tercero, las muestras en el DIA Domingo el tratamiento. Después de 1 semanas se anotó para cada día indicado las muestras de las mediciones del celular Nokia 2112 en modo Ingeniería.
5.-Objetivos.
Generales
Observar los índices de tráficos de señales referenciales el las comunicaciones celulares y el comportamiento según el uso masivo de llamadas y el efecto que tiene en las llamadas ya sean en hora punta como hora de bajo trafico.
Específicos
Observar los índices del trafico de señal receptiva en el equipo celular Nokia 2112 de la compañía Telefónica Móvil ( Movistar ) en modo ingeniería en los cuales se hicieron las lecturas , escaneando las señales en los momentos indicados en un día lunes , jueves y Domingo .
Generales
Se desea comprobar que las señales de recepción en el celular NOKIA 2112 mantiene una constante de ganancia automática en la recepción de llamadas ya sea en bajo o alto tráfico.
Especificas
Se desea comprobar en tres días efectivos en tiempos posibles Mañana, medio día, los índices de recepción en las llamadas a tiempos promedios de media hora por llamadas.
Marco Poblacional :
291 muestas poblacionales Rx y 291 muestras poblacionales TX
Para ver la siguiente tabla seleccionar "Descargar" del menú superior
Marco Muestral
Se toman 30 muestras aleatorias por cada día , las muestras corresponden solo alos valores de recepción
Tamaño : 90 muestras para el análisis de varianza.
8.- Análisis Interpretación de Resultados
Sean las muestras tomadas para los cálculos de Análisis de Varianza.
LUNES | JUEVES | DOMINGO |
recepción (-) | recepción (-) | recepción (-) |
66 | 69 | 52 |
66 | 70 | 51 |
69 | 68 | 52 |
69 | 71 | 60 |
70 | 69 | 59 |
55 | 70 | 60 |
55 | 70 | 62 |
53 | 69 | 61 |
55 | 69 | 58 |
57 | 70 | 57 |
65 | 71 | 65 |
66 | 71 | 69 |
65 | 68 | 63 |
64 | 71 | 59 |
60 | 64 | 49 |
59 | 70 | 47 |
55 | 71 | 61 |
56 | 69 | 62 |
50 | 67 | 62 |
57 | 64 | 71 |
57 | 65 | 57 |
57 | 66 | 55 |
47 | 65 | 55 |
53 | 65 | 56 |
62 | 64 | 62 |
66 | 65 | 53 |
64 | 60 | 55 |
53 | 71 | 56 |
60 | 65 | 55 |
64 | 65 | 60 |
Paso1:
Se Plantea la Hipótesis nula y la Hipótesis alternativa.
Ho : u1=u2=u3 hipótesis Nula .Donde se afirma que las tres medias de las lecturas son iguales.
H1 : u1≠u2≠u3 hipótesis alternativa. Donde se niega que las tres medias de las lecturas sean iguales.
Paso 2:
Seleccionamos el nivel de significancia, para un valor de 0.05.
Paso 3:
Determinar el estadístico de prueba, el estadístico de prueba sigue la distribución F al 5% .
Paso 4:
Se establece la regla de decisión. Para establecer esta regla se necesita el valor crítico. El valor critico del Estadístico en base a los grados de libertad.
Grado de Libertad del numerador : k-1 = 3-1= 2
Grado de Libertad del denominador : n-k = 90-3= 87
Donde se obtiene de la Tabla de Valores Críticos de la Distribución F para un Nivel de Significancia 5%
F (3 , 87) = 3.101295757
Seguidamente se hallan los demás cálculos indicados según las formulas siguientes:
Paso5:
Seleccionamos las muestras , realizamos los cálculos y nos levara a tomar una decisión. Según el formato de la tabla ANOVA.
TABLA ANOVA | ||||
FUENTE DE VARIACION | Suma de Cuadrados | Grados de Libertad | Media de Cuadrados | F |
Tratamientos | SST | k-1 | SST/(k-1)=MST | MST/MSE |
Error | SSE | n-k | SSE/(n-k)=MSE | |
Total | SS Total | n-1 |
Siendo los siguientes calculados en Excel:
Análisis de varianza de un factor |
|
|
|
|
|
| |
|
| ||||||
RESUMEN |
| ||||||
Grupos | Cuenta | Suma | Promedio | Varianza |
| ||
LUNES | 30 | 1795 | 59.833 | 37.109 |
| ||
JUEVES | 30 | 2032 | 67.733 | 8.547 |
| ||
DOMINGO | 30 | 1744 | 58.133 | 29.430 |
| ||
|
| ||||||
|
| ||||||
ANÁLISIS DE VARIANZA |
| ||||||
Fuente de Variabilidad | SC | GL | PC | F | P Valor | F Teórico | P teórico |
Entre grupos | 1575 | 2 | 787.3 | 31.4558 | 0.000000000053 | 3.1013 | 0.05 |
Dentro de los grupos | 2178 | 87 | 25.0287 |
| |||
|
| ||||||
Total | 3752 | 89 |
|
|
|
|
|
- Criterios de decisión
Si {Fcalculado > F teórico } se rechaza la H1, en caso contrario se acepta.
F | P Valor | F Teórico | P teórico |
31.4558 | 3.1013 | 0.05 |
Observamos que Fcalculado = 31.4558 es mayor que el Fteorico=3.1013 y el Pvalor=0.000000000053 es mucho menor que el Pteorico = 0.05
Dando como resultado el rechazo de la hipótesis planteada y las Pruebas son significativas.
A. Se rechaza la hipótesis planteada, se acepta la hipótesis alterna a un nivel de significación de 0,05. La prueba fue significativa.
B. Al menos un método por DIA de lectura de datos de recepción por DIA tomados en muestra es diferente a los demás
Los resultados obtenidos indican que estos valores difieren en las anotaciones tomadas en los días Lunes , Jueves y Domingo siendo ellas a nivel de significación del 5% resultantes, y que en las muestras tomadas en los diferentes días se aprecia la gran diferencia de lecturas según el trafico de llamadas por los usuarios de Celulares.
11.- Bibliografía.
- V. Abraira, A. Pérez de Vargas .
Métodos Multivariantes en Bioestadística. Ed. Centro de Estudios Ramón Areces. 1996.
- Canavos, G.C. (1999). "Probabilidad y Estadística. Aplicaciones y métodos". MacGraw-Hill.
- Cao Abad, R. y otros. (1998). "Estadística básica aplicada". Ed Tórculo.
- Cao Abad, R. y otros. (2001). "Introducción a la estadística y sus aplicaciones". Pirámide.
- De la Horra Navarro, J. (2001). "Estadística Aplicada". 2ª edición.
- García Alvarez-Coque, C. y Ramis Ramos, G. (2001). " Quimiometría". Editorial Síntesis.
- Gonick, L. y Smith, W. (2001)"A estadística ¡en caricaturas!". SGAPEIO.
- Johnson, R.A. y Bahttachariya, G.K. (1992). "Statistical Principes and Methods". J. Wiley.
- Milton, J.S. (2001) "Estadística para Biología y Ciencias de la Salud". 3ª edición. McGraw-Hill
- Montgomery, C. (1991). "Diseño y Análisis de Experimentos". Grupo Editorial Iberoamericana.
- Novo Sanjurjo, J.V. (1994). "Métodos Estadísticos". UNED.
- Peña Sánchez de Rivera, D. (1991) "Estadística. Modelos y Métodos. 1. Fundamentos". Ed. Alianza Universidad.
- Rius Díaz, F. y otros. (1999). "Bioestadística: Métodos y Aplicaciones". Universidad de Málaga.
Elaborado por
Fernando Mendoza Apaza
Maestría en Ciencias en Ingeniería
De Sistemas y Computación
Universidad Inca Garcilazo de la Vega
Profesor de Maestría
Dr. Jorge Luis Córdova Egocheaga