DATA CUADRADO; | ||||||||||||||||||||
INPUT HILERA COLUM TRAT RDTO; | ||||||||||||||||||||
CARDS; | ||||||||||||||||||||
1 | 1 | 6 | 1626 | |||||||||||||||||
1 | 2 | 5 | 1639 | |||||||||||||||||
1 | 3 | 2 | 1617 | |||||||||||||||||
1 | 4 | 1 | 1062 | |||||||||||||||||
1 | 5 | 4 | 1501 | |||||||||||||||||
1 | 6 | 3 | 1827 | |||||||||||||||||
2 | 1 | 4 | 1816 | |||||||||||||||||
2 | 2 | 1 | 1103 | |||||||||||||||||
2 | 3 | 6 | 1926 | |||||||||||||||||
2 | 4 | 5 | 1992 | |||||||||||||||||
2 | 5 | 3 | 1682 | |||||||||||||||||
2 | 6 | 2 | 1498 | |||||||||||||||||
3 | 1 | 3 | 1913 | |||||||||||||||||
3 | 2 | 4 | 2134 | |||||||||||||||||
3 | 3 | 5 | 1881 | |||||||||||||||||
3 | 4 | 6 | 1797 | |||||||||||||||||
3 | 5 | 2 | 1701 | |||||||||||||||||
3 | 6 | 1 | 824 | |||||||||||||||||
4 | 1 | 2 | 1933 | |||||||||||||||||
4 | 2 | 6 | 1995 | |||||||||||||||||
4 | 3 | 4 | 2011 | |||||||||||||||||
4 | 4 | 3 | 1886 | |||||||||||||||||
4 | 5 | 1 | 812 | |||||||||||||||||
4 | 6 | 5 | 1596 | |||||||||||||||||
5 | 1 | 1 | 1262 | |||||||||||||||||
5 | 2 | 2 | 2143 | |||||||||||||||||
5 | 3 | 3 | 2242 | |||||||||||||||||
5 | 4 | 4 | 2229 | |||||||||||||||||
5 | 5 | 5 | 2066 | |||||||||||||||||
5 | 6 | 6 | 1898 | |||||||||||||||||
6 | 1 | 5 | 1624 | |||||||||||||||||
6 | 2 | 3 | 1885 | |||||||||||||||||
6 | 3 | 1 | 1089 | |||||||||||||||||
6 | 4 | 2 | 1879 | |||||||||||||||||
6 | 5 | 6 | 1343 | |||||||||||||||||
6 | 6 | 4 | 1245 | |||||||||||||||||
PROC PRINT; | ||||||||||||||||||||
PROC GLM; | ||||||||||||||||||||
CLASS HILERA COLUM TRAT; | ||||||||||||||||||||
MODEL RDTO= HILERA COLUM TRAT; | ||||||||||||||||||||
MEANS HILERA COLUM TRAT/DUNCAN; | ||||||||||||||||||||
TITLE 'DISEÑO DE CUADRADO LATINO'; | ||||||||||||||||||||
RUN; | ||||||||||||||||||||
DATA EXAMEN; | ||||||||||||||||||||
INPUT REPET$HILERA$ COLUM$ TRAT$ RDTO @@; | ||||||||||||||||||||
DATALINES; | ||||||||||||||||||||
I | H1 | C1 | A | 16.00 | ||||||||||||||||
I | H1 | C2 | B | 17.50 | ||||||||||||||||
I | H1 | C3 | C | 14.00 | ||||||||||||||||
I | H1 | C4 | D | 14.00 | ||||||||||||||||
I | H2 | C1 | D | 19.00 | ||||||||||||||||
I | H2 | C2 | A | 17.00 | ||||||||||||||||
I | H2 | C3 | B | 18.00 | ||||||||||||||||
I | H2 | C4 | C | 14.10 | ||||||||||||||||
I | H3 | C1 | C | 12.00 | ||||||||||||||||
I | H3 | C2 | D | 18.00 | ||||||||||||||||
I | H3 | C3 | A | 16.00 | ||||||||||||||||
I | H3 | C4 | B | 19.00 | ||||||||||||||||
I | H4 | C1 | B | 20.00 | ||||||||||||||||
I | H4 | C2 | C | 15.00 | ||||||||||||||||
I | H4 | C3 | D | 13.00 | ||||||||||||||||
I | H4 | C4 | A | 22.00 | ||||||||||||||||
PROC PRINT; | ||||||||||||||||||||
PROC ANOVA; | ||||||||||||||||||||
CLASS HILERA COLUM TRAT; | ||||||||||||||||||||
MODEL RDTO= HILERA COLUM TRAT; | ||||||||||||||||||||
MEANS HILERA COLUM TRAT/TUKEY ALPHA=0.05; | ||||||||||||||||||||
TITLE 'DISEÑO DE CUADRADO LATINO'; | ||||||||||||||||||||
RUN; |
DO FILA = 1 TO 4; | |||||||||||||||||||||||||||||
DO COLUM = 1 TO 4; | |||||||||||||||||||||||||||||
INPUT VARIED $ RDTO; | |||||||||||||||||||||||||||||
OUTPUT; | |||||||||||||||||||||||||||||
END; | |||||||||||||||||||||||||||||
CARDS; | |||||||||||||||||||||||||||||
B 2 | |||||||||||||||||||||||||||||
D 2 | |||||||||||||||||||||||||||||
A 6 | |||||||||||||||||||||||||||||
C 8 | |||||||||||||||||||||||||||||
A 7 | |||||||||||||||||||||||||||||
C 5 | |||||||||||||||||||||||||||||
D 7 | |||||||||||||||||||||||||||||
D 5 | |||||||||||||||||||||||||||||
B 4 | |||||||||||||||||||||||||||||
C 9 | |||||||||||||||||||||||||||||
A 10 | |||||||||||||||||||||||||||||
C 6 | |||||||||||||||||||||||||||||
A 9 | |||||||||||||||||||||||||||||
D 5 | |||||||||||||||||||||||||||||
B 5 | |||||||||||||||||||||||||||||
; | |||||||||||||||||||||||||||||
PROC PRINT; RUN; | |||||||||||||||||||||||||||||
PROC GLM; | |||||||||||||||||||||||||||||
CLASS FILA COLUM VARIED; | |||||||||||||||||||||||||||||
MODEL RDTO=FILA COLUM VARIED; | |||||||||||||||||||||||||||||
MEANS FILA COLUM VARIED/DUNCA; RUN; |
CAPITULO VII
7.1. Introducción
Un experimento factorial es un experimento cuyo diseño consta de dos o más factores, cada uno de los cuales con distintos valores o "niveles", y cuyas unidades experimentales cubren todas las posibles combinaciones de esos niveles en todo los factores. Este tipo de experimentos permiten el estudio del efecto de cada factor sobre la variable respuesta, así como el efecto de las interacciones entre factores sobre la dicha variable.
Por lo tanto, se puede definir a los experimentos factoriales como aquellos en los que se comparan o estudian simultáneamente dos o más factores principales, incluyendo los diferentes niveles o modalidades de cada uno.
El Anova en experimentos factoriales constituye una técnica estadística para analizar el efecto de dos ó más variables independientes (factores) sobre una variable respuesta. Hasta el momento se ha estudiado el efecto de un factor sobre la variable respuesta, pero en muchas situaciones prácticas es necesario investigar el efecto de varios factores.
En estos experimentos los tratamientos se forman combinando cada nivel de un factor con cada uno de los niveles del otro (o de los otros, si hubiere más de dos), este tipo de experimento permite además evaluar los efectos de las interacciones. Se dice que entre dos factores hay interacción si los efectos de un nivel de un factor dependen de los niveles del otro. Dicho con otras palabras la respuesta de un factor es influenciada en forma diferenciada por los niveles del otro.
La existencia de interacciones indica que los efectos de los factores sobre la respuesta no son aditivos y por tanto no pueden separarse los efectos de los factores.
7.2. Definiciones básicas
Factorial. Un factorial se refiere a un arreglo especial de formar las combinaciones de tratamientos, y no un tipo básico de diseño.
El principio de factorial involucra investigación de dos o más factores simultáneamente. Se debe tener en cuenta que los factoriales no son diseños experimentales, sino un arreglo de tratamientos, los que se prueban en casi todos los diseños: Completamente al Azar, bloques completo al azar, cuadrado latino, entre otros.
Factor. Es un tipo particular de tratamiento, que varía según el deseo del investigador. Son factores por ejemplo, la temperatura, el nitrógeno, el peso, la densidad, las concentraciones químicas, variedad de semilla, etc.
Factores cualitativos, Son aquellos en los cuales los niveles definen o expresan una modalidad particular de las características del factor; cada nivel tiene un interés intrínseco o independiente de los otros niveles. Estos factores responden a las características de las variables cualitativas. Ejemplo :
Factores cuantitativos: Son aquellos cuyos valores corresponden a cantidades numéricas, es decir valores inherentes a una variable cuantitativa.
Ej: Supongamos que en una experiencia se prueba fertilizar con diferentes dosis de Nitrógeno N: 0-10-20-30 Kg/ha.
Niveles. Son los varios valores que se asignan al factor en estudio. ejemplos:
Niveles del factor temperatura: 0 oC, 50 oC, 100 °C, 150 °C, etc.
Niveles de nitrógeno: 40, 80, 120, 160 Kg/ha.
Respuesta. Es el resultado de una unidad experimental. Así, el rendimiento de maíz, altura de planta. Generalmente se miden muchas variables en el mismo experimento.
Efecto. Es la medida de cambio en la respuesta, producido por el cambio en el nivel del factor. Así, cuando el factor que se estudia tiene dos niveles, el efecto es la diferencia entre el promedio de las respuestas de todas las unidades con el primer nivel del factor y el promedio de las respuestas de las que llevan el segundo nivel del mismo factor. Cuando se estudian más de dos niveles, las diferencias entre promedios de respuesta pueden ser expresadas de varias maneras, esto es, efecto lineal, efecto cuadrático, efecto cubico, etc.
Notación. Se usa para reconocer factores y niveles; Así:
Cuando se tiene dos niveles de factor A y dos niveles de factor B, se tendrá el factorial 2n, donde n = número de factores tomados a dos niveles, es decir 2×2 ó 22.
Cuando se tiene dos factores con tres niveles cada uno, se denotara: 3n, donde n = a los factores tomados a tres niveles, es decir 32 ó 3×3.
Los factores que se usan en el experimento se denotan con letras mayúsculas; así: A, B y C.
Los niveles se denotaran con letras minúsculas y subscritos: N: no, n1, n2, A: ao, a1, a2.
La combinación de los tratamientos está dada por el producto de los niveles; así: ao no, a1 no, etc.
Interacción. Ostle (1974), define a la interacción, como la respuesta diferencia a un factor en combinación con niveles variables de un segundo factor aplicado simultáneamente. Es decir, la interacción es un efecto adicional debido a la influencia combinada de dos o más factores.
7.3. Factorial 2n
El factorial 22 es igual a 2n, donde n es el número de factores, en este caso 2, tomados a dos niveles. En un diseño completamente al azar, que involucra "t" tratamientos y "n" unidades experimentales.
Modelo aditivo Lineal
7.4. Esquema del Diseño Experimental
Tabla 12. Representación simbólica de un experimento factorial; dos factores a y b niveles de cada factores a y b niveles de cada factor en un diseño completamente aleatorizado
7.5. Análisis de variancia
Tabla 13. Análisis de variancia de Factorial 22
7.6. Factorial 23
Cuando el factorial de tres factores esta asociado a un diseño completamente al azar que implica "n" unidades experimentales por combinación de tratamientos, el modelo estadístico es:
Tabla 14. Análisis de variancia del factorial de tres factores
7.7. Problema de aplicación
Un baño químico de ácido sulfúrico caliente se emplea para remover el oxido de la superficie de un metal antes de ser niquelado, se requiere determinar qué factores además de la concentración del ácido sulfúrico podría afectar a la conductividad eléctrica del baño. Se cree que la concentración de sal y la temperatura del baño podrían afectar la conductividad eléctrica; por ello se planea un experimento que determine los efectos individuales y conjuntos de estas tres variables ejercen sobre la conductividad eléctrica del baño. Con el fin de cubrir los niveles de concentraciones y las temperaturas comúnmente encontradas, se decide usar los siguientes niveles de los tres factores:
Factor | Nivel 1 | Nivel 2 | Nivel 3 | Nivel 4 | |||
A. Concentración de ácido (%) | 0 | 6 | 12 | 18 | |||
B. Concentración de sal (%) | 0 | 10 | 20 | ||||
C. Temperatura (oF) | 80 | 100 |
Efectuar el análisis de variancia y sus respectivas pruebas de rango múltiple.
RESULTADO DE MULTIFACTORIAL
The ANOVA Procedure
Class Level Information
Class Levels Values
REP 2 1 2
A 4 1 2 3 4
B 3 1 2 3
C 2 1 2
Number of observations 48
Dependent Variable: CE
Duncan's Multiple Range Test for CE
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha 0.05
Error Degrees of Freedom 23
Error Mean Square 0.00325
Number of Means 2
Critical Range .03404
Means with the same letter are not significantly different.
CAPITULO VIII
8.1. Regresión simple
Uno de los modelos más simples y comunes en hidrología está basado en la suposición de que dos variables se relacionan en forma lineal. En general, el objetivo de un modelo de esta naturaleza es poder estimar el valor de una variable, que se denomina variable dependiente, a partir del valor de la otra, que se llama variable independiente.
Esta suma puede minimizarse para a y b, derivando parcialmente M respecto de a y b e igualando a cero.
8.2. Evaluación de la regresión
Una segunda pregunta puede formularse: Pueden los datos ser descritos adecuadamente por la línea de regresión? Naturalmente la respuesta a esta pregunta depende de lo que se entienda por adecuadamente. Una aproximación puede ser cuantificada el valor de la suma de cuadrados de la variable dependiente ya que ello representa su variabilidad.
Entonces la ecuación de la suma de cuadrados podemos escribir.
Reordenado términos resulta:
8.3. Intervalos de confianza y pruebas de hipótesis
8.3.1. Inferencia acerca del coeficiente de regresión
Las pruebas estadísticas son:
8.4. Regresión lineal múltiple
8.4.1. Modelo lineal general
El modelo lineal, tiene la forma siguiente:
A continuación tenemos algunos modelos no lineales:
La notación matricial es:
Notación:
Los tres componentes de la suma de cuadrados total son:
El cálculo de la suma de cuadrados se realiza en una tabla de análisis de la variancia (ANVA). Un cuadrado medio en el ANVA, es simplemente la suma de cuadrados dividido por su grado de libertad.
Por analogía con la regresión lineal simple, definimos:
Tabla 15. Análisis de variancia para regresión múltiple
8.4.2. Intervalos de confianza y pruebas de hipótesis
8.4.3. Intervalos de confianza para el error estándar
8.4.4. Inferencia de los coeficientes de regresión
Como:
La prueba estadística es:
Esto significa probar la hipótesis de que toda la ecuación de regresión no explica significativamente la variación de Y.
Prueba estadística:
Donde:
8.4.5. Intervalos de confianza de la línea de regresión
8.4.6. Correlación
El coeficiente dx correlación de una población entre dos variables aleatorias X e Y definido en términos de la covariancia de X e Y y las variancias de X e Y.
8.4.7. Inferencia acerca de los coeficientes de correlación
8.4.8. Correlación lineal
La correlación lineal se define como la correlación existente entre los datos de una serie hidrológica de un periodo de tiempo determinado con las observaciones del periodo de tiempo precedente. Por definición los elementos de la muestra de datos que se emplean en procesar la correlación serial no son elementos aleatorios.
Según Anderson (1941), la prueba de significación para el coeficiente de correlación serial para una serie de tiempo normal, estacionaria y cíclica, esta dado por:
8.5. Correlaciona y análisis regional
Dónde:
En general la correlación serial tiende a desmejorar la información en la relación a la media mientras que la correlación cruzada tiende a mejorar la información en relación a la media.
8.6. Correlación de causa y efecto
Una alta correlación entre dos variables entre dos variables hidrológicas no necesariamente implica que exista una correlación de causa y efecto. Por ejemplo una alta correlación entre las descargas de dos cuencas adyacentes no significa que el cambio de flujo mensual en una de las cuencas provoque el correspondiente cambio en el flujo mensual de la otra cuenca, a pesar que ambos cambios son causados por el mismo factor externo que incide sobre ellos.
8.7. Correlación spuria o falsa correlación
La correlación spuria es cualquier correlación aparente entre variables. Como ejemplo se muestran a continuación dos casos de correlación spuria.
Cuando los datos, forman grupos aislados en el grafico de Y versus X. la correlación de cada grupo individual es cercana a cero, sin embargo la correlación de todo el conjunto es alta. Este tipo de correlación se llama correlación spuria.
CAPITULO IX
9.1. Prueba de bondad de ajuste
Para realizar el análisis de frecuencia, antes es necesario determinar qué función de distribución de probabilidad es la que mejor se ajusta a la información muestral.
En el siguiente ejemplo se realiza las pruebas de bondad de ajuste para una muestra de precipitación máxima de 24 horas de la Estación Laraqueri en Puno, la información se muestra en el siguiente cuadro.
Tabla 16. Precipitación máxima de 24 horas Estación Laraqueri – Puno
Año | mm | Año | mm | Año | mm | Año | mm |
1957 | 26 | 1967 | 37 | 1977 | 25.9 | 1987 | 34.2 |
1958 | 28.2 | 1968 | 30.3 | 1978 | 30.3 | 1988 | 23 |
1959 | 77 | 1969 | 27.2 | 1979 | 45.3 | 1989 | 53.5 |
1960 | 30 | 1970 | 22.5 | 1980 | 24.4 | 1990 | 24.5 |
1961 | 47.2 | 1971 | 30.5 | 1981 | 29.1 | 1991 | 26.4 |
1962 | 73 | 1972 | 31.8 | 1982 | 29.8 | 1992 | 24.5 |
1963 | 75 | 1973 | 25.2 | 1983 | 29.2 | 1993 | 27.4 |
1964 | 28 | 1974 | 45.3 | 1984 | 30.9 | 1994 | 44.1 |
1965 | 40.3 | 1975 | 30 | 1985 | 37.7 | 1995 | 38.5 |
1966 | 39.6 | 1976 | 28.7 | 1986 | 44.6 |
9.1.1. Prueba de bondad de ajuste X2 para la función de distribución de probabilidad de Gumbel
Previamente se calcula los parámetros estadísticos necesarios para estimar los parámetros de la distribución.
Un resumen se muestra en el siguiente cuadro
Tabla 17. Parámetros estadísticos necesarios para estimar los parámetros de la distribución.
Realizando los cálculos se obtiene
Con los parámetros de la distribución de probabilidad estimados, el siguiente paso es realizar los cálculos de las probabilidades acumuladas para obtener los valores para los intervalos de clase. En el siguiente cuadro se presentan estos.
Tabla 18.
La columna (1) es el orden del intervalo de clase, la columna (2) es el límite inferior del intervalo, la columna (3) es el límite superior del intervalo y se obtiene sumando al límite inferior el ancho de clase, la columna (4) es la frecuencia observada (o) dentro del intervalo de clase, la columna (5) es la probabilidad acumulada para el límite inferior del intervalo de clase de clase, así como la columna (6) lo es para el límite superior. Estos valores se obtienen aplicando la siguiente ecuación
En la siguiente figura se muestra los valores observados y esperados de la frecuencia de precipitación máxima contra el intervalo de clase
Figura 07. Frecuencia observada y esperada por distribución Gumbel. Estación Laraqueri
El valor de X2 teórico se obtiene mediante el uso de la tabla estadística, para ello se requiere el nivel de confianza (o el de significancia) al que se realizara la prueba, además los grados de libertad con la siguiente ecuación.
Donde m es el número de intervalos de clase y p es el número de parámetros que posee la distribución de probabilidad
Así el valor de grados de libertad es ( = 6 – 2 – 1 = 3
Para un nivel de significancia de 0.05 el valor de X2t (X2 teórico) es 7.81
Entonces realizando la prueba de hipótesis se plantea
H0: La distribución se ajusta adecuadamente a la muestra
H1: La distribución no se ajusta adecuadamente a la muestra
Regla de decisión es:
Si X2c < X2t entonces se acepta H0, en otro caso se rechaza y se acepta H1.
En el ejemplo el valor calculado X2c es mayor que el teórico X2t por tanto la distribución no se ajusta adecuadamente a la muestra. Debido a este resultado se tendrá que postular otra función de distribución de probabilidad o hacer otra prueba de bondad de ajuste.
9.1.2. Prueba de bondad de ajuste X2 para la función de distribución de probabilidad de Log-Pearson tipo III
Para realizar la estimación de parámetros en el caso de esta distribución de probabilidad es necesario transformar los datos con el logaritmo natural en base 10. Los datos transformados se muestran en el siguiente cuadro, pero en orden ascendente.
Tabla 19. Transformación de datos con el logaritmo en base 10
xi | Log10(xi) | xi | Log10(xi) | xi | Log10(xi) | xi | Log10(xi) |
22.50 | 1.35 | 27.40 | 1.44 | 30.30 | 1.48 | 44.10 | 1.64 |
23.00 | 1.36 | 28.00 | 1.45 | 30.50 | 1.48 | 44.60 | 1.65 |
24.40 | 1.39 | 28.20 | 1.45 | 30.90 | 1.49 | 45.30 | 1.66 |
24.50 | 1.39 | 28.70 | 1.46 | 31.80 | 1.50 | 45.30 | 1.66 |
24.50 | 1.39 | 29.10 | 1.46 | 34.20 | 1.53 | 47.20 | 1.67 |
25.20 | 1.40 | 29.20 | 1.47 | 37.00 | 1.57 | 53.50 | 1.73 |
25.90 | 1.41 | 29.80 | 1.47 | 37.70 | 1.58 | 73.00 | 1.86 |
26.00 | 1.41 | 30.00 | 1.48 | 38.50 | 1.59 | 75.00 | 1.88 |
26.40 | 1.42 | 30.00 | 1.48 | 39.60 | 1.60 | 77.00 | 1.89 |
27.20 | 1.43 | 30.30 | 1.48 | 40.30 | 1.61 |
Los parámetros estadísticos de la variable transformada Log10(xi), son los requeridos para estimar los parámetros de la distribución, estos se muestran en el siguiente cuadro.
Tabla 20. Parámetros estadísticos de la variable transformada Log10(xi) y de xi
n = | 39.00 | ||||
Promedio Log(xi) = | 1.53 | ||||
Desvest Log(xi) = | 0.14 | ||||
Coef.Asim.Log(xi) = | 1.18 | ||||
Min (xi) = | 22.50 | ||||
Max (xi) = | 77.00 | ||||
Numero de intervalos de clase = | 6.00 | ||||
Ancho de clase (xi) = | 9.08 |
En el cuadro anterior los parámetros mínimo (Min), máximo (Max), Intervalos y Ancho de clase se determinaron como en el ejemplo anterior.
Luego los parámetros de la distribución de probabilidad Log-Pearson Tipo III se estimaron con las siguientes ecuaciones
Tabla 21. Cálculos para obtener el valor de X2c para la prueba de bondad de ajuste
La determinación de los valores en la columna (1) – (4) se realizaron como en el ejemplo anterior de la bondad de ajuste de la distribución de Gumbel. Los nuevos cálculos en este caso son las columnas siguientes (5) a (8).
La columna (5) se obtiene mediante la siguiente ecuación
Donde DISTR.CHI(x;grados_de_libertad) Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución chi cuadrado de una sola cola. Donde Xࠠes el valor en el que se desea evaluar la distribución, y Grados_de_libertadࠠes el número de grados de libertad.
Los valores de 2i así como 2ר deben direccionarse en las respectivas celdas.
El cálculo que realiza la función en Excel es determinar la probabilidad acumulada que se obtiene integrando la siguiente función propia de la distribución Pearson III o Gamma de tres parámetros que tiene la forma
Por tanto en vez de utilizar el Excel es posible emplear las tablas estadísticas de la distribución ji cuadrada de los libros de estadística.
Los valores para la columna (8) F(yi+1) se calculan de forma análoga. Luego los valores de la columna (9) y (10) se calculan como en el ejemplo anterior de prueba de bondad de ajuste X2 para la distribución Gumbel.
Después del cálculo el valor de X2c resulta 22.02
De la misma forma se puede graficar las frecuencias observadas y esperadas de precipitación máxima de 24 horas respecto el intervalo de clase, como en la siguiente figura.
Figura 08. Frecuencia observada y esperada por distribución Log-Pearson III. Estación Laraqueri
Gráficamente se puede observar que existe un ajuste comparativamente mejor que la distribución de Gumbel.
Realizando la prueba de hipótesis con
H0: La distribución se ajusta adecuadamente a la muestra
H1: La distribución no se ajusta adecuadamente a la muestra
Regla de decisión es
Los grados de libertas para este caso son ( = m – p -1 = 6 – 3 – 1= 2, p = 3 por que la distribución utilizada en este caso tiene tres parámetros. Para un nivel de significancia de 0.05, el valor teórico de X2t = 5.99. El cálculo de este valor teórico se puede realizar consultando tablas estadísticas estándares o aplicando la función de Excel =PRUEBA.CHI.INV(_,_).
PRUEBA.CHI.INV, devuelve para una probabilidad dada, de una sola cola, el valor de la variable aleatoria siguiendo una distribución chi cuadrado. Si el argumento probabilidad = DISTR.CHI(x;…), entonces PRUEBA.CHI.INV(probabilidad,…) = x.
Su sintaxis es PRUEBA.CHI.INV(probabilidad;grados_de_libertad), donde: Probabilidadࠠes una probabilidad asociada con la distribución chi cuadrado, Grados_de_libertadࠠes el número de grados de libertad.
El valor que se requiere en probabilidad es el nivel de significancia (o probabilidad de excedencia) y los grados de libertad es el valor obtenido con ( = 2.
Como en el ejemplo X2c>X2t entonces se rechaza la hipótesis de que la distribución se ajusta adecuadamente a la muestra.
Entonces se debe postular otra distribución de probabilidad, pero antes se debe realizar una prueba no paramétrica como la de Smirnov-Kolmogorov.
Por obtenerse un X2c menor en esta prueba (para Log-Pearson III) que el obtenido para la distribución Gumbel, se puede afirmar que Log-Pearson Tipo III posee un ajuste mejor que Gumbel de forma cuantitativa, aunque según esta prueba ninguna de estas distribuciones se pasa la regla de decisión.
9.1.3. Prueba de bondad de ajuste X2 para la función de distribución de probabilidad Normal
Para realizar esta prueba de bondad de ajuste con la distribución Normal no es necesario transformar los datos como en el caso anterior. Los valores de los parámetros estadísticos obtenidos son iguales a los presentados en el ejemplo de la prueba de bondad de ajuste a la distribución de Gumbel, estos incluyen el número de intervalos de clase y su ancho. Los estimadores de los parámetros de la distribución Normal son iguales a la media y desviación estándar muestrales. En el siguiente cuadro se presenta los cálculos realizados para la prueba de bondad de ajuste, y el procedimiento se detalla posteriormente.
Tabla 22 . Cálculos para la prueba de bondad de ajuste con distribución Normal
De la columna 1 a la 4 los cálculos son idénticos a los realizados para la distribución de Gumbel, en la columna (5) y (6) el valor de función de probabilidad acumulada se obtuvo por integrar la función de densidad de probabilidad Normal con la siguiente expresión
La determinación de esta integral requiere el uso de tablas estadísticas que se encuentran en varios libros, en cambio se puede determinar utilizando una función en Excel.
La función DISTR.NORM, devuelve la distribución normal para la media y desviación estándar especificadas. Su sintaxis es
DISTR.NORM(x;media;desv_estándar;acum)
Xࠠes el valor cuya distribución desea obtener.
Mediaࠠes la media aritmética de la distribución.
Desv_estándarࠠes la desviación estándar de la distribución.
Acumࠠes un valor lógico que determina la forma de la función. Si el argumento acum es VERDADERO, la función DISTR.NORM devuelve la función de distribución acumulada; si es FALSO, devuelve la función de masa de probabilidad.
El valor de las columnas 5 y 6 se determinaron aplicando esta función, donde x es el valor de xi ó xi+1 según sea el caso. El valor para Acum fue verdadero para todos los intervalos.
Los valores mostrados en las columnas 7 y 8, se obtienen como en las pruebas de bondad de ajuste de Gumbel y Log-Pearson tipo III. Así se obtiene un valor de x2c de 53.83. El valor teórico de x2 se obtiene con la función de Excel PRUEBA.CHI.INV( probabilidad, grados de libertad), donde probabilidad es el nivel de significacia de 0.05 y grados de libertad se obtiene como en la prueba realizada para la distribución de Gumbel. El valor teórico obtenido es 7.81, puesto que es menor que el valor calculado, se rechaza la hipótesis de que la distribución ajusta bien los datos.
En la siguiente figura se muestra la comparación entre la frecuencia observada de datos y la frecuencia esperada con una distribución Normal
Figura 09. Frecuencia observada y esperada por distribución Normal. Estación Laraqueri
9.1.4. Prueba de bondad de ajuste X2 para la función de distribución de probabilidad Log-normal
Previamente a realizar los cálculos de la prueba de bondad de ajuste, se transformaron los datos aplicando el logaritmo natural. Estos valores se muestran en el siguiente cuadro.
Página anterior | Volver al principio del trabajo | Página siguiente |