Métodos estadísticos para la investigación (página 4)

Partes: 1, 2, 3, 4, 5

Tabla 23. . Valores transformados aplicando el logaritmo natural

xi	ln(xi)	xi	ln(xi)	xi	ln(xi)	xi	ln(xi)
22.50	3.11	27.40	3.31	30.30	3.41	44.10	3.79
23.00	3.14	28.00	3.33	30.50	3.42	44.60	3.80
24.40	3.19	28.20	3.34	30.90	3.43	45.30	3.81
24.50	3.20	28.70	3.36	31.80	3.46	45.30	3.81
24.50	3.20	29.10	3.37	34.20	3.53	47.20	3.85
25.20	3.23	29.20	3.37	37.00	3.61	53.50	3.98
25.90	3.25	29.80	3.39	37.70	3.63	73.00	4.29
26.00	3.26	30.00	3.40	38.50	3.65	75.00	4.32
26.40	3.27	30.00	3.40	39.60	3.68	77.00	4.34
27.20	3.30	30.30	3.41	40.30	3.70	༯font>	༯font>

Los parámetros estadísticos obtenidos para determinar el número y ancho de intervalos de clase, se muestran en el siguiente cuadro.

Tabla 24. Parámetros estadísticos para determinar los intervalos de clase

Número de datos =					39.00
Promedio de ln(xi) =					3.52
Desviación estándar de ln(xi) =					0.32
Mínimo (xi) =					22.50
Máximo (xi) =					77.00
Número de intervalos de clase =					6.00
Ancho de clase =					9.08

Los dos estimadores de los parámetros de la distribución Log-normal son la media y desviación estándar de los logaritmos naturales. Estos son &µln(xi) = 3.52 y sln(xi) = 0.32. Estos estimadores de los parámetros de la distribución Log-normal sirven para el cálculo de x2c como se muestra a continuación en el siguiente cuadro.

Tabla 25 . Cálculos para la prueba de bondad de ajuste con distribución Log-normal

edu.red

Los valores mostrados en las columnas 1-4 se obtienen del mismo modo que en las pruebas de bondad de ajuste de Gumbel y Log-Pearson tipo III. En cambio las columnas (5) y (6) se determinan integrando la función de densidad de probabilidad Log-normal. Existe una función en Excel que permite realizar su determinación, esta se denomina DISTR.LOG.NORM.

La función DISTR.LOG.NORM , devuelve la probabilidad para una variable aleatoria continua siguiendo una distribución logarítmico-normal acumulativa de x, donde ln(x) se distribuye normalmente con los parámetros definidos por los argumentos media y desv_estándar.

Su sintaxis es la siguiente: DISTR.LOG.NORM(x;media;desv_estándar), donde Xࠠes el valor en el que se desea evaluar la función, Mediaࠠ es la media de In(x), y Desv_estándarࠠes la desviación estándar de In(x).

El valor puesto de x es xi ó xi+1, el de media y desviación estándar es el valor del parámetro respectivo (de los logaritmos naturales).

Las columnas 7 y 8 se determinan como en los casos anteriores de la distribución Gumbel o Log-Pearson tipo III.

El valor de x2c obtenido es 32.51. El valor teórico obtenido con un nivel de significancia de 0.05 y 3 grados de libertad es 7.81. Puesto que el valor calculado es mayor al valor teórico se rechaza la hipótesis nula, y por tanto la distribución Log-normal no se ajusta adecuadamente a los valores muestrales.

Lo mismo se observa en la siguiente figura donde se compara el valor de frecuencia observada y esperada según la distribución Log-normal.

edu.red

Figura 10. Frecuencia observada y esperada por distribución Log-normal. Estación Laraqueri

9.2. Prueba de bondad de ajuste de Kolmogorov Smirnov

Esta prueba no paramétrica también se utiliza con el fin de escoger una función de distribución de probabilidad adecuada, es menos rígida que la prueba X2, pero tampoco menos importante. La debilidad de la prueba X2 se encuentra en que el número de intervalos no necesariamente se debe determinar por la regla de Sturges

edu.red

Y tampoco el valor del ancho de intervalo de clase puede ser constante. Debido a estas dificultades es recomendable realizar la prueba de bondad de ajuste de Kolmogorov Smirnov. En la prueba X2 si ninguna de las distribuciones ajusta bien la información muestral, entonces la prueba de Kolmogorov Smirnov determinará cual ajusta mejor la información; pero, como regla general se puede decir, que la distribución que presente el valor más bajo de X2c es la que podría ajustar mejor la información.

9.2.1. Prueba de bondad de ajuste de Kolmogorov Smirnov para la distribución de Gumbel

Los cálculos realizados para esta prueba se muestran en el anexo. El fundamento de la prueba es comparar la máxima diferencia entre la función de probabilidad acumulada empírica y teórica. El valor de probabilidad empírica se obtiene mediante la siguiente expresión

edu.red

El valor de d se determina en función del tamaño de la muestra y el nivel de significancia, desde el siguiente cuadro.

Tabla 26. Valores críticos d para la prueba Kolmogorov-Smirnov de bondad de ajuste

edu.red

Fuente: Benjamin, J. R., Cornell, C. A. 1970. Probability, statistic and decision for civil engineers. Mc Graw-Hill. New York.

El valor obtenido de D para esta prueba de bondad de ajuste con distribución de Gumbel es 0.16 y el valor crítico d es igual a 0.21, por tanto la distribución ajusta adecuadamente los datos de precipitación máxima de 24 horas.

Gráficamente también se puede observar el ajuste de la distribución a la información muestral. Esto se muestra en la siguiente figura para la estación Laraqueri.

edu.red

Figura 11. Probabilidad acumulada empírica y teórica con distribución Gumbel. Estación Laraqueri

9.2.2. Prueba de bondad de ajuste de Kolmogorov Smirnov para la distribución de Log-Pearson Tipo III

En el anexo se muestra el cuadro de cálculos para realizar la prueba de Kolmogorov Smirnov. Los pasos para determinar las diferentes columnas son similares a los realizados para el caso con distribución de Gumbel. Una diferencia es que se trabaja con los logaritmos en base 10 y se obtiene la siguiente variable transformada

edu.red

El valor de probabilidad teórica acumulada con distribución Log-Pearson Tipo III se obtiene con una formula desarrollada en Excel del siguiente tipo

=1-DISTR.CHI(x, grados de libertad)

Donde: DISTR.CHI, devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución chi cuadrado de una sola cola.

edu.red

Regla de decisión es

Si D < d entonces se acepta H0, en otro caso se rechaza y se acepta H1.

El valor de D obtenido es de 0.12 y el valor de d de la tabla sugerida para la prueba con un nivel de significancia de 0.05 y un tamaño de muestra de 39, es de 0.21. Por tanto se acepta que la distribución se ajusta adecuadamente a la muestra.

El ajuste gráfico entre la probabilidad acumulada empírica P(X=x) y la probabilidad acumulada teórica con distribución Log-Pearson Tipo III, se muestra en la siguiente figura, donde se observa que existe un mejor ajuste para precipitaciones máximas de 24 horas de menor profundidad que para mayores a 31 mm.

edu.red

Figura 12. Probabilidad acumulada empírica y teórica con distribución Log-Pearson Tipo III. Estación Laraqueri

9.2.3. Prueba de bondad de ajuste de Kolmogorov Smirnov para la distribución Normal

El cuadro que se presenta en el anexo posee los resultados de los cálculos realizados para esta prueba de bondad de ajuste con distribución Normal. Como en el caso de la prueba de bondad de ajuste X2 el valor de F(xi) se obtiene integrando la función de densidad de probabilidad. Utilizando el Excel es simple la determinación de la probabilidad acumulada teórica con la función DISTR.NORM (x;media;desv_estándar;acum), donde xॳ el valor cuya distribución desea obtener, Mediaࠠes la media aritmética de la distribución, y Desv_estándarࠠes la desviación estándar de la distribución. Si el argumento acum es verdadero, la función DISTR.NORM devuelve la función de distribución acumulada.

En el caso presente en los valores de media y desv_estándar, se reemplaza los valores de la media y desviación estándar muestrales, respectivamente. Como es lógico el valor de acum es verdadero.

El valor obtenido de la prueba es D=0.21 y de d=0.21 (con nivel de significancia de 5% y tamaño de muestra 39). Con la prueba de hipótesis siguiente

H0: La distribución se ajusta adecuadamente a la muestra

H1: La distribución no se ajusta adecuadamente a la muestra

Regla de decisión es

Si D < d entonces se acepta H0, en otro caso se rechaza y se acepta H1.

Se concluye que la distribución Normal no se ajusta adecuadamente a la muestra.

El caso gráfico es similar, puesto que no existe una concordancia entre la probabilidad acumulada empírica y la teórica. En la siguiente figura se muestra este hecho, lo cual valida el resultado de la prueba de hipótesis pero sólo de manera subjetiva.

edu.red

Figura 13. Probabilidad acumulada empírica y teórica con distribución Normal. Estación Laraqueri

9.2.4. Prueba de bondad de ajuste de Kolmogorov Smirnov para la distribución Log-normal

Para el caso de prueba de bondad de ajuste Kolmogorov Smirnov con distribución Log-normal, los pasos para determinar los valores mostrados en el cuadro del anexo, son similares a las demás pruebas, excepto en el caso de la probabilidad acumulada teórica F(xi). Para obtener este valor es necesario determinar primero los parámetros correspondientes a esta distribución, estos son simplemente la media y desviación estándar de los logaritmos naturales de xi, es decir ln(xi).

Luego con el uso de la función DISTR.LOG.NORM(x; media; desv_estándar), se determina el valor de probabilidad acumulada teórica, donde xॳ el valor en el que se desea evaluar la función, Mediaॳ la media de In(x), y Desv_estándar es la desviación estándar de In(x). Para el caso actual, x es el valor de precipitación máxima de 24 horas, sin haberse transformado con logaritmo natural, en cambio media y desv_estándar, son valores idénticos a los que se indica (media y desviación estándar de los logaritmos naturales).

El resultado de la prueba de hipótesis

H0: La distribución se ajusta adecuadamente a la muestra

H1: La distribución no se ajusta adecuadamente a la muestra

Regla de decisión es:

Si D < d entonces se acepta H0, en otro caso se rechaza y se acepta H1.

Es un valor de D = 0.19 y el valor crítico de d para un nivel de significancia de 0.05 y un tamaño de muestra de 39, es 0.21, por consiguiente se acepta la hipótesis nula, que la distribución se ajusta adecuadamente a la muestra.

El ajuste gráfico se presenta en la siguiente figura, se observa que es cualitativamente mejor que el ajuste con distribución Normal, esto indica que los datos de precipitación máxima de 24 horas son sesgados y por tanto se recomienda utilizar distribuciones de probabilidad con esta característica.

edu.red

Figura 14. Probabilidad acumulada empírica y teórica con distribución Log-normal. Estación Laraqueri

9.3. Análisis de Frecuencia

La elección correcta de la distribución de probabilidad permite realizar un adecuado análisis de frecuencia. El análisis de frecuencia es el procedimiento mediante el cual se determina valores de una variable hidrológica para un período de retorno. Este valor se utiliza principalmente en el diseño de obras de control y mitigación de eventos extremos sean esto máximos o mínimos.

9.3.1. Análisis de frecuencia con distribución de Gumbel (Valor extremo tipo I)

Para realizar el análisis de frecuencia es necesario en primer lugar, estimar los parámetros de la función de distribución de probabilidad, esto en algunos casos donde el factor de frecuencia este en función de ellos. Los valores en este caso se calcularon anteriormente.

El factor de frecuencia KT interviene en la siguiente ecuación

edu.red

Donde: T = período de retorno en años.

En el siguiente cuadro se muestran los cálculos de análisis de frecuencia para los datos de la estación Laraqueri (precipitación máxima de 24 horas) con la distribución Gumbel.

Tabla 27. Análisis de frecuencia, distribución Gumbel, Estación Laraqueri

edu.red

9.3.2. Análisis de frecuencia con distribución Log-Pearson Tipo III

Esta distribución es la que mejor se ajusta a la información muestral según las pruebas anteriormente realizadas.

edu.red

En los siguientes cuadros se muestra los cálculos realizados para estimar las precipitaciones máximas de 24 horas para diferentes períodos de retorno.

Tabla 28. Parámetros estadísticos del logaritmo natural de la precipitación máxima

prom_logx		1.53
desvest_logx		0.14
Cs(logx)		1.18

Con el valor del factor de frecuencia y los parámetros del logaritmo en base 10, se determina la variable yT de la que su antilogaritmo representa la precipitación máxima para un período de retorno.

edu.red

Tabla 29. Cálculos para análisis de frecuencia con distribución Log-Pearson tipo III en la estación Laraqueri

T	p	w	z	k	KT	yT	xT
2.00	0.50	1.18	0.00	0.20	-0.19	1.50	31.88
5.00	0.20	1.79	0.84	0.20	0.73	1.63	42.75
10.00	0.10	2.15	1.28	0.20	1.33	1.71	51.83
25.00	0.04	2.54	1.75	0.20	2.08	1.82	65.74
50.00	0.02	2.80	2.05	0.20	2.62	1.89	78.12
100.00	0.01	3.03	2.33	0.20	3.15	1.97	92.47
200.00	0.01	3.26	2.58	0.20	3.67	2.04	109.16

9.3.3. Análisis de frecuencia con distribución Lognormal

El proceso es similar al aplicado para la distribución Normal con la única diferencia que los datos deben transformarse con un logaritmo natural. En el siguiente cuadro se muestra los valores de los parámetros media y desviación estándar de los logaritmos naturales.

Tabla 30. Parámetros de los logaritmos naturales de la precipitación máxima, Estación Laraqueri

Promedio ln(x)		3.52
Desvest ln(x)		0.32

El proceso de cálculo del factor de frecuencia KT es con las siguientes ecuaciones, similar al proceso seguido en el caso de la distribución Log-Pearson Tipo III.

En este caso KT es igual a el valor de z correspondiente a una probabilidad de excedencia p = 1/T. El valor de z se calcula por

edu.red

El siguiente cuadro muestra los resultados del cálculo realizado para estimar las precipitaciones máximas para diferentes períodos de retorno con información de la estación Laraqueri.

Tabla 31. Cálculos para análisis de frecuencia con distribución Lognormal en la estación Laraqueri

T	p	w	z	KT	yT	xT
2.00	0.50	1.18	0.00	0.00	3.52	33.86
5.00	0.20	1.79	0.84	0.84	3.79	44.29
10.00	0.10	2.15	1.28	1.28	3.93	50.98
25.00	0.04	2.54	1.75	1.75	4.08	59.22
50.00	0.02	2.80	2.05	2.05	4.18	65.24
100.00	0.01	3.03	2.33	2.33	4.27	71.18
200.00	0.01	3.26	2.58	2.58	4.34	77.08

9.3.4. Análisis de frecuencia con distribución Normal

Con esta distribución el proceso de cálculo de precipitación máxima para un período de retorno es casi igual al seguido con la distribución Lognormal, la diferencia es que no es necesaria la transformación con el logaritmo natural.

En este caso el valor de KT es igual al valor de z. El valor de xT (precipitación máxima para un período de retorno) se calcula directamente con la ecuación siguiente

edu.red

Los parámetros estadísticos que se requieren se muestran en el siguiente cuadro

Tabla 32. Parámetros estadísticos de la precipitación máxima de la estación Laraqueri

promedio		35.80
desvest		13.76

En el cuadro que sigue se presenta los cálculos realizados para el análisis de frecuencia de precipitación máxima de 24 horas de la estación Laraqueri.

Tabla 33. Cálculos para análisis de frecuencia con distribución Normal en la estación Laraqueri

T	p	w	z	KT	xT
2.00	0.50	1.18	0.00	0.00	35.80
5.00	0.20	1.79	0.84	0.84	47.37
10.00	0.10	2.15	1.28	1.28	53.43
25.00	0.04	2.54	1.75	1.75	59.89
50.00	0.02	2.80	2.05	2.05	64.06
100.00	0.01	3.03	2.33	2.33	67.81
200.00	0.01	3.26	2.58	2.58	71.24

Como resumen en el siguiente cuadro se muestra los valores de precipitación máxima de 24 horas calculados para la estación Laraqueri con diferentes períodos de retorno, y con diferentes distribuciones de probabilidad.

Tabla 34. Precipitación máxima de 24 horas de la Estación Laraqueri para diferentes periodos de retorno

edu.red

Esta figura solo tiene propósitos de comparación, para propósitos de diseño hidrológico se debe tomar los valores que se obtuvieron con la distribución que presenta un buen ajuste. Como se realizó anteriormente las pruebas X2 y de Kolmogorov-Smirnov la distribución elegida es Log-Pearson Tipo III, por tanto los valores obtenidos con esta distribución son los que se deben utilizar para propósitos de diseño.

edu.red

Figura 15. Precipitación máxima de la estación Laraqueri con diferentes distribuciones de probabilidad

Tabla 35. Prueba de bondad de ajuste de Kolmogorov Smirnov para distribución de Gumbel. Estación Laraqueri

edu.red

Tabla 36. Prueba de bondad de ajuste de Kolmogorov Smirnov para distribución Log Pearson Tipo III. Estación Laraqueri

edu.red

Tabla 37. Prueba de bondad de ajuste de Kolmogorov Smirnov para distribución Normal. Estación Laraqueri

edu.red

Tabla 38. Prueba de bondad de ajuste de Kolmogorov Smirnov para distribución Log-normal. Estación Laraqueri

edu.red

CAPITULO X

Modelamiento estocástico de series hidrológicas

10.1. Introducción

Para modelar estocásticamente series hidrológicas, es necesario seguir un conjunto de pasos que se aplican en la mayoría de procesos de modelamiento matemático.

Según Salett y Hein (___), mencionan que "Muchas situaciones del mundo real pueden presentar problemas que requieren soluciones y decisiones", y que "la solución de un problema requiere una formulación matemática detallada.

Al conjunto de símbolos y relaciones matemáticas que traducen, de alguna manera, un fenómeno en cuestión o un problema realista, lo denominamos Modelo Matemático".

10.2. Modelación Matemática

Salett y Hein (___), definen a la modelación matemática como "el proceso involucrado en la obtención de un modelo. Este proceso, desde cierto punto de vista, puede ser considerado artístico, ya que para elaborar un modelo, además del conocimiento matemático, el modelador debe tener una dosis significativa de intuición-creatividad para interpretar el contexto, discernir qué contenido matemático se adapta mejor y tener sentido lúdico para jugar con las variables involucradas. El modelador debe ser un artista al formular, resolver y elaborar expresiones que sirvan no sólo para una solución particular, sino también, posteriormente, como soporte para otras aplicaciones y teorías".

Salett y Hein (___), consideran que las matemáticas y realidad son dos conjuntos disjuntos y el modelaje es un medio de conjugarlos, y representan este proceso por medio del siguiente esquema:

edu.red

Figura 16. Proceso de modelamiento

Actualmente, este proceso se utiliza en toda ciencia, de modo que contribuye en forma especial en la evolución del conocimiento humano (Salett y Hein (___)).

Los pasos que se sigue para representar matemáticamente un problema real se presenta en un proceso de tres etapas, divididas en cinco subetapas (Salett y Hein (___)):

1. Interacción con el asunto

(i) Reconocimiento de la situación problema;

(ii) Familiarización con el asunto que va a ser modelo-investigación.

2. Construcción matemática

(i) Formulación del problema-hipótesis;

(ii) Resolución del problema en términos del modelo.

3. Modelo matemático

(i) interpretación de la solución-convalidación.

El siguiente diagrama, representa el proceso:

edu.red

Figura 17. Proceso de la modelación matemática

10.2. Interacción con el asunto

Una vez delineada la situación que se pretende estudiar, debe hacerse una investigación sobre el asunto.

Tanto indirectamente (a través de libros y revistas especializadas) como directamente in situ (a través de datos experimentales obtenidos con especialistas del área). Aunque hayamos dividido esta etapa en dos subetapas, los límites entre ambas no son tajantes: el reconocimiento de la situación-problema se torna cada vez más claro, a medida que se van conociendo los datos (Salett y Hein (___)).

10.3. Construcción Matemática

Ésta es la etapa más compleja y desafiante. Está subdividida en formulación del problema y solución. Es aquí que se da la "traducción" de la situación-problema al lenguaje matemático. Intuición y creatividad son elementos indispensables en esta etapa.

En la formulación del problema-hipótesis, es necesario:

堃lasificar las informaciones (relevantes y no relevantes) identificando los hechos involucrados.

堄ecidir cuáles son los factores a ser perseguidos, planteando la hipótesis.

堇eneralizar y seleccionar variables relevantes.

堓eleccionar símbolos apropiados para dichas variables.

堄escribir las relaciones que se establezcan, en términos matemáticos (Salett y Hein (___)).

Se debe concluir esta subetapa con un conjunto de expresiones aritméticas y fórmulas, o ecuaciones algebraicas, o gráfico, o representaciones, o programa computacional que nos lleven a la solución o nos permitan deducir una.

En la solución del problema en términos del modelo la situación pasa a ser resuelta o analizada con el "instrumental" matemático de que se dispone. Esto requiere un aguzado conocimiento sobre las entidades matemáticas usadas en la formulación (Salett y Hein (___)).

10.4. Modelo Matemático

Para poder concluir el modelo, se torna necesario un chequeo para así comprobar en qué nivel éste se aproxima a la situación-problema traducida y a partir de ahí, poder utilizarlo.

De esta forma, se hace primero la interpretación del modelo y posteriormente, se comprueba la adecuación-convalidación.

Para interpretar el modelo se analizan las implicaciones de la solución, derivada del modelo que está siendo investigado. Entonces, se comprueba la adecuación del mismo, volviendo a la situación-problema investigada, evaluando cuán significativa y relevante es la solución.

Si el modelo no atiende a las necesidades que lo generó, el proceso debe ser retomado en la segunda etapa cambiando hipótesis, variables, etc (Salett y Hein (___)).

10.5. Modelamiento Estocástico

10.5.1. Procedimiento del modelamiento estocastico

Según Salas (2008), los pasos del modelamiento estocástico de series hidrológicas son los siguientes:

Definición del enfoque de modelamiento (esquema)

Características del sistema de recursos hídricos.

Características físicas de los procesos hidrológicos tratados.

Características estadísticas de las series hidrológicas tratadas.

Otros aspectos (experiencia, software, sesgo, etc).

Selección del tipo de modelo.

Identificación del orden del modelo.

Estimación de los parámetros del modelo.

Prueba y verificación del modelo.

Aplicar el modelo.

10.5.2. Características estadísticas de series de tiempo hidrológicas

Salas (2000) menciona que, un proceso de series de tiempo puede ser caracterizado por un número de propiedades estadísticas tales como la media, desviación estándar, coeficiente de variación, coeficiente de sesgo, correlación estación a estación, autocorrelación, correlación cruzada, y estadísticas relativas al almacenamiento, a sequias y a excesos.

Estadísticas muestrales generales para datos anuales

Salas (_____), describe, que la media y la varianza de una serie de tiempo yt se estiman por

edu.red

El estimador rk de la anterior ecuación es un estimador del coeficiente de autocorrelación poblacional ?k. El gráfico de rk contra k es el correlograma. Algunas veces el correlograma se usa para elegir el tipo de modelo estocástico para representar una serie de tiempo dada. El coeficiente de correlación serial de un retardo r1 es una medida simple del grado de dependencia en el tiempo de una serie. Cuando el correlograma decae rápidamente a cero después de unos pocos retardos, esto puede ser indicación de una persistencia pequeña o memoria corta en las series, mientras un decaimiento lento del correlograma puede ser indicación de una persistencia grande o memoria larga.

Alternativamente se puede estimar la función de autocorrelación de la siguiente manera.

edu.red

Estadísticas muestrales estacionales

Salas (______), describe, del siguiente modo que, las series de tiempo, hidrológicas estacionales, tales como los caudales mensuales, pueden describirse mejor por considerar las estadísticas en una base estacional.

edu.red edu.red

Estadísticas relacionadas al almacenamiento

Salas (2000) menciona que, las estadísticas relacionadas al almacenamiento, son particularmente importantes en el modelamiento de series de tiempo para estudios de simulación de sistemas de reservorios.

edu.red

El cálculo de la capacidad de almacenamiento está basado en el algoritmo del pico secuente que es equivalente al método de la curva de masa Rippl. El algoritmo, aplicado a la serie de tiempo yi, i = 1,厠 puede describirse como sigue.

edu.red

Estadísticas relacionadas a sequia

Según Salas (2000), las estadísticas relacionadas a sequias son también importantes en el modelamiento de las series de tiempo hidrológicas.

edu.red

En el software SAMS, la duración de la sequia más larga y la magnitud máxima de déficit, son estimadas para ambas series anuales y estacionales (mensuales).

Estadísticas relacionadas a exceso

Sveimsson et al (2007) afirma que, las estadísticas relacionadas a exceso son simplemente lo opuesto de las estadísticas relacionadas a sequia. Considerando el mismo nivel umbral d, un exceso ocurre cuando yi > d consecutivamente hasta que yi < d otra vez. Entonces, asumiendo que m excesos ocurren durante un período de tiempo dado N, el máximo período de exceso L* y la magnitud máxima de exceso M* puede determinarse también desde las ecuaciones anteriores.

10.6. Modelo Markoviano de datos anuales

Según Salas (1979), este modelamiento supone previamente que se han efectuado pruebas de homogeneidad y la corrección de algún salto o tendencia significativa.

Este modelo autoregresivo es aplicable a series que no son normales. Se realizará el modelamiento con los datos originales (sin normalizarlos) y se determinará la distribución de probabilidad de los residuos.

10.6.1. Descripción del modelo

Salas (1979) describe al Modelo Markoviano de orden – m con parámetros constantes como

edu.red

Las variables se definen como

edu.red

Salas (1979) menciona que, en la práctica el modelo de orden 1 es más comunmente utilizado, sobre todo en series de corta longitud de registros.

10.6.2. Estimación de parámetros

edu.red

10.6.3. Modelo Markoviano de orden 1

Para m = 1, la variable estandarizada dependiente se escribe como

edu.red

Ejemplo 10.1 Se realiza la determinación del autocorrelograma y la estimación de los parámetros del modelo Markoviano de orden 1 para datos de volumenes anuales del río Ramis en millones de m3, mostrados en el cuadro siguiente. También se realiza una generación series sintéticas con el modelo.

Tabla 39. Volúmenes anuales del río Ramis (MMC)

Año	Vol (MMC)	Año	Vol (MMC)	Año	Vol (MMC)	Año	Vol (MMC)
1964	2437.34	1974	2997.39	1984	2906.84	1994	2674.86
1965	1767.05	1975	2566.86	1985	3503.69	1995	1654.56
1966	1693.27	1976	2351.38	1986	3980.53	1996	1580.69
1967	1268.70	1977	1871.94	1987	1762.91	1997	2897.51
1968	1774.14	1978	3065.99	1988	2538.35	1998	1576.80
1969	1170.46	1979	2771.71	1989	2460.84	1999	2102.03
1970	2554.50	1980	2034.81	1990	1318.72	2000	2036.28
1971	2647.90	1981	2665.27	1991	1292.63	2001	3303.76
1972	2049.93	1982	2809.47	1992	1331.94	2002	3013.20
1973	2727.13	1983	767.06	1993	2164.49

El tamaño de la muestra es N = 39.

edu.red

En el siguiente cuadro se presenta el proceso de cálculo del coeficiente de autocorrelación de retardo 1.

Tabla 40. Cálculo del coeficiente de autocorrelación de retardo 1

t	yt	xt	x(t+1)	x(t)*x(t+1)	x(t)^2	x(t+1)^2
1	2437.34	0.2490	-0.6857	-0.1707	0.0620	0.4702
2	1767.05	-0.6857	-0.7886	0.5407	0.4702	0.6219
3	1693.27	-0.7886	-1.3806	1.0888	0.6219	1.9061
4	1268.70	-1.3806	-0.6758	0.9331	1.9061	0.4567
5	1774.14	-0.6758	-1.5176	1.0256	0.4567	2.3032
6	1170.46	-1.5176	0.4123	-0.6258	2.3032	0.1700
7	2554.50	0.4123	0.5426	0.2237	0.1700	0.2944
8	2647.90	0.5426	-0.2913	-0.1580	0.2944	0.0848
9	2049.93	-0.2913	0.6531	-0.1902	0.0848	0.4265
10	2727.13	0.6531	1.0299	0.6726	0.4265	1.0608
11	2997.39	1.0299	0.4296	0.4424	1.0608	0.1845
12	2566.86	0.4296	0.1291	0.0555	0.1845	0.0167
13	2351.38	0.1291	-0.5394	-0.0696	0.0167	0.2910
14	1871.94	-0.5394	1.1256	-0.6072	0.2910	1.2670
15	3065.99	1.1256	0.7152	0.8051	1.2670	0.5116
16	2771.71	0.7152	-0.3123	-0.2234	0.5116	0.0976
17	2034.81	-0.3123	0.5668	-0.1770	0.0976	0.3213
18	2665.27	0.5668	0.7679	0.4352	0.3213	0.5896
19	2809.47	0.7679	-2.0801	-1.5973	0.5896	4.3270
20	767.06	-2.0801	0.9037	-1.8797	4.3270	0.8166
21	2906.84	0.9037	1.7359	1.5687	0.8166	3.0135
22	3503.69	1.7359	2.4009	4.1678	3.0135	5.7642
23	3980.53	2.4009	-0.6915	-1.6602	5.7642	0.4782
24	1762.91	-0.6915	0.3898	-0.2696	0.4782	0.1520
25	2538.35	0.3898	0.2817	0.1098	0.1520	0.0794
26	2460.84	0.2817	-1.3109	-0.3693	0.0794	1.7184
27	1318.72	-1.3109	-1.3473	1.7661	1.7184	1.8151
28	1292.63	-1.3473	-1.2924	1.7412	1.8151	1.6704
29	1331.94	-1.2924	-0.1315	0.1700	1.6704	0.0173
30	2164.49	-0.1315	0.5802	-0.0763	0.0173	0.3366
31	2674.86	0.5802	-0.8426	-0.4888	0.3366	0.7099
32	1654.56	-0.8426	-0.9456	0.7967	0.7099	0.8941
33	1580.69	-0.9456	0.8907	-0.8422	0.8941	0.7933
34	2897.51	0.8907	-0.9510	-0.8470	0.7933	0.9044
35	1576.80	-0.9510	-0.2186	0.2079	0.9044	0.0478
36	2102.03	-0.2186	-0.3103	0.0678	0.0478	0.0963
37	2036.28	-0.3103	1.4571	-0.4521	0.0963	2.1233
38	3303.76	1.4571	1.0520	1.5329	2.1233	1.1067
39	3013.20	1.0520			1.1067
Suma =	88092.92	-1.0520	-0.2490	7.6471	36.8933	37.9380
Media =	2258.79				r1 (xt) =	0.20430207
Desvest =	717.13

Pero al aplicar la formula siguiente

edu.red

Se obtiene r1 = 0.201239, existe una pequeña diferencia en el coeficiente de autocorrelación estimada con cada formula. La última fórmula es de una literatura más reciente y se recomienda, además en el programa estadístico MINITAB 15, se emplea esta también.

En este caso, se trabaja con el valor ?1 = 0.204302, y el autocorrelograma se determina con esta fórmula. El autocorrelograma obtenido hasta un retardo de 5 se muestra en el siguiente gráfico.

edu.red

Figura 18. Autocorrelograma obtenido para los volúmenes anuales del río Ramis

En el cuadro siguiente se muestra los valores determinados de coeficientes de autocorrelación para el retardo k

Tabla 41. Coeficientes de autocorrelación

edu.red

En el siguiente cuadro se muestra los cálculos

Tabla 42. Calculo de la variable aleatoria independiente

Partes: 1, 2, 3, 4, 5

Página anterior

Volver al principio del trabajo

Página siguiente