Modelo de pronóstico de la demanda turística en el Estado Mérida, Venezuela
Enviado por Margot Ramírez
- Introducción
- Métodos y Técnicas a Emplear
- Desarrollo: Aplicación del Procedimiento Propuesto
- Contraste de Dickey-Fuller estándar
- Identificación de modelos ARIMA
- Conclusiones
- Bibliografía
- Anexos
Introducción
El turismo en nuestro tiempo constituye, la primera industria mundial, hasta el punto de que la actividad turística se ha convertido en un componente fundamental del consumo de los países desarrollados, en opinión de los expertos, el turismo se puede erigir en uno de los sectores productivos que a medio y largo plazo puede sustentar la economía de algunos países, especialmente de aquellos que están en vías de desarrollo. Según la OMT El en el año 2014 el número de turistas creció un 4,3% a nivel mundial, en consecuencia los ingresos generados por el turismo tuvo un crecimiento del 3,7% en términos globales y reales (deducida ya la inflación y las fluctuaciones de tipos de cambio), y espera crecimientos del 3,3% anual hasta el año 2030, cuando está previsto llegar a los 1.800 millones de turistas.
Las razones que podrían justificar estas expectativas son múltiples; en primer lugar, las mejoras tecnológicas de los medios de transporte y la creciente calidad de las vías de comunicación y el creciente peso del sector terciario en la economía de los países más desarrollados está provocando no sólo más facilidades para viajar sino también para aumentar la frecuencia de los viajes realizados.
La rentabilidad de muchas oportunidades de inversión se evalúa en base a proyecciones más precisas. Las mismas también son necesarias a los efectos de posicionar un destino en relación con su competencia. Motivos como los señalados anteriormente han estimulado el interés en la búsqueda de técnicas apropiadas para modelar la demanda turística. Un gran número de técnicas han sido aplicadas en las últimas décadas. Estos métodos incluyen análisis de series de tiempo, modelos econométricos en general y enfoques de modelización no lineales.
En este sentido, en Venezuela, se hace necesario proyectar la afluencia de turistas que nos visitan, y en especial en el estado Mérida para poder realizar una planificación turística más eficiente
Debido al comportamiento estacional que poseen las series turísticas diversos autores han analizado y aplicado metodologías de series de tiempo univariadas para ajustar y luego proyectar la cantidad de turistas en diversas regiones y países a nivel internacional. Sin embargo, existen teorías que afirman poder proyectar mejor con un modelo ARIMA que con otros modelos univariados y multivariados.
En este sentido, (Chatfield, 2001) señala que muchos investigadores esperarían que la proyecciones con modelos multivariados sean al menos tan buenas como las que se realizan con modelos univariados, pero esto no siempre es así, primero porque es un error común el incluir más variables para tener una mejor predicción, cuantos más parámetros se incluyen, más oportunidad de aumentar la incertidumbre; por otro lado, más variables para medir implican que más datos pueden estar afectados por errores y outliers; y cuanto más complicado sea el modelo, hay más probabilidad de especificarlo mal, de aquí que los modelos univariados son más robustos que los multivariados.
La demanda de turismo en Mérida ha mostrado un crecimiento importante a lo largo de los últimos años. Según La Corporación Merideña de Turismo, en la última década el número de turistas ha crecido a una tasa promedio anual del 0,46%.
Una de las técnicas estadísticas tradicionales empleadas frecuentemente en el pronóstico de series de tiempo es la metodología Box-Jenkins, la cual permite obtener buenas aproximaciones cuando se aplica a series de tiempo estacionarias o que pueden convertirse en estacionarias mediante la transformación o transformaciones adecuadas.
Hasta ahora es insuficiente el conocimiento sobre la aplicación de un modelo desde un enfoque de series de tiempo para el estudio de demanda turística en Mérida, las propuestas en trabajos de tesis se han enfocado en series económicas, en este sentido, el trabajo nace de la necesidad de responder y pronosticar de manera eficiente la afluencia turística en el corto y mediano plazo, aplicando herramientas estadísticas sólidas para cuantificar los posibles modelos para pronosticar. Además, constituye una herramienta nueva para la Corporación que actualmente las decisiones para la realización de proyectos básicamente utilizando técnicas de baja confiabilidad, por lo cual este trabajo pretende determinar la factibilidad de emplear la teoría de pronósticos en la predicción de la serie de demanda turística 2000 – 2014 llevadas por la Corporación Merideña de turismo.
Objetivo General: Determinar un modelo de serie de tiempo para pronosticar la demanda turística del Estado Mérida.
Objetivos Específicos siguientes:
1. Identificar un modelo de serie de tiempo para pronosticar la demanda turística del Estado Mérida.
2. Aplicar el modelo de serie de tiempo para pronosticar la demanda turística del Estado Mérida.
– Métodos de análisis de series de tiempo y el estudio de los indicadores se realizará empleando modelos paramétricos ARIMA, que son bastante flexibles y convenientes para modelar series temporales. Sirven para modelar comportamientos estacionarios y no estacionarios; por ello se seguirá de cerca la metodología propuesta por Box y Jenkins.
– Uso del entorno y lenguaje de programación R.
Fases del Proceso
– Análisis descriptivo de la serie de tiempo
– Representación gráfica de la serie de tiempo
– Identificación del modelo
– Identificación de modelos ARIMA
– Estimación de los modelos propuestos
– Selección del modelo
– Diagnóstico del modelo
– Pronósticos de las temporadas siguientes
– Representación gráfica de los valores pronosticados
Estas tareas se llevaron a cabo de acuerdo a los fundamentos teóricos y metodológicos relacionados a la investigación, entre las principales temáticas se señalan: Modelos de Series de tiempo, La Metodología de Box-Jenkins, Demanda Turística, entre otros.
Desarrollo: Aplicación del Procedimiento Propuesto
Se procederá a aplicar la metodología propuesta de Box y Jenkins con su respectivo procedimiento para la obtención de los pronósticos en el lenguaje de programación R .
De acuerdo con la Organización Mundial del Turismo, el turismo se constituye de aquellas actividades que realizan las personas en lugares que se encuentran fuera de su lugar de residencia habitual por motivos personales o de negocios durante al menos 24 horas. Esta actividad guarda estrecha relación con el crecimiento de los países, ya que permite aumentar la diversificación, así como mejorar los destinos de cada uno de estos países a fin de posicionarse de manera sostenible.
El archivo de datos temporadas.txt, contiene la afluencia de turistas al estado Mérida durante las temporadas vacacionales Carnaval, Semana Santa, Vacaciones Escolares y Navidad desde el año 2000 hasta 2014, para un total de 60 observaciones según datos proporcionados por la Corporación Merideña de Turismo (CORMETUR). Durante el periodo bajo estudio la afluencia de turistas presentó una media de 207.917 personas, con un mínimo de 3.844 personas en la temporada de Carnaval de 2014 y un máximo de 458.547 personas en la temporada de Semana Santa de 2012. Para medir la capacidad de predicción del modelo seleccionado se emplearon como datos de validación los correspondientes a la afluencia de turistas en el año 2015.
Representación gráfica
Gráfico 1. Afluencia de turistas al estado Mérida desde 2000 a 2015. Fuente: A partir de la serie de tiempo analizada.
El gráfico de la serie de tiempo correspondiente a la afluencia de turistas en el periodo bajo estudio, muestra un comportamiento regular, que se repite cada año desde el año 2000 hasta el 2011, sin embargo, desde el año 2012 este patrón regular no continúa, presentándose los valores máximos y mínimos de la serie de tiempo en los años 2014 y 2012 respectivamente. El gráfico además permite ver que en la temporada de Carnaval la afluencia de turistas es más baja respecto al resto de las temporadas vacacionales, mientras que en las temporadas de Semana Santa y Vacaciones escolares se presentan una mayor afluencia de turistas.
Funciones de autocorrelación simple y parcial.
Grafico 2. Función de autocorrelacion simple. Fuente: A partir de la serie de tiempo analizada.
Grafico 3. Función de autocorrelacion parcial. Fuente: A partir de la serie de tiempo analizada.
En el correlograma de la función de autocorrelacion simple se observan que los valores de ?k decrecen oscilando entre valores positivos y negativos lentamente y algunos uno de ellos son significativamente distintos de cero, mientras que en el correlograma de la función de autocorrelacion parcial los primeros coeficientes son significativamente distintos de cero, el resto de ellos se encuentran dentro de los límites confidenciales. Lo anterior indica que la correlación entre los valores próximos es alta pero a medida que se incrementan los rezagos entre los valores de la serie la correlación disminuye, además la correlación es significativa en los rezagos 4s con s=1, 2, 3,…, debido a que estamos tratando con una serie que presenta un patrón regular.
Contraste de Dickey-Fuller estándar
El contraste de Dickey-Fuller se emplea para determinar la existencia de raíces unitarias en la serie de tiempo estudiada, partiendo del modelo Xt = ?Xt-1 + ut, con -1=? = 1, el test de Dickey-Fuller se basa en la siguiente expresión ?Xt = dXt-1 + ut; donde se contrastan las hipótesis H0: r=1 Vs H1: r?0.
Como se observó en los correlogramas de las funciones de autocorrelacion simple y parcial, resulta evidente que la serie presenta el componente estacionario ya que las correlaciones son significativas en los rezagos 4s con s=1, 2, 3, a fin de formalizar estas aseveraciones se realizó el contraste de Dickey-Fuller, y como el valor del p-valor es menor a a=0.05 se rechaza la hipótesis nula, con lo cual podemos afirmar que la serie de tiempo es estacionaria.
Identificación de modelos ARIMA
Observando los correlogramas correspondientes a las funciones de autocorrelacion simple y parcial de la serie de tiempo correspondiente a la afluencia de turistas al estado Mérida, es evidente que la serie presenta un comportamiento estacional, de modo que debe modelarse a través de un modelo SARIMA o ARIMA estacional.
En el correlograma de la función de autocorrelacion simple y parcial, se muestra que en los rezagos estacionales los valores de la función son significativamente distintos de cero, además las correlaciones oscilan entre valores positivos y negativos tendiendo exponencialmente a cero, esto indica que es conveniente seleccionar un modelo autorregresivo estacional, sin embargo, la serie puede ser modelada también a través de un modelo mixto (ARMA) estacional, de modo que se proponen los siguientes modelos: AR (1)4, AR (2)4 y ARMA (1, 1)4, debido a que la serie de tiempo presenta estacionariedad.
Estimación de los modelos propuestos
ARIMA (1, 0, 0)(1,0,0)4
ARIMA (2, 0, 0)(2,0,0)4
ARIMA (1, 0, 1)(1,0,1)4
Selección del modelo
Luego de la identificación de posibles modelos ARIMA estacionales, que puedan modelar la serie de tiempo bajo estudio se procede a la selección del mismo, basándose en criterios de bondad de ajuste proporcionados en la estampación de los modelos. Comparando los resultados obtenidos en la estimación de los tres modelos propuestos, de acuerdo a los valores obtenidos en los criterios de información y el valor de s², se obtiene que el valor de s² estimado y del criterio de información Akaike (AIC) son menores en el modelo ARIMA (1,0,1)(1,0,1)4, por lo cual resulta conveniente seleccionar este modelo, ya que es el que proporciona un menor error cuadrático y una menor pérdida de información.
El modelo seleccionado se encuentra expresado de la forma:
Modelo | AIC | s² |
ARIMA (1, 0, 0)(1,0,0)4 | 1506,81 | 4.166e+09 |
ARIMA(0,0,1)(0,0,1)4 | 1503,12 | 3.604e+09 |
ARIMA (1,0,1)(1,0,1)4 | 1496,45 | 3.124e+09 |
Diagnóstico del modelo
El diagnóstico del modelo se realizó empleando métodos gráficos y test formales para demostrar que los residuos se distribuyen normalmente y se modelan bajo un proceso ruido blanco, para tal fin se empleó el gráfico de residuos en función del tiempo, histograma de residuos, grafico de probabilidad Normal (Q-Q plot), correograma de las funciones de autocorrelacion simple y parcial; y los test de Jarque-Bera y de Ljung-Box.
– Gráfico de residuos en función del tiempo.
Grafico 4. Residuos del modelo en función del tiempo. Fuente: A partir de la serie de tiempo analizada.
El grafico de los residuos en función del tiempo para el modelo ARIMA (1, 0, 1)(1,0,1)4 permite ver que los mismos oscilan alrededor del cero, no obstante, tienden a aumentar en los últimos años. Esto indica que los residuos del modelo son cercanos a cero en los primeros años, pero luego del año 2011 los mismos se incrementan, alejando al modelo propuesto de la realidad estudiada.
– Histograma de residuos.
Grafico 5. Histograma de los residuos del modelo. Fuente: A partir de la serie de tiempo analizada.
El histograma permite ver que los residuos tienen una distribución leptocurtica, que además es asimétrica negativa, indicando un elevado grado de concentración alrededor de los valores centrales de la variable bajo estudio.
– Gráfico de probabilidad Normal.
. Grafico 6. Gráfico de probabilidad normal. Fuente: A partir de la serie de tiempo analizada
El grafico de probabilidad normal muestra que la mayoría de los residuos se ubican a lo largo de una recta, sin embargo, algunos de ellos no se encuentran sobre ella, lo que indica que los residuos no tienen una distribución Normal.
– Test de Jarque- Bera
El test de Jarque-Bera contrasta las hipótesis Ho: et ~N (0, s²) vs H1: Los errores no se distribuyen normalmente. Como el valor de JB=85,365>X²(2, 0.05)= 5.99, se rechaza la hipótesis nula por lo cual se puede afirmar que los residuos no provienen de una distribución Normal.
– Test de Ljung-Box
El test de Ljung-Box contrasta las hipótesis H0: Cov(ei, ej)=0 vs H1: Cov(ei, ej)?0. Como el valor del p-valor es mayor a a=0.05, no se rechaza la hipótesis nula, por lo cual podemos afirmar que los errores están incorrelacionados, cumpliéndose el supuesto necesario.
– Funciones de autocorrelación simple y parcial.
Grafico 7. Función de autocorrelación simple de los residuos del modelo. Fuente: A partir de la serie de tiempo analizada
Grafico 8. Función de autocorrelación parcial de los residuos del modelo. Fuente: A partir de la serie de tiempo analizada
El correlograma de las funciones de autocorrelación simple y parcial muestra que no existen correlaciones significativas en los residuos del modelo seleccionado ya que todas ellas se encuentran dentro de los límites confidenciales, además esto es indicio de que los residuos provienen de un proceso ruido blanco; en este tipo de proceso los valores cercanos no guardan correlación, de modo que los errores están incorrelacionados.
De acuerdo a lo observado en el análisis de los modelos propuesto, los residuos del mismo no provienen de una distribución Normal, sin embargo, los residuos están incorrelacionados y parecieran comportarse de acuerdo a un proceso ruido blanco, además, resulta conveniente seleccionar el modelo ARIMA (1,0,1)(1,0,1)4 ya que proporciona una mejor bondad de ajuste que los otros modelos propuestos.
Pronósticos de las temporadas siguientes
Luego de identificar el modelo y confirmar los supuestos asumidos, llega el momento de pronosticar. Se seleccionó el modelo ARIMA (1,0,1)(1,0,1)4, se realizaron las estimaciones de los siguientes cinco años, es decir, del periodo 2016- 2020; en las estimaciones realizadas se observa que al igual que en los valores de la serie observada, en la temporada de Carnaval el número de turistas que visitan el estado Mérida, es menor al reportado en la temporada de Semana Santa, y este valor se incrementa en la temporada Vacaciones Escolares, pero en la temporada de Navidad el mismo decrece. Estas estimaciones además muestran que el número de turistas que visitan el estado Mérida se incrementa levemente conforme pasan los años, pero manteniendo el mismo patrón regular.
Representación gráfica de los valores pronosticados
La representación gráfica de los valores pronosticados con el modelo seleccionado en comparación con los datos de validación permite ver que ambos son muy cercanos, por lo que el modelo propuesto para el problema bajo estudio se ajusta en gran medida a la realidad estudiada. Sin embargo, al comparar los valores reales con los valores pronosticados se encuentra que estos últimos se encuentran por debajo de los valores reales, en el caso de las temporadas de Vacaciones Escolares y Navidad los pronósticos son muy cercanos a los valores reales, mientras que en las temporadas de Carnaval y Semana Santa los mismos difieren significativamente, pero mantienen el mismo comportamiento.
Grafico 9. Comparación de datos pronosticados con los datos de validación. Fuente: A partir de la serie de tiempo analizada
El modelo de proyección propuesto para modelar la serie de la demanda turística del estado Mérida constituye una herramienta de apoyo a la toma de decisiones para los futuros proyectos turísticos
A partir de la representación gráfica de los valores pronosticados. Se puede aseverar entonces, que el método y modelo seleccionados para esta serie cumple su objetivo de generar buenos pronósticos de la tendencia de la demanda turística.
BOULLÓN, R. (1997). Planificación del Espacio Turístico (3ª ed.). México: Trillas
Box, G. y Jenkins, G. (1984) Time Series Analysis: Forecasting and Control, 2da. Ed., Holden Day, San Francisco.
BROCKWELL, P. Y DAVIS, R. (1996) Introduction to Time Series and Forecasting, Springer-Verlag.
BOX, G. Y JENKINS, G. (1984) Time Series Analysis: Forecasting and Control,2da. Ed., Holden Day, San Francisco Travel Research, vol. 37, pp. 273-284
BURDISSO, T, E. BLANCO Y M. SARDI.2010. Relevancia del ajuste estacional en el análisis de corto plazo: Efectos de calendario doméstico sobre la serie de billetes y monedas en Argentina. Versión Preliminar.
COCHRANE, J. (1997) Time Series for Macroeconomics and Finance, University of Chicago, Notes.
CHATFIELD, C., (2000), Time -Series Forecasting, Chapman & Hall/CRC, Florida, US
CURIEL, JAVIER. (2007) La demanda del turismo cultural y su vinculación con el medio ambiente urbano en Marid. Tesis
DICKEY, Y. Y FULLER, W. (1981) Likelihood Ratio Statistics for Autorregressive Time Series whith Unit Root, Econometrica 49 1063.
CRYER, J. Y CHANG, K. (2008) Time Series Analysis, Springer, Second Edition.
FARAWAY JULIAN. Linear models with r. Chapman & Hall/CRC Texts in Statistical Science. 2004.
LI, G., SONG, H., (2008), "Tourism demand modeling and forecasting – A review of recent research", Tourism Management, vol. 29 (2), pp. 203-220.
WEI, W. (2006) Time Series Analysis, Second Edition, Addison-Wesley.
Algoritmo
library(TSA)
library(tseries)
datos<- read.table(file = "Temporadas.txt", header = FALSE, sep = "t", dec = ".")
Temporada<- ts(datos, start = c(2000, 1), frequency = 4)
Temporada
Datos2015<-read.table(file = "DatosVal.txt", header = FALSE, sep = "t", dec = ".")
Temporada2015<- ts(Datos2015, start = c(2015, 1), frequency = 4)
summary(Temporada)
plot(Temporada,type='o',ylab='Pax')
acf(Temporada, type = "correlation")
acf(Temporada, type = "partial")
adf.test(Temporada, k=0)
M1<- arima(Temporada, order=c(1,0,0), seasonal=list(order=c(1,0,0), period=4))
M1
M2<- arima(Temporada, order=c(2,0,0), seasonal=list(order=c(2,0,0), period=4))
M2
M3<- arima(Temporada, order=c(1,0,1), seasonal=list(order=c(1,0,1), period=4))
M3
plot(resid(M3),type='l',ylab='Pax')
hist(M3$resid, br=12)
kurtosis(M3$resid)
skewness(M3$resid)
qqnorm(M3$resid)
jarque.bera.test(M3$resid)
Box.test (resid(M3), lag = 1, type = "Ljung")
acf(resid(M3), type = "correlation")
acf(resid(M3), type = "partial")
PrediccionM3<-predict((M3),n.ahead=24)$pred
ErrorM3<-predict((M3),n.ahead=24)$se
Prediccion<- data.frame (cbind(PrediccionM3,ErrorM3))
Prediccion
win.graph(width=7, height=3,pointsize=7)
ts.plot(Temporada, Temporada2015, PrediccionM3, col=9:12,xlab="Tiempo",ylab="Pax",main="Pronósticos")
Autor:
Lcda. Margot Ramírez
Tesista del Máster en Gestión Turística.
Universidad de Matanzas.
Facultad de Ciencias Económicas e Informática.
Año: 2017.