Descargar

Estimación de la producción de arroz en Venezuela

Enviado por Gelis Torrealba


  1. Introducción
  2. Marco teórico
  3. Aspectos metodológicos
  4. Análisis y evaluación del método
  5. Conclusión
  6. Referencias bibliográficas

Introducción

El diplomado en Estadística Aplicada a las Ciencias Sociales con el propósito de actualizar los conocimientos del talento humano en la generación, gestión y análisis de estadísticas sociales, económicas, administrativas y salud, entre otras, en la planificación y toma de decisiones en la gestión pública y privada; donde el uso de herramientas y técnicas de estadística exige una formación especializada de funcionarios, profesionales y personas de las diferentes ramas del saber que tengan que ver con el manejo, análisis y desarrollo de informes.

La estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino en conocer el proceso de interpretación de esa información.

De allí surge de la importancia y necesidad que tiene el uso de la Estadística en cualquier área del conocimiento, particularmente se expone lo que concierne a las Ciencias Sociales como una herramienta para la obtención y el análisis de datos, mediante características y métodos propios de esta área de la Matemática.

Por lo antes expuesto, el objetivo del presente trabajo, consistió en poner en práctica los conocimientos adquiridos en el Diplomado de Estadística Aplicada a las Ciencias Sociales, a través de la formulación de aplicaciones prácticas con datos cuantitativos, cuyo objetivo fue estimar la producción de arroz en Venezuela.

Marco teórico

Análisis de Regresión Lineal Simple

El objetivo principal del análisis de regresión es estimar el valor de una variable aleatoria (la variable dependiente) dado que se conoce el valor de una variable asociada (la variable independiente).

La ecuación lineal que representa al modelo de regresión lineal simple (Kasmier, 2006) es:

edu.red

Aspectos metodológicos

En esta investigación se utiliza la Regresión Lineal para la estimación de la producción de arroz en Venezuela; requiriéndose determinar si la superficie cosechada de arroz influye significativamente en la producción de dicho cultivo y finalmente determinar la bondad del ajuste del modelo y verificar sus supuestos.

Por otra parte, la población está conformada por los valores de producción y superficie cosechada en Venezuela desde 1997 al 2013; donde la muestra corresponde a dichos valores de producción y superficie cosechada desde el año 1997 al 2013. Los datos fueron obtenidos a través de la página de internet:http://www.fedeagro.org/

Los datos fueron representados en cuadros y gráficos (figuras) para hacer un análisis de éstos, que permite elaborar conclusiones y obtener resultados estadísticos como base para dar las recomendaciones necesarias; con la ayuda de software estadísticos como SPSS, InfoStat y hoja de cálculo Excel. En primer lugar un análisis univariante en donde se presentan las medidas descriptivas para cada variable y luego la estimación de la recta de regresión con uso de la técnica de análisis de regresión lineal con mínimos cuadrados y finalmente el coeficiente de determinación, que es el estadístico que mide la proporción de la variación total en Y que puede ser "explicada" por la variación en X.

En este caso la variable dependiente es producción de arroz y la independiente la superficie cosechada de arroz.

El modelo que se espera obtener es el siguiente:

edu.red

En el Cuadro 1 se presenta la data seleccionada de dos variables en arroz Producción y superficie cosechada de 17 años (1997 al 2013).

Cuadro 1

Producción (kg) y superficie cosechada (ha) de arroz en Venezuela

1997 al 2013

edu.red

Fuente: Fedeagro, 2014.

Análisis y evaluación del método

En los Cuadros 2.1 y 2.2 se muestra la estadística descriptiva de cada una de las variables bajo estudio (Producción y superficie cosechada de arroz).

edu.red

Análisis de la variable dependiente

La producción mínima de arroz en Venezuela es 668.164 kg, la cual ocurrió en el año 2002; mientras que la producción máxima de arroz es de 1.360.650 kg, que fue la del año 2008. Así mismo la producción promedio de arroz en el país es de más o menos 889.622,88 kg (Cuadro 2.1). También el 25% de la producción está por debajo de720.193 kg; el 50% está por debajo de 821.070kg y el 75% está por debajo de 1.005.000 kg. La variabilidad en las observaciones correspondiente a la producción de arroz es de aproximadamente 50.181,440 kg (Cuadro 2.2). Por otra parte, en el histograma (Figura 1) se observa que la distribución de los datos es platicúrtica, es decir, existe poca concentración de datos en la parte central de la distribución, esto se confirma con el coeficiente de curtosis calculado, siendo menor a 0. Con respecto a la asimetría, se observa en el histograma que existen pocos datos alrededor del valor máximo, lo que indica asimetría positiva, esto se confirma con el coeficiente calculado, siendo mayor a 0; sin embargo, en el gráfico de caja no se observan datos atípicos (Figuras 2.1 y 2.2). Por lo antes expuesto la tendencia de la distribución de los datos es a ser plasticúrticos y asimétricos, pero en general son distribuciones normales, ya que los valores de cada uno de los estadísticos están muy cercanos a cero (0).

edu.red

Figura 1. Histograma de producción de arroz

edu.red

Figura 2.1. Diagrama de cajas de la variable producción de arroz con SPSS

edu.red

Figura 2.2. Diagrama de cajas de la variable producción de arroz con InfoStat

Análisis de la variable independiente

La superficie mínima cosechada de arroz en Venezuela es de 134.294 ha, la cual ocurrió en el año 2002; mientras que la superficie máxima cosechada de arroz fue de 263.738 ha, que fue la del año 2009. Así mismo la superficie promedio de arroz en el país es de más o menos 186.334,00 ha (Cuadro 2.1). También el 25% de la superficie está por debajo de 151.875 ha; el 50% está por debajo de 172.952 ha y el 75% está por debajo de 215.979 ha. La variabilidad en las observaciones correspondiente a la superficie cosechada de arroz fue de aproximadamente 10.419,155 ha (Cuadro 2.2). Por otro lado, en el histograma (Figura 3) se observa que la distribución de los datos es platicúrtica, es decir, existe poca concentración de datos en la parte central de la distribución, esto se confirma con el coeficiente de curtosis calculado, siendo menor a 0. Con respecto a la asimetría, se observa en el histograma que existen pocos datos alrededor del valor máximo, lo que indica asimetría positiva, esto se confirma con el coeficiente calculado, siendo mayor a 0; sin embargo, en el gráfico de caja no se observan datos atípicos (Figuras 4.1 y 4.2).

Al igual que para la variable dependiente, la tendencia de la distribución de los datos es a ser plasticúrticos y asimétricos, pero en general son distribuciones normales, ya que los valores de cada uno de los estadísticos están muy cercanos a cero (0).

edu.red

Figura 3. Histograma de superficie cosechada de arroz

edu.red

Figura 4.1. Diagrama de cajas de la variable producción de arroz con SPSS

edu.red

Figura 4.2. Diagrama de cajas de la variable superficie cosechada de arroz con InfoStat

Fuente: InfoStat, 2014. Versión Estudiantil

Diagrama de dispersión

Es una gráfica en la cual cada punto representa un par de valores observados de las variables independiente y dependiente. El valor de la variable independiente X se grafica en el eje horizontal, y el valor de la variable dependiente Y se grafica en el eje vertical (Kasmier, 2006); es decir es la primera forma de describir una distribución bidimensional al representar los pares de valores en el plano cartesiano, recibiendo el nombre de nube de puntos o diagrama de dispersión. En la Figuras: 5.1, 5.2 y 5.3; se muestra la tendencia que indica una relación lineal directa entre las variables producción y superficie cosechada de maíz, para lo cual se procedió a calcular el coeficiente de correlación de Pearson, resultando de 0,951; el cual es positivo y altamente significativo (Cuadro 3), lo que puede considerarse una correlación excelente.

edu.red

Figura 5.1. Diagrama de dispersión con Excel

edu.red

Figura 5.2. Diagrama de dispersión con SPSS

edu.red

Figura 5.3. Diagrama de dispersión con InfoStat

Cuadro 3

Coeficiente de correlación de Pearson para producción

y superficie cosechada de arroz

edu.red

Regresión Lineal Simple. Estimación:

En la Figura 6, se ilustra el gráfico y ecuación de regresión en Excel. Expresando los resultados en términos de la recta de regresión, se tiene:

Y =  10628 + 0,1975 X

edu.red

Figura 6. Gráfico y ecuación de regresión en Excel

Se puede señalar, que por cada hectárea cosechada, la producción aumenta en 0,1975 kilos; mientras que el coeficiente "b0" indica el valor promedio de la producción de arroz cuando no varía la superficie cosechada (aproximadamente 10.628 kg). Es decir, esta ecuación de regresión, se usa para estimar la producción de arroz. El coeficiente de determinación (R2) es un valor de 0,9049. Esto significa que la variación en la superficie cosechada explica el 90,49 % de la variación de la producción anual de arroz en Venezuela. El resultado del análisis de regresión a través del programa SPSS, se puede observar en los Cuadros: 4, 5 y 6; donde la ecuación es exactamente la misma, antes indicada, aunque en la constante:ß0 (Cuadro 6) el valor de t resultó no significativo, mientras que para superficie si resultó altamente significativo. El análisis de la varianza (ANOVA) para regresión resultó altamente significativo (Cuadro 5) y el coeficiente ß1 es altamente significativo (Cuadro 6).

edu.red

Detección de violaciones de supuestos del modelo

Revisión del modelo

Luego de que se ha estimado un modelo de regresión se debe estudiar si el mismo es el adecuado; por lo que corresponde probar si los supuestos, sobre los que se sustenta el modelo, son aceptables. Es decir, que los errores son independientes, normalmente distribuidos con media cero y varianza constante?, ¿será lineal el modelo?. Los residuos darán pautas para decidir si rechazan o no se rechazan estas hipótesis.

Normalidad

Como se observa en la Figura 7, donde el Q-Q plot fue realizado con los residuos del modelo de regresión y usando como distribución teórica la Normal: los puntos se disponen en una recta a 45º indicando que el supuesto distribucional para los residuos se cumple, lo que se comprueba con la Prueba de Shapiro-Wilks (modificado), cuyas hipótesis:

Ho: Los errores siguen una distribución normal

H1. Los errores no siguen una distribución normal

edu.red

edu.red

Homocedasticidad

De acuerdo a la Figura 8, los residuos muestran tendencia de ser homocedásticos

edu.red

Conclusión

De acuerdo a los resultados del análisis de regresión lineal, la producción de arroz en Venezuela ha sido estimada mediante un modelo bastante bueno, determinado por el R2. Cabe destacar que también concuerda con las relaciones funcionales esperadas entre la variable explicativa y la variable dependiente. Asimismo, no se viola ninguno de los supuestos del análisis de regresión lineal.

Referencias bibliográficas

Di Rienzo J.A., Casanoves F., Balzarini M.G., Gonzalez L., Tablada M., Robledo C.W. InfoStat versión 2014. Grupo InfoStat, FCA, Universidad Nacional de Córdoba, Argentina. URL http://www.infostat.com.ar

FEDEAGRO. 2014. Estadísticas Agrícolas. In. http://www.fedeagro.org/

Guilarte, A. y Marín C. 2014. Regresión y Correlación. 19 p.

Kasmier L. 2006. Estadística Aplicada a Administración y Economía. Cuarta edición. McGraw-Hill editores. México. 406 p.

 

 

Autor:

Gelis T. Torrealba N.

edu.red

edu.rededu.red

Universidad Central de Venezuela

Facultad de Agronomía

Coordinación de Extensión

Diplomado en Estadística Aplicada a las Ciencias Sociales

Maracay, enero 2015