Descargar

Estimación de la producción de arroz en Venezuela

Enviado por Gelis Torrealba


  1. Introducción
  2. Análisis de Regresión Lineal Simple
  3. Aspectos metodológicos
  4. Análisis y evaluación del método
  5. Conclusión
  6. Referencias bibliográficas
  7. Anexos

Introducción

El diplomado en Estadística Aplicada a las Ciencias Sociales con el propósito de actualizar los conocimientos del talento humano en la generación, gestión y análisis de estadísticas sociales, económicas, administrativas y salud, entre otras, en la planificación y toma de decisiones en la gestión pública y privada; donde el uso de herramientas y técnicas de estadística exige una formación especializada de funcionarios, profesionales y personas de las diferentes ramas del saber que tengan que ver con el manejo, análisis y desarrollo de informes.

La estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo el proceso de interpretación de esa información.

De allí surge de la importancia y necesidad que tiene el uso de la Estadística en cualquier área del conocimiento, particularmente se expone lo que concierne a las Ciencias Sociales como una herramienta para la obtención y el análisis de datos, mediante características y métodos propios de esta área de la Matemática.

Por lo antes expuesto, el objetivo del presente trabajo, consistió en poner en práctica los conocimientos adquiridos en el Diplomado de Estadística Aplicada a las Ciencias Sociales, a través de la formulación de aplicaciones prácticas con datos cuantitativos, cuyo objetivo fue estimar la producción de arroz en Venezuela.

DESARROLLO

Análisis de Regresión Lineal Simple

El objetivo principal del análisis de regresión es estimar el valor de una variable aleatoria (la variable dependiente) dado que se conoce el valor de una variable asociada (la variable independiente),

La ecuación lineal que representa al modelo de regresión líneal simple (Kasmier, 2006) es:

edu.red

Aspectos metodológicos

Aplicación para el desarrollo de estimaciones de variables dependientes. 1) Caso Análisis de Regresión Lineal Simple

En ésta investigación se utiliza la Regresión Lineal para la estimación de la producción de arroz en Venezuela; requiriéndose determinar si la superficie cosechada de arroz influye significativamente en la producción de dicho cultivo y finalmente determinar la bondad del ajuste del modelo y verificar sus supuestos.

Por otra parte, la población está conformada por los valores de producción y superficie cosechada en Venezuela desde 1997 al 2013; donde la muestra corresponde a dichos valores de producción y superficie cosechada desde el año 1997 al 2013. Los datos fueron obtenidos a través de la página de internet:http://www.fedeagro.org/

Los datos fueron representados en cuadros y gráficos (figuras) para hacer un análisis de estos, que permite elaborar conclusiones y obtener resultados estadísticos como base para dar las recomendaciones necesarias; con la ayuda de los softwares estadísticos SPSS, InfoStat y hoja de cálculo Excel.En primer lugar un análisis univariante en donde se presentan las medidas descriptivas para cada variable y luego laestimación de la recta de regresióncon uso de la técnica de análisis de regresión lineal con mínimos cuadrados y finalmente el coeficiente de determinación,que es el estadístico que mide la proporción de la variación total en Y que puede ser "explicada" por la variación en X.

En este caso la variable dependiente es producción de arroz y la independiente la superficie cosechada de arroz.

El modelo que se espera obtener es el siguiente:

edu.red

En el Cuadro 1 se presenta la data seleccionada de dos variables en arroz Producción y superficie cosechada de 17 años (1977 al 2013).

Cuadro 1. Producción (kg) y superficie cosechada (ha) de arroz en Venezuela desde 1997 al 2013

edu.red

Fuente: Fedeagro, 2014.

Análisis y evaluación del método

Aplicación para el desarrollo de estimaciones de variables dependientes. Caso Análisis de Regresión Lineal

En los Cuadro 2.1 y 2.2 se muestra la estadística descriptiva de cada una de las variables bajo estudio (Producción y superficie cosechada de arroz).

edu.red

Análisis de la variable dependiente

La producción mínima de arroz en Venezuela es 668.164 kg, la cual ocurrió en el año 2002; mientras que la producción máxima de arroz es de 1.360.650 kg, que fue la del año 2008. Así mismo la producción promedio de arroz en el país es de más o menos 889.622,88 kg (Cuadro 2.1). También el 25% de la producción está por debajo de 720.193 kg; el 50% está por debajo de 821.070 kg y el 75% está por debajo de 1.005.000 kg. La variabilidad en las observaciones correspondiente a la producción de arroz es de aproximadamente 50.181,440 kg (Cuadro 2.2). Por otra parte, en el histograma (Figura 1) se observa que la distribución de los datos es platicúrtica, es decir, existe poca concentración de datos en la parte central de la distribución, esto seconfirma con el coeficiente de curtosis calculado, siendo menor a 0. Con respecto a la asimetría, se observa en el histograma que existen pocos datos alrededor del valor máximo, lo que indica asimetría positiva, esto se confirma con el coeficiente calculado, siendo mayor a 0;sin embargo, en el gráfico de caja no se observan datos atípicos(Figuras 2.1 y 2.2).

edu.red

Figura 1. Histograma de producción de arroz con SPSS

edu.red

Figura 2.1. Diagrama de cajas de la variable producción de maíz con SPSS

edu.red

Figura 2.2. Diagrama de cajas de la variable producción de maíz con InfoStat

Análisis de la variable independiente

La superficie mínima cosechada de arroz en Venezuela es de 134.294 ha, la cual ocurrió en el año 2002; mientras que la superficie máxima cosechada de arroz fue de 263.738 ha, que fue la del año 2009. Así mismo la superficie promedio de arroz en el país es de más o menos 186.334,00 ha (Cuadro 2.1). También el 25% de la superficie está por debajo de 151.875 ha; el 50% está por debajo de 172.952 ha y el 75% está por debajo de 215.979 ha. La variabilidad en las observaciones correspondiente a la superficie cosechada de arroz fue de aproximadamente 10.419,155 ha (Cuadro 2.2). Por otro lado, en el histograma (Figura 3) se observa que la distribución de los datos es platicúrtica, es decir, existe poca concentración de datos en la parte central de la distribución, esto se confirma con el coeficiente de curtosis calculado, siendo menor a 0. Con respecto a la asimetría, se observa en el histograma que existen pocos datos alrededor del valor máximo, lo que indica asimetría positiva, esto se confirma con el coeficiente calculado, siendo mayor a 0; sin embargo, en el gráfico de caja no se observan datos atípicos (Figuras 4.1 y 4.2).

edu.red

Figura 3. Histograma de superficie cosechada de arroz con SPSS

edu.red

Figura 4.1. Diagrama de cajas de la variable producción de arroz con SPSS

edu.red

Figura 4.2. Diagrama de cajas de la variable superficie cosechada de arroz con Fuente: InfoStat, 2014. Versión Estudiantil

Diagrama de dispersión

Es una gráfica en la cual cada punto representa un par de valores observados de las variables independiente y dependiente. El valor de la variable independiente X se grafica en el eje horizontal, y el valor de la variable dependiente Y se grafica en el eje vertical (Kasmier, 2006); es decir es la primera forma de describir una distribución bidimensional al representar los pares de valores en el plano cartesiano, recibiendo el nombre de nube de puntos o diagrama de dispersión. En la Figuras: 5.1, 5.2 y 5.3; se muestra la tendencia que indica una relación lineal directa entre las variables producción y superficie cosechada de maíz, para lo cual se procedió a calcular el coeficiente de correlación de Pearson, resultando de 0,951; el cual es positivo y altamente significativo (Cuadro 3), lo que puede considerarse una correlación excelente.

edu.red

Figura 5.1. Diagrama de dispersión con Excel

edu.red

Figura 5.2. Diagrama de dispersión con Excel con SPSS

edu.red

Figura 5.3. Diagrama de dispersión con InfoStat

Cuadro 3. Coeficiente de correlación de Pearson para producción y superficie cosechada de arroz

edu.red

Fuente: IBM SPSS Statistics 20

Regresión Lineal Simple. Estimación:

En la Figura 6, se ilustrael gráfico y ecuación de regresión en Excel. Expresando los resultados en términos de la recta de regresión, se tiene:

Y =  10628 + 0,1975 X

edu.red

Figura 6. Gráfico y ecuación de regresión en Excel

Se puede señalar, que por cada hectárea cosechada, la producción aumenta en 0,1975 kilos; mientras que el coeficiente "b0" indica el valor promedio de la producción de arroz cuando no varía la superficie cosechada (aproximadamente 10.628 kg). Es decir, con ésta ecuación de regresión, se usa para estimar la producción de arroz. El coeficiente de determinación (R2) es un valor de 0,9049. Esto significa que la variación en la superficie cosechada explica el 90,49 % de la variación de la producción anual de arroz en Venezuela. El resultado del análisis de regresión a través del programa SPSS, se puede observar en los Cuadros: 4, 5 y 6; donde la ecuación es exactamente la misma, antes indicada, aunque en la constante:ß0 (Cuadro 6) el valor de t resultó no significativo, mientras que para superficie si resultó altamente significativo.

El análisis de la varianza (ANOVA) para regresión resultó altamente significativo (Cuadro 5) y el coeficiente ß1 es altamente significativo (Cuadro 6).

edu.red

Detección de violaciones de supuestos del modelo. Revisión del modelo

Luego de que se ha estimado un modelo de regresión se debe estudiar si el mismo es el adecuado; por lo que corresponde probar si los supuestos, sobre los que se sustenta el modelo, son aceptables. Es decir, que los errores son independientes, normalmente distribuidos con media cero y varianza constante?, ¿serálineal el modelo? Los residuos darán pautas para decidir si rechaza o no se rechaza estas hipótesis.

Normalidad

Cómo se observa en la figura 7, donde el Q-Q plot fue realizado con los residuos del modelo de regresión y usando como distribución teórica la Normal: los puntos se disponen en una recta a 45º indicando que el supuesto distribucional para los residuos se cumple, lo que se comprueba con la Prueba de Shapiro-Wilks (modificado), cuyas hipótesis:

Ho: Los errores siguen una distribución normal

H1. Los errores no siguen una distribución normal

edu.red

Homocedasticidad

De acuerdo a la Figura 8, los residuos muestran tendencia de ser homocedásticos

edu.red

Figura 8. Residuos

Conclusión

De acuerdo a los resultados del análisis de regresión lineal, la producción de arroz en Venezuela ha sido estimada mediante un modelo bastante bueno. Cabe destacar que también concuerda con las relaciones funcionales esperadas entre la variable explicativa y la variable dependiente.Asimismo, no se viola ninguno de los supuestos del análisis de regresión lineal.

Referencias bibliográficas

Di Rienzo J.A., Casanoves F., Balzarini M.G., Gonzalez L., Tablada M., Robledo C.W. InfoStat versión 2014. Grupo InfoStat, FCA, Universidad Nacional de Córdoba, Argentina. URL http://www.infostat.com.ar

Fedeagro. 2014. Estadísticas Agrícolas. In. http://www.fedeagro.org/

Guilarte, A. y Marín C. (2014). Regresión y Correlación. 19 p.

Kasmier L. 2006. Estadística Aplicada a Administración y Economía. Cuarta edición. McGraw-Hill editores. México. 406 p.

Anexos

ANEXO 1. EVALUACIÓN DIRECTA DE CALIDAD CULINARIA DE FRIJOL (Vignasinensis (L.) Walp)

FECHA: _________________

LUGAR: __________________

NOMBRE DEL EVALUADOR: ______________________________________________

PROCEDENCIA DEL EVALUADOR: ___________________________________________

CARGO DEL EVALUADOR (Agricultor, técnico, estudiante, ama de casa, otro): ________________________________

edu.red

¿Cuál frijol te gusto más y por qué? ____________________________________

 

 

 

 

Autor:

Gelis T. Torrealba N.

edu.red

edu.red

edu.red

Universidad Central de Venezuela

Facultad de Agronomía

Coordinación de Extensión

Diplomado en Estadística Aplicada a las Ciencias Sociales

Maracay, diciembre del 2014