Pero si la generación de capacidades o competencias, que a su vez esta liga a las características de las personas, se puede dar a través de la educación general -formal- o específica -en el puesto laboral– (Brown, 1985); entonces, la dispersión salarial (entre los trabajadores) puede ser muy bien explicada por las características de los trabajadores (experiencia laboral, edad, sexo, entre otras), y especialmente por el nivel de educación
Ahora, si el problema de la pobreza, puede ser explicado desde el lado de generación de capacidades (logro educativo) y de otro, desde la dispersión de la renta, se debiere trabajar en estos dos problemas, por un lado fortaleciendo capacidades, y por otro reduciendo desigualdades.
No obstante de no hacer nada para revertir dicha situación, los problemas de pobreza y de descontento social, se irán agravando en la región.
Asimismo, con el propósito de guiar dicho trabajo, es que se ha planteado la siguiente interrogante:
¿Cuál es la relación que existe entre las diferencias salariales de los trabajadores de la zona urbana del departamento de Cajamarca y sus características, expresadas en: experiencia laboral, nivel de educación, edad, entre otras?
b. Objetivo general
El presente trabajo pretende explicar hasta qué grado las características de los trabajadores de la zona urbana del departamento de Cajamarca, ayudan a explicar la dispersión de los ingresos entre los trabajadores, utilizando para ello un modelo econométrico con datos de corte transversal y basado en la teoría del capital humano; con el propósito de que este análisis permita identificar las variables que más incidencia tengan en la renta de los trabajadores.
c. Objetivos específicos
i. Determinar las principales variables que explican la dispersión de los ingresos entre los trabajadores de la zona urbana del departamento de Cajamarca.
ii. Testear el modelo planteado, aplicando las herramientas del análisis econométrico para este tipo de modelos.
iii. Determinar la relación que existe entre los ingresos (variable endógena) y las características de los trabajadores )variables exógenas o explicativas).
Teoría Neoclásica del Capital Humano[1]
La teoría del capital humano la desarrolló Gary Becker en su obra denominada "Human Capital" publicada en 1964, desde entonces se ha convertido en punto de referencia para el estudio de este tema. El capital humano se define como el conjunto de las capacidades productivas que un individuo adquiere por acumulación de conocimientos generales o específicos. La noción de capital expresa la idea de un stock inmaterial imputado a una persona (i.e. idiosincrásica) que puede ser acumulado o usarse. Es una opción individual, una inversión. Se evalúa por la diferencia entre gastos iniciales: el coste de los gastos de educación y los gastos correspondientes (compra de libros…), el coste de productividad, es decir, el salario que recibiría si estuviera inmerso en la vida activa, y sus rentas futuras actualizadas. El individuo hace, así, una valoración arbitraje entre trabajar y continuar una formación que le permita, en el futuro, percibir salarios más elevados que los actuales. Se toma en cuenta también el mantenimiento de su capital psíquico (salud, alimentación, etc.). Optimiza sus capacidades evitando no se deprecien demasiado, bien por la desvalorización de sus conocimientos generales y específicos, bien por la degradación de su salud física y moral; Invierte con miras a aumentar su productividad futura y sus rentas.
El punto medular de la teoría del capital humano consiste en pensar que las personas gastan en sí mismas de formas diversas y que no sólo buscan una satisfacción presente sino también un rendimiento en el futuro, sea este pecuniario o no pecuniario; así por ejemplo, las personas adquieren cuidados sanitarios, compran voluntariamente educación, gastan tiempo buscando empleo, compran información acerca de las oportunidades del empleo, emigran buscando mejores oportunidades de empleo, etc. Estos fenómenos pueden ser considerados como gastos de inversión más que como gastos de consumo, independientemente de que las realicen los individuos en beneficio propio o de que las realice la sociedad en beneficio de sus miembros.
Además podemos decir que la teoría del Capital Humano contiene todos los elementos de la teoría de la elección racional, los precios y otros instrumentos de mercado que distribuyen los recursos escasos de una sociedad mostrando lo que es factible elegir, permitiendo que las personas formen ciertas creencias y restrinjan sus deseos.
Ahora bien, las preferencias que determinan las elecciones no se refieren exclusivamente a bienes y servicios de mercados tales como manzanas, automóviles y cuidados médicos, sino a los objetos de elección que estos bienes y servicios representan y que son producidos por cada uno de los agentes.
Como todas las inversiones, el individuo ha de hacer frente a la ley de los rendimientos decrecientes, y al carácter irreversible de estos gastos.
La teoría del capital humano distingue dos formas posibles de formación:
La formación general, adquirida en el sistema educativo, formativo. Su transferibilidad y su compra al trabajador explica el que esté financiada por este último, ya que puede hacerla valer sobre el conjunto del mercado de trabajo. Por su parte, la firma no está, en modo alguno, impelida a sufragar los costes de formación de una persona, susceptible de hacer prevalecer esa formación en otra empresa dispuesta a mejorar la remuneración, lo que podría incitarla a abandonar la firma. Para evitar esto, la financiación de la actividad toma la forma de una remuneración más fiable (que su productividad marginal). El acuerdo entre el trabajador y la firma consiste entonces en la compra, por parte de la firma, de la « fuerza de trabajo » de un lado, y la compra de formación del trabajador, por otro.
La formación específica adquirida en el seno de una unidad de producción o de servicio, permite desarrollar al trabajador su productividad dentro de la empresa, pero nada, o bien poco, fuera de ésta. En este caso, la financiación se asegura al mismo tiempo por la firma y por el trabajador.
Durante el periodo de formación, el salario recibido por el trabajador es inferior al que hubiera podido recibir fuera de la empresa. Esta diferencia se valora por su contribución a la formación específica, pero permanece superior a su productividad en valor, libre de los costes económicos de la formación. Esta diferencia expresa la contribución de la firma a esta formación. La firma no acepta un contrato semejante más que en la medida en que ella estime que existen posibilidades de rentabilizar su inversión: el salario que dará al finalizar el periodo de formación será superior al salario de reserva del trabajador para empleos fuera de la empresa, pero inferior a su producción en valor, de tal modo que, al incitarle a permanecer en su seno, la diferencia con el salario dado represente la remuneración de la inversión en capital específico por parte de la empresa.
La herramienta más utilizada para analizar la influencia de la acumulación de capital humano sobre los ingresos y la dispersión salarial, es la ecuación propuesta por Mincer en 1974, aplicada a muestras únicamente de corte transversal (Espino, 2001: 15):
Hipótesis de trabajo
Las características de los trabajadores (capital humano) expresada en educación (años de estudio) y entrenamiento (experiencia laboral), son estadísticamente significativas y ayudan a explicar de manera consistente la dispersión salarial de los trabajadores (sólo de la ciudad) del departamento de Cajamarca.
Como en el presente trabajo no se ha manipulado deliberadamente variables, sino que se ha observado y tomado hechos tal y como se han dado en su contexto actual y real, es que se ha hecho uso del DISEÑO NO EXPERIMENTAL de tipo EX POST FACTO. Específicamente se ha hecho uso del DISEÑO TRANSECCIONAL DESCRIPTIVO-CORRELACIONAL, el cual tiene como característica investigar el objeto en un punto determinado de tiempo, del cual se toma la información para ser utilizado en el estudio. La data incluye información colateral al objeto de estudio. Aquí interesa la descripción del objeto en un momento específico.
El método utilizado en el presente trabajo es el reductivo no inductivo, también el deductivo, así como el analítico-sintético. En ambos métodos siempre estuvieron presentes los procedimientos típicos: observación, análisis, comparación, abstracción, generalización y aplicación[2]
Para contrastar empíricamente la hipótesis de trabajo planteada, se uso la siguiente función de ingresos:
Donde:
LnYi = logaritmo del ingreso del individuo i
AESTi = educación del individuo i
EXLABi = experiencia del individuo i
EXLAB2i = experiencia del individuo i al cuadrado
Zi = otras variables de control del individuo i
ui = término de error de la ecuación
La variable "educación" puede ser tomada como una variable continua que indica la totalidad de años que el individuo ha estudiado, o puede ser un set de variables dicotómicas una para cada nivel educativo (primaria, secundaria, etc.). En el primer caso, se asume implícitamente que el efecto de haber completado un año más de educación es el mismo para cualquier año o tipo de educación. En el segundo caso, permite que el efecto de la educación varíe según el nivel educativo pudiendo ser igual a cero para algún nivel. Para el presente trabajo se tomó el primer caso, es decir, como variable continua.
La variable "experiencia" es muy difícil de observar directamente, por lo que puede elegirse una de las siguientes alternativas: tomar el tiempo que ha transcurrido desde que el individuo dejó de estudiar, o tomar el tiempo que el individuo lleva en el trabajo actual. Aquí se ha optado por la primera opción, la cual se ha corregido por un factor de ajuste. Se incluye el cuadrado de la experiencia para introducir la idea de que el perfil de ingresos del individuo tiene forma cóncava; es decir, pasado un cierto límite, un año adicional de edad disminuye los ingresos en vez de aumentarlos. El efecto total se halla mediante el cálculo que incluye los coeficientes de la experiencia y de la experiencia al cuadrado.
Zi es un vector que recoge otras características del individuo, usadas como variables de control. Puede ser: sexo, rama de actividades a la que pertenece, proveniencia de instituciones educativas públicas o privadas, status de migrante y grupo ocupacional (profesional, vendedores, obreros, etc.).
La ecuación ha sido estimada utilizando información de corte transversal proveniente de la data de la Encuesta Nacional de Hogares (ENAHO), aplicada para Cajamarca y recolectada durante los años 2003 y 2004.
Por otro lado se realizarón diferentes pruebas econométricas (todas las que generalmente se realizan al testear un modelo econométrico), estamos refiriéndonos por ejemplo: comprobación de causalidad a lo Granger de las variables que intervienen en el modelo, pruebas de especificación, pruebas de multicolinealidad y contraste de heteroscedasticidad (principalmente pruebas gráficas, test de Goldfend Quandt y de White), el que resultó ser altamente significativo, por lo que se procedió a descargarlo por los diferentes métodos conocidos (si conocemos ∑, MCP; si no conocemos ∑, estimación consistente de White).
Posteriormente se determinó si el modelo es robusto y consistente; el cual a su vez nos permitió determinar que variables en estudio presentan mayores retornos respecto a la dispersión salarial.
Especificación del modelo
Todas las ecuaciones serán estimadas utilizando información de corte transversal proveniente de la data de la Encuesta Nacional de Hogares (ENAHO), aplicada para Cajamarca, recolectada durante los años 2003 y 2004. Este periodo, si bien es cierto, no nos va a permitir observar la consistencia de los parámetros en el tiempo; sin embargo si será muy útil para determinar sus valores y comprobar así nuestra hipótesis.
A. Número de variables
El número de variables que estamos incorporando en el modelo son las que provienen de la teoría económica, específicamente de la teoría neoclásica del capital humano.
La especificación es:
Sin embargo, vamos a incorpora otras variables que podrían ser significativas, como por ejemplo sexo, la edad, entre otras.
B. Expectativa respecto al tamaño y signo de los parámetros
Teniendo en cuenta el modelo:
Esto implica que mientras más altas sean las tasas de retornos, mayor será la dispersión salarial originada en la diferente cantidad de capital humano acumulado.
C. Forma matemática del modelo
El modelo matemático aplicado para este caso, corresponde a una forma cuadrática, esto debido a que la inversión en capacitación o entrenamiento de la gente que labora, no es observable directamente, entonces estamos remplazando por una función cóncava de la experiencia (β2 X + β3 X2); esto porque la inversión acumulada aumenta con la experiencia, pero como es natural suponer, a una tasa decreciente; es decir, disminuye con la edad.
Por lo que el modelo matemático queda:
(1)
Donde:
Se partió de la suposición de que β0, β1 y β2 > 0 y que β3 < 0
LnYi, es el logaritmo natural del ingreso, el cual fue expresado en nuevos soles; y se ha tomado logaritmo para reducir la dispersión de los ingresos y para contrarrestar la heteroscedasticidad, muy frecuente en este tipo de modelos.
AEST, es la variable que recoge lo datos sobre los años de estudio que ha alcanzado el individuo hasta el momento de la encuesta.
EXLAB, es la experiencia laboral potencial, esta variable lo estimamos restándole a la edad actual, los años de estudio más 6, años que empieza una persona a estudiar en primaria; y multiplicándole por la probabilidad de que se emplee en un lapso no mayor a un año, que en este caso es de 98%; es decir, de la siguiente manera:
Ahora bien, la ecuación 1, nos dice que el logaritmo natural del ingreso individual es una función de la educación (AEST) y de la experiencia laboral (EXLAB) y de la experiencia al cuadrado (EXLAB2).
Además se parte del supuesto de que los ingresos aumentan con la experiencia laboral, pero a una tasa decreciente, por lo que la función de la experiencia es cóncava respecto al origen (β2EXLAB + β3EXLAB2)
Estimación del modelo
Los datos a utilizar en el presente modelo son de corte transversal y provienen de las bases de datos de la ENAHO, la cual incopora la zona urbana y rural, sin embargo, con el propósito de cumplir con los objetivos planteados, hemos filtrado solo zona urbana.
Por su parte el método econométrico a usarse; es decir, el que nos permitirá llegar a medir la relación económica, esto es cuantificar el valor de sus parámetros, es el de mínimos cuadrados ordinarios (MICO)
Además tenemos varios supuestos que acompañan al presente modelo:
Las tasas de retornos son semejantes para todos los individuos; es decir, los beneficios que obtenga un individuo de un año adicional de educación o experiencia no se verá afectada por las cualidades de este (habilidades o destrezas).
La educación constituye una inversión racional.
La educación formal presenta una misma calidad.
La educación no afecta la productividad sino que es únicamente una variable de las habilidades; vale decir que los individuos más hábiles se educan más.
Que los ingresos aumentan con la experiencia laboral, pero a una tasa decreciente.
Corriendo la ecuación 01, obtenemos:
LOG (Y)=4.94295+0.100649*AEST+0.01510117*EXLAB-0.0001735816*(EXLAB^2)… (2)
En el presente modelo vemos que la tasa de retorno de la educación es de 10.06%; es decir, por cada año adicional que una presona dedique a los estudios, este reditúa en 10.06% sobre los ingresos. Ahora, para poder calcular la tasa de retorno a la experiencia laboral, lo que tenemos que hacer es únicamente derivar la ecuación Nº 02 con respecto a EXLAB; es decir:
;
Donde es igual a 20.3053; por lo tanto la tasa de retorno hacia la experiencia es de 0.4%, esto quiere decir, que cada año sucesivo de experiencia provoca un aumento proporcional promedio en los ingresos de 0.4%. Asimismo, se alcanzaría el máximo de ingresos a los 33 años de experiencia laboral; es decir, a una edad aproximada de 55 años, en promedio; de allí empezarían a bajar los ingresos por rendimientos decrecientes de la edad, básicamente.
Para afirmar todo esto se ha partido de varios supuestos, por ejemplo se asume que los retornos para la educación es independiente de la calidad educativa; en el modelo se incluyó una variable Proxy de la calidad educativa (pública o privada); pero al momento de testar el modelo, resultó que no es significativa; además que cada año, cada trabajador invierte la misma fracción de tiempo en adquirir mayores habilidades y destrezas. Además como no existen datos para medir el nivel de asimilación o aprehensión de conocimientos, esta variable no se está tomando en cuenta y el efecto de estos hechos indudablemente lo está recogiendo en su conjunto el intercepto en el modelo, de allí que sea alto.
La siguiente tabla recoge la corrida de la ecuación 01.
Tabla 01: Resultados de la corrida del modelo
Evaluación del modelo
Muchas veces el valor numérico de los parámetros obtenidos pueden o no ser consistentes con lo que la teoría económica, estadística o econométrica, esperan de ellos. En el presente trabajo haremos una evaluación de estas tres posibilidades.
Criterio Económico
De la tabla 01, observamos que los resultados de la estimación están cumplen con los criterios expuestos por la teoría económica, en este caso neoclásica, del capital humano. Los coeficientes tienen el signo esperado y están en los rangos de otras estimaciones, como por ejemplo las usadas por estudios de dispersión para Lima y Latinoamérica.
Criterio Estadístico
De la estimación anterior apreciamos que la variable exógena que mejor explica el comportamiento de los ingresos es la variable educación tanto al 95% y 99%, presenta un R2 de 0.10 y un F conjunto de 16.02 con una probabilidad sumamente baja de cometer el error tipo I, lo que demuestra una buena capacidad explicativa conjunta de las variables introducidas en el modelo.
Contraste de hipótesis individuales
a) Para el coeficiente de la educación
La hipótesis es:
Ho: β1=0
H1: β1 ≠0
Como el t calculado, es mayor que el de tabla, entonces rechazamos la hipótesis nula; es decir, el coeficiente de la educación es significativo a un nivel de confianza del 95%.
b) Para el coeficiente de la experiencia laboral
La hipótesis es:
Ho: β2=0
H1: β2 ≠0
Como el t calculado, es menor que el de tabla, entonces aceptamos la hipótesis nula; es decir, el coeficiente de la experiencia laboral no es significativo a un nivel de confianza del 95%.
c) Para el coeficiente de la experiencia laboral al cuadrado
La hipótesis es:
Ho: β3=0
H1: β3 ≠0
Como el t calculado, es menor que el de tabla, entonces aceptamos la hipótesis nula; es decir, el coeficiente de la experiencia laboral al cuadrado no es significativo a un nivel de confianza del 95%.
Contraste de hipótesis global
Acá se contrasta la significancia conjunta de los coeficientes del modelo; es decir, planteamos la siguiente hipótesis:
Ho: β1= β2 =β3 =0
H1: β1 ≠ β2 ≠β3 ≠ 0
El programa nos da el valor del estadístico (F-stastic) y su probabilidad de cometer el error tipo I (rechazar Ho, siendo significativa).
Esto quiere decir que los coeficientes de modelo, de manera conjunta si son significativos, al 95% de confianza, muy a pesar que de manera individual, alguna de ellos no lo sea.
Coeficiente de bondad de ajuste
El coeficiente de determinación (R2), es de 10%, estadísticamente es muy bajo; sin embargo, la evidencia empírica en modelos similares han demostrado valores muy similares. Quizá también se deba a los supuestos planteados en el modelo; es decir, que no se estén cumpliendo, así como también a que de repente estemos obviando algunas variables significativas, el cual estaría recogiendo el término de perturbación.
Criterio Econométrico
Contraste de normalidad
El análisis de los residuos tiene por finalidad analizar la validez de la hipótesis de normalidad de los residuos del presente modelo. Se dicen que los residuos se distribuyen como una normal cuando sus coeficientes de asimetría y kurtosis son 0 y 3 respectivamente o bien cercano a estos valores.
La hipótesis a plantearse sería:
Ho: &µ se aproxima a una distribución normal
H1: &µ no se aproxima a una distribución normal
La regla de decisión es que si el estadístico de Jaque-Bera (J-B), es menor a X2, con 2 grados de libertad (5.99), entonces se acepta Ho.
Como entonces aceptamos Ho, es decir, los residuos se aproximan a una distribución normal.
Gráfico 01: Histograma de frecuencias para los residuos
Del contraste de la hipótesis y de la gráfica anterior podemos observar que los residuos del modelo siguen una distribución bastante cercana a la normal[3]por lo se concluye que los residuos son esféricos. La implicancia de esta propiedad, nos indica que el modelo estimado tiene las propiedades deseadas de consistencia e insesgadez econométrica.
Contraste de Multicolinealidad
La multicolinealidad aparece cuando las variables explicativas del modelo econométrico están correlacionadas entre si. Generalmente la multicolinealidad es un problema de grado, no de existencia. Su efecto en el análisis es que las covarianzas, varianzas y desviación estándar de los coeficientes estimados serán relativamente mas altas, existiendo sobre valoración de los coeficientes.
A continuación vamos a testear el modelo para ver si presenta multicolinealidad y si es o no significativa.
Método de Farrar-Glauber-Haitovsky
El coeficiente de correlación múltiple, obtenemos extrayendo la raíz cuadrada al coeficiente de determinación del modelo (ver tabla 01).
Regresionando la variable educación, expresada en años de estudio (AEST) sobre una constante y el resto de variables explicativas:
Luego:
Por lo que se concluye que no existe un alto grado de multicolinealidad, es decir no es significativa.
Aplicando el test de Haitovsky:
Igualmente se concluye que no existe multicolinealidad de alto grado.
Regla de Klein
Existen 3 reglas para determinar la multicolinealidad de los modelos:
i) "Existirá una situación de multicolinealidad en alto grado, si y solo si el coeficiente de determinación que resulta de la regresión de una variable explicativa entre las demás es mayor que el coeficiente de determinación de la ecuación que se esta contrastando"
Entonces comparando el coeficiente de determinación de la ecuación original y el de la estimación de una explicativa entre las demás, se tiene:
Por lo que podemos concluir, según Klein, que existe multicolinealidad en alto grado.
ii) Existe alto grado de multicolinealidad si:
Donde es el coeficiente de correlación simple entre dos regresores cualquiera y es el coeficiente de correlación múltiple de la ecuación o raíz cuadrad de su coeficiente de determinación.
Calculando la matriz de correlaciones:
Correlation Matrix
Comparando cada uno de los coeficientes de correlación simple entre dos variables explicativas del modelo con el coeficiente de correlación múltiple del modelo original (comparación en valores absolutos), así:
RAEST-EXLAB =-0.502958 > 0.100990
RAEST-EXLAB2 =-0.492610 > 0.100990
REXLAB-EXLAB2 = 0.947215 > 0.100990
De los datos anteriores, se concluye que existe un alto grado de multicolinealidad, expresado entre las variables EXLAB Y EXLAB2, así como entre AEST y EXLAB, esto porque en ambos casos una se deriva de la otra.
iii) Existe alto grado de multicolinealidad, si almenos una correlación entre regresores supera a una correlación de uno de los regresores con la endógena.
RAEST-EXLAB =-0.502958 > 0.30732068
RAEST-EXLAB2 =-0.492610 > 0.02989482
REXLAB-EXLAB2 = 0.947215 > 0.10845275
Existe suficiente evidencia estadística para afirmar que hay un alto grado de multicolinealidad en el modelo.
Contraste de Heteroscedasticidad
Es muy frecuente en modelos econométricos que usa datos de corte transversal, en donde la varianza del termino de error ya no es constante (homoscedasticidad), en estos casos estamos en presencia de una perturbación no esférica, en este caso, heteroscedasticidad. Esto puede deberse a muchos factores, entre ellos a la agregación de datos de diferentes individuos o quizá porque existan variables omitidas en el modelo (esto lo vamos a ver más adelante)
Las consecuencias de este problema es que el estimador de mínimos cuadrados ordinarios es insesgado e ineficiente; por lo que las pruebas estadísticas y los intervalos de confianza serán incorrectos.
A continuación vamos a testear el modelo que venimos trabajando, para lo cual usaremos las pruebas más usadas para detectar este problema.
Test de Glesjer
Para detectar la heteroscedasticidad por este test, necesitamos en primer lugar estimar el modelo y obtener los residuos (esto lo hace el eviews por defecto al estimar el modelo).
Luego regresionamos el cuadrado de los errores, sobre una potencia la una variable exógena, es decir:
Donde los valores de h= (-1,1, ½,-½,). Se escogerá el valor de h que proporcione una "mejor regresión"; para esto se tiene en cuenta un coeficiente significativo y una SR pequeña (menor de todas las regresiones)
Vamos a verificar si la variable experiencia laboral (EXLAB) y años de estudio (AEST), ocasionan heteroscedasticidad:
Para lo cual planteamos la siguiente hipótesis:
Ho: 0, Existe homoscedasticidad
H1: 0, Existe heteroscedasticidad
Los resultados para la variable años de se muestran en la siguiente tabla:
Lo mismo se ha hecho para la variable años de estudio (AEST)
La regla de decisión es:
Si tc< t(0.05, 430)=1.96
Como ningún i es significativo, entonces se acepta la hipótesis de homoscedasticidad.
Test de White General
La tabla siguiente muestra el contraste de White, que es el test más general para detectar la heteroscedasticidad.
La lógica de esta prueba es que si las perturbaciones fueran homoscedásticas, las variables incluidas en la regresión de prueba no deberían tener ningún poder explicativo sobre los residuos al cuadrado; y por lo tanto el R2 debería ser lo más pequeño posible, por ejemplo para el caso el R2 de la regresión de prueba o auxiliar fue de 0.0051.
Tenemos la siguiente hipótesis:
Ho: i =0, Existe homoscedasticidad
H1: i ≠0, Existe heteroscedasticidad
La regla de decisión es:
Si, entonces se acepta Ho.
Ahora como TR2 =2.23< 16.92, entonces aceptamos la hipótesis de ausencia de heteroscedasticidad.
Test de White Simplificado
Esta prueba al igual q la anterior, no se requiere conocer la estructura o forma que adopta la heteroscedasticidad, y a diferencias de la anterior, solo se regresiona el modelo con los regresores del modelo original y sus cuadrados, ya no los productos cruzados.
La regla de decisión es la misma que del anterior.
Planteando nuestra hipótesis:
Ho: i =0, Existe homoscedasticidad
H1: i ≠0, Existe heteroscedasticidad
Haciendo la prueba en el Eviews:
Como TR2 =1.000993< 12.59, entonces aceptamos la hipótesis de ausencia de heteroscedasticidad.
Test de Harvey
Para realizar esta prueba, vamos a regresionar el siguiente modelo
Nos interesa el "F" estadístico, el cual sigue una distribución Chi-cuadrada con p-1 grados de libertad.
Test de Park
Este test, se basa en el supuesto de que las varianzas de las perturbaciones son una función exponencial de las variables explicativas, y en algunos casos, los elementos de determinación son los suficientemente elevados como para pensar en heteroscedasticidad significativa.
Vamos a estimar la siguiente ecuación:
Para ver si hay heteroscedasticidad, se somete el coeficiente a la prueba de significancia individual "t student". Si es significativa, es señal de que hay heteroscedasticidad importante, pero solamente en relación exponencial.
En el presente modelo, se verificará que las varianzas de las perturbaciones son una función exponencial de la experiencia laboral (EXLAB)
De los resultados de la tabla anterior, se deduce:
TBi=-0.546650 X2, Existe autocorrelación significativa de orden p.
Si, LM< X2, No existe autocorrelación significativa de orden p.
A continuación vamos a testear el modelo para determinar si existe o no autocorrelación de primer orden.
El resultado de la corrida se muestra en la tabla siguiente:
El valor de LM=9.928827
El valor de Chi-cuadrado con 1 grado de libertad al 95%, es 3.84
Como LM= 9.928 > =3.84; entonces, concluimos de que existe autocorrelación de primer orden.
Test de Box-Pierce
Si s, es el coeficiente de autocorrelación de y siendo s=1, 2,3., n. Entonces el estadístico Q de prueba de autocorrelación de Box-Pierce, queda:
, es preciso aclara que cuando se trabaja con muestras pequeñas es preferible es el estadístico corregido de Ljung y Box.
Calculando a partir de DW (1.687196)
0.156402
Por lo tanto, el Q=10.5674, este se compara con el Chi-cuadrado con 1 grado de libertad, el cual al 95% es de 3.84.
Como Q=10.5674>3.84= , entonces concluimos que existe autocorrelación de primer orden.
Error de Especificación
Test de variables omitidas
Este test tiene por finalidad contrastar la hipótesis acerca de la relevancia individual de una variable exógena dentro de la especificación de un modelo econométrico. La secuencia del test requiere estimar un primer modelo restringido, estimaremos el siguiente modelo:
Luego le pedimos al software que evalué la significancia estadística de la variable EXLAB, como variable exógena en el modelo, por lo que el modelo no restringido sería:
Se tiene la siguiente hipótesis:
Ho: 2 =0, EXLAB, no es una variable omitida
H1: 2 ≠0, EXLAB, si es una variable omitida
El contraste se basa en una distribución F-de Fisher con k-1 y n-k grados de libertad, y la regla de decisión es la siguiente:
Si Fc>Ft entonces, se acepta a la variable exógena como significativa en la ecuación.
Si Fc
Como FFc= 1.9 < F0.05(3,428)= 2.6; por lo tanto se acepta Ho, es decir la variable exógena no es una variable omitida relevante.
Test de variables redundantes
Esta prueba tiene por propósito evaluar la significancia de la omisión de alguna variable exógena que pudiera contribuir a la representación estructural del modelo. Para nuestro caso, se testea la significancia de la omisión de la variable EXLAB, en el modelo.
Para ello estimamos el modelo original y luego pedimos al software que omita la variable EXLAB del modelo.
Como Fc= 1.956 < F0.05(3,428)=2.6, se acepta la hipótesis nula (Ho); es decir la variable EXLAB, es una variable redundante.
Test de especificación RESET de Ramsey
Este test tiene la finalidad de analizar si un modelo econométrico ha sido diseñado correctamente, para ello Ramsey desarrollo una prueba que se basa en una distribución F con k-1 y n-k grados de libertad. El test implica probar la hipótesis de especificación adecuada mediante: FRESET>Fk-1,n-k, el modelo estaría especificado erróneamente.
Si contrastamos con un modelo cuadrático, las hipótesis serían:
Ho: i =0, La función lineal es mejor que la cuadrática.
H1: i ≠0, La función lineal no es mejor que la cuadrática.
Como Fc=3.89 > F0.05(3,428)= 2.6
Por lo tanto, se rechaza la hipótesis nula, es decir, la función lineal no es mejor que la cuadrática.
Estabilidad de los parámetros
La propiedad de estabilidad es muy importante en un modelo, puesto que ello permitirá que las predicciones que se haga con el modelo, sean las más consistentes y eficientes. Aunque el objetivo del trabajo no es predecir, sino más bien explicar cómo influyen las variables exógenas en los ingresos, sin embargo, se verá algunas pruebas tendientes a verificar la estabilidad:
Test residuos recursivos
Durvin, Brown y Evans sugirieron el uso de los residuos recursivos para probar la estabilidad de las relaciones de regresión. También se puede como prueba de autocorrelación y heteroscedasticidad.
El residuo correspondiente a la observación t, se define como la diferencia entre el valor observado de la variable endógena y el valor predicho de la misma, observando que bajo la hipótesis nula de estabilidad y el supuesto de normalidad, los residuos recursivos Wn poseen las mismas características que los residuos poblacionales Un y por ello se concluye que es un buen estimador de este.
El Eviews analiza en un gráfico la evolución de los residuos recursivos los mismos que están delimitados por dos bandas de confianza, una positiva y otra negativa. Si el residuo recursivo se escapa de las bandas de confianza entonces se tomará como evidencia la inestabilidad paramétrica.
Observando la Gráfica anterior se puede dar indicios de ausencia de estabilidad, ya que existen algunos residuos que varían entorno al valor cero, algunos con grandes cambios, este hecho se manifiesta alrededor de las observaciones 60, 105, 190, 255, 305 y 350, los cuales llegan a sobrepasar las bandas de confianza.
Test Cusum (Suma acumulada de residuos)
Este test basado en el empleo de residuos recursivos fue propuesto por Bronw, Evans y Durvin (1975), si bien no son tan potentes como el test de Chow, sin embargo, tienen la ventaja de no requerir la fecha en la que se sospecha de un quiebre.
Este test se lleva a cabo mediante el gráfico de Wn, mediante las rectas que unen los puntos:
Al 95% de confianza a=0.48, K=(número de variables predeterminadas incluyendo la constante) y N= número de observaciones.
Se rechaza la hipótesis de inestabilidad si Wn traspasa dichas bandas.
El criterio de evaluación consiste en verificar que los residuos recursivos no se salgan de la trayectoria temporal delimitada por las bandas de confianza lo cual nos dará evidencia suficiente de estabilidad intertemporal.
Tal como se observa en el gráfico los residuos recursivos Wn siguen un movimiento browniano alrededor de cero a un nivel de significancia del 5%, y como los residuos no salen de los límites establecidos, por lo tanto se concluye que existe una significativa estabilidad.
Test Cusumsq (Suma acumulada de residuos al cuadrado)
Este estadístico es un intento de evitar la limitación de aceptar la hipótesis de estabilidad por razones causales, situación que se puede presentar en el test anterior, los autores (Brown, Durvin y Evans) propone un contraste que consiste en dibujar la serie temporal de Wn así como de las líneas que limitan la banda de confianza: donde el valor critico de Co se obtiene de la tabla estadística CUSUM. Nuevamente si Wn se sale de la banda de confianza, se rechaza la hipótesis de estabilidad y de homogeneidad del modelo.
Se puede observar en el gráfico que la suma de residuos recursivos normalizados no se sale de las bandas de confianza, por lo que existe suficiente evidencia estadística para afirmar que existe estabilidad de los parámetros.
Test de coeficientes recursivos
Esta prueba gráfica permite trazar la evolución de cualquier coeficiente, es un test de estabilidad individual de parámetros a largo plazo.
Dicho test evalúa la estabilidad y exogeneidad a largo plazo de cada coeficiente estimado en su trayectoria temporal de estimación. Para dicho fin se diseñan bandas de confianza para la senda de cada parámetro con 2 desviaciones estándar, una positiva y otra negativa. Si el coeficiente recursivo estimado traspasa dichas bandas a lo largo de su trayectoria temporal, se tomará como evidencia la inestabilidad temporal de largo plazo y escasa significancia de exogeneidad individual.
Los gráficos anteriores presentan el comportamiento de cada uno de los estimadores al ir añadiendo observaciones a la muestra con la que se realiza la estimación.
La magnitud de las variaciones es mínima para cada uno de los estimadores; además, el coeficiente recursivo no traspasa las bandas a lo largo de su trayectoria; por lo que existe evidencia como para afirmar que existe estabilidad temporal de largo plazo y una alta significancia de exogeneidad individual en el modelo.
A pesar de que la primera prueba de estabilidad, medida a través de los residuos recursivos, daba muestras de posible inestabilidad, las demás pruebas aca vistas confirman la estabilidad de los parámetros.
Evaluación de la capacidad predicativa
El presente modelo, que trabaja con series de corte transversal, su finalidad no es predecir, sino explicar; además, no cumple con los requisitos necesarios para una predicción, ya que presenta problemas de autocorrelación, la cual no ha sido descargada. Es por ello que en el presente trabajo vamos a omitir este paso. No obstante, decir, que la finalidad de un modelo econométrico (especialmente de corte longitudinal), siempre es la predicción.
1. Las características de los trabajadores expresadas básicamente en años de estudio y experiencia laboral, sigue siendo variables importantes al momento de explicar la dispersión salarial o de ingresos; así ganan más los que tienen mayores logros educativos y los que tienen mayor experiencia laboral; no obstante, los mayores ingresos (ingreso máximo) que un trabajador urbano de la región Cajamarca recibiría en su vida laboral, lo obtiene luego de cumplir 33 años de experiencia laboral; es decir, cerca de los 55 años de vida, esto independientemente del sexo. Esto evidencia una sociedad gerontocrática y quizá explique porque la baja participación de los jóvenes en las mesas temáticas y en los espacios de toma de decisiones (independientemente de la cuota para elecciones locales y regionales).
2. La tasa de retorno a la educación es de 10%; es decir, por cada año adicional que una persona estudia, esta repercutirá en los ingresos a esa misma tasa; empero, la tasa de retorno a la experiencia laboral es de menos del 1%. Esto porque la muestra con que se trabajo no discrimina entre trabajadores individuales, pequeñas, medianas o grandes empresas, es decir, no se está considerando la segmentación del mercado de Cajamarca, donde la mayor parte de la PEA, se ubica en un sector tradicional, donde la rotación laboral es muy alta y la población laboral tiene poca o nula instrucción. De allí la importancia de invertir en educación, pero en una educación para la vida y en "homogenizar" las condiciones de accesibilidad al mercado laboral.
3. Que el coeficiente de determinación sea bajo, puede deberse a la omisión de ciertas variables incorporadas en los supuestos del modelo, las cuales naturalmente no están presentes, como por ejemplo las habilidades y destreza de cada persona, la calidad educativa, la segmentación del mercado, entre otras, que en última instancia repercute en el aprendizaje y posteriormente en los ingresos de la fuerza laboral.
4. El 75% de gente trabajadora de la zona urbana del departamento de Cajamarca, perciben ingresos inferiores a 500 soles, el 19% entre 500 y 800, el 4% entre 800 y 1500, y solo el 1,5% percibe ingresos superiores a los 1,500 soles. Esto naturalmente guarda una estrecha relación con los niveles de instrucción de la población (sólo el 4.5% de la población en edad de trabajar, tienen educación universitaria).
5. Si bien la finalidad del presente modelo no es predecir, sino explicar, no obstante, interesa la significancia de los estadísticos (tanto individual como global) así como las perturbaciones no esféricas (autocorrelación y heteroscedasticidad) y la estabilidad de los parámetros. En cuanto a los dos primeros, se puede afirmar que no hay perturbaciones significativas; en el caso de la estabilidad de los parámetros, la mayoría de pruebas dedicadas a este fin, dan evidencia de una estabilidad temporal de largo plazo y una alta significancia individual en el modelo. Es decir, existe evidencia econométrica suficiente como para afirmar que el modelo es robusto.
1. CARRASCAL, Ursicino y otros.
2001 "Análisis econométrico con Eviews". Editorial Ra-Ma, Madrid.
2. CASTRO J. Francisco y RIVAS LLOSA, Roddy
2003 "Econometría Aplicada", Universidad del Pacífico, Lima.
3. CORTEZ CUMPA, Jorge
2001 "Técnicas estadísticas de predicción aplicables en el campo empresarial". Universidad del Pacífico, Lima.
4. RONCAL VASQUEZ, Nery A y LEÓN RUIZ, Aldo,
2003 "Dispersión Salarial en la Zona Urbana del Departamento de Cajamarca: capital humano o segmentación Laboral", Cajamarca.
5. ROSALES GARCÍA, Luís,
2007 "Métodos Cuantitativos"-Documento de trabajo, UNP, Piura.
6. TRUJILLO CALAGUA, Gustavo
2003 Econometría Aplicada con Eviews 4.1, Cajamarca.
7. www.inei.gob.pe/manuales.
Autor:
Nery Alejandro Roncal V?squez
[1] El Marco te?rico ha sido tomado en su totalidad de la investigaci?n: "Estudio sobre la dispersi?n salarial en la zona urbana del departamento de Cajamarca: Capital Humano o Segmentaci?n Laboral" realizada por Roncal V?squez, Nery A. y Le?n Ruiz, Aldo.
[2] El m?todo reductivo, en su variante no inductivo, quiere decir que el antecedente no es una generalizaci?n del consecuente, como ocurre en las ciencias econ?micas.
[3] Bajo la hip?tesis de normalidad, el estad?stico de Jarque-Bera se distribuye con una Chi cuadrado con 2 grados de libertad; por lo que si J-B> Chi-cuadrado con 2 g.d.l, rechazar la hip?tesis nula de normalidad; si J-B < Chi-cuadrado con 2 g.d.l, no rechazar la hip?tesis nula de normalidad. >
Página anterior | Volver al principio del trabajo | Página siguiente |