Descargar

Estadística Aplicada a la Tasación (página 2)


Partes: 1, 2

 

1.- Forma Directa

De la ecuación de la recta:

Si y , se obtienen a partir de las ecuaciones normales:

Aplicando normales Y sobre X se tiene:

 

El Coeficiente de Regresión es

De la misma manera la recta de regresión de "X" sobre "Y" será dada de la siguiente manera:

Donde: y se obtienen a partir de las ecuaciones normales:

Aplicando normales X sobre Y se tiene:

2.- Forma Indirecta del Método de los Mínimos Cuadrados.

El fundamento de este método es de las desviaciones de X respecto a su media aritmética. X

Ecuación de y sobre x Ecuación de y sobre x

Donde:

x , y = desviaciones

X = media aritmética

Y = media aritmética

  1. Regresión Múltiple: Este tipo se presenta cuando dos o más variables independientes influyen sobre una variable dependiente. Ejemplo: Y = f (x, w, z …. k).

Por ejemplo: Podría ser una regresión de tipo múltiple:

Una Empresa de desarrollo de software establece relacionar sus Ventas en función del numero de pedidos de los tipos de software que desarrolla (Sistemas, Educativos y Automatizaciones Empresariales), para atender 10 proyectos en el presente año.

En la Tabla representa Y (Ventas miles de S/.) e X (Nº pedidos de sistemas), W (Nº de pedidos de Aplicaciones Educativas) y Z (Nº de pedidos de Automatizaciones empresariales).

Y

440

455

470

510

506

480

460

500

490

450

X

50

40

35

45

51

55

53

48

38

44

W

105

140

110

130

125

115

100

103

118

98

Z

75

68

70

64

67

72

70

73

69

74

Objetivo: Se presentara primero el análisis de regresión múltiple al desarrollar y explicar el uso de la ecuación de regresión múltiple, así como el error estándar múltiple de estimación. Después se medirá la fuerza de la relación entre las variables independientes, utilizando los coeficientes múltiples de determinación.

Análisis de Regresión Múltiple

Dispone de una ecuación con dos variables independientes adicionales:

Se puede ampliar para cualquier número "m" de variables independientes:

Para poder resolver y obtener y en una ecuación de regresión múltiple el cálculo se presenta muy tediosa porque se tiene atender 3 ecuaciones que se generan por el método de mínimo de cuadrados:

Para poder resolver se puede utilizar programas informáticos como ejemplo Microsoft Excel.

El error estándar de la regresión múltiple

Es una medida de dispersión la estimación se hace más precisa conforme el grado de dispersión alrededor del plano de regresión se hace mas pequeño.

Para medirla se utiliza la formula:

Y: Valores observados en la muestra

: Valores estimados a partir a partir de la ecuación de regresión

n: Número de datos

m: Número de variables independientes

El coeficiente de determinación múltiple

Mide la tasa porcentual de los cambios de Y que pueden ser explicados por , y simultáneamente.

III.- APLICACIÓN DE REGRESIÓN MÚLTIPLE

Mediante el siguiente problema se puede ilustrar la aplicación de Regresión Múltiple: En la Facultad de Ingeniería de Sistemas y Computo de una Universidad se quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura de PHP, para lo cual se escoge al azar una muestra de 15 alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base de Datos y Programación como se muestran en el siguiente cuadro.

Alumno

PHP

Algoritmos

Base de Datos

Programación

1

13

15

15

13

2

13

14

13

12

3

13

16

13

14

4

15

20

14

16

5

16

18

18

17

6

15

16

17

15

7

12

13

15

11

8

13

16

14

15

9

13

15

14

13

10

13

14

13

10

11

11

12

12

10

12

14

16

11

14

13

15

17

16

15

14

15

19

14

16

15

15

13

15

10

Lo que se busca es construir un modelo para determinar la dependencia que exista de aprendizaje reflejada en las notas de la asignatura de PHP, conociendo las notas de las asignaturas Algoritmos, Base de Datos y Programación.

Se presentara la siguiente ecuación a resolver:

Utilizando las formulas de las ecuaciones normales a los datos se obtendrán los coeficientes de regresión o utilizando Regresión de Análisis de datos, en la Hoja de Calculo de Excel se puede calcular también los coeficientes de regresión:

Por lo tanto se puede construir la ecuación de regresión que buscamos:

El Error Estándar de Regresión Múltiple

Mediante esta medida de dispersión se hace más preciso el grado de dispersión alrededor del plano de regresión, se hace más pequeño.

Para calcularla se utiliza la formula siguiente:

En los resultados de Excel se llama error típico y para explicar la relación del aprendizaje de PHP que se viene desarrollando es de 0,861

El coeficiente de determinación múltiple (r2)

Utilizaremos para determinar la tasa porcentual de Y para ser explicados las variables múltiples, utilizando la siguiente formula:

El 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas por las asignaturas de Algoritmos, Base de Datos y Programación.

IV.- APLICACIONES A LA TASACIÓN DE INMUEBLES

De igual forma para esta aplicación se utiliza la función estadística llamada "ESTIMACION LINEAL", de "Microsoft EXCEL", hoja de cálculo, para Windows, la cual efectúa los cálculos de regresión lineal simple y múltiple.

La función "ESTIMACIÓN LINEAL" arroja como resultado una matriz que describe una ecuación del tipo:

Y = m1 X1 + m2 X2 + m3 X3 + ……. + mn Xn + b

Donde el valor Y dependiente es una función de los valores Xi independientes. Los valores mi son coeficientes que corresponden a cada valor de Xi y b es un valor constante.

Estimación lineal también puede devolver estadísticas de regresión, de esta forma arroja lo siguiente:

La metodología asume que existe una relación lineal entre cada una de las variables independientes con la variable dependiente que se considere.

Para interpretar de una mejor forma la información que se presentará, antes se definirán algunos elementos que contienen los cuadros a presentar.

R2: Coeficiente de determinación o error cuadrático.

F: Estadístico utilizado para verificar la correlación entre la variable dependiente y las variables independientes, como un todo.

m i : Coeficiente de cada variable independiente en la ecuación de regresión.

b : Constante de la ecuación de regresión.

t i : Estadístico utilizado para comprobar la importancia de cada una de las variables independientes en la explicación del fenómeno en estudio o de la variable dependiente.

Ejemplo de Regresión lineal múltiple para tasar un edificio

Suponga que un programador comercial está pensando en adquirir un grupo de pequeños edificios de oficinas en un distrito comercial conocido.

El programador puede utilizar el análisis de regresión lineal múltiple para estimar el valor de un edificio de oficinas en un área determinada basándose en las variables siguientes.

Variable

Indica

Y

Valor tasado del edificio de oficinas

x1

Superficie en metros cuadrados

x2

Número de oficinas

x3

Número de entradas

x4

Antigüedad del edificio en años

Este ejemplo supone que existe una relación de línea recta entre cada variable independiente (x1, x2, x3, y x4) y la variable dependiente (Y), el valor de los edificios de oficinas en esa área.

Se elige al azar una muestra de 11 edificios de oficinas de 1.500 edificios posibles y obtiene los datos siguientes. "Media entrada" significa una entrada sólo para entregas.

La fórmula a utilizar es:

=ESTIMACION.LINEAL(conocido_y, conocido_x,VERDADERO,VERDADERO)

Nota: La fórmula del ejemplo debe escribirse como fórmula matricial, con CTRL+MAYÚS+ENTRAR. Si la fórmula no se introduce en formato matricial, no dará el resultado deseado.

Cuando se introduce como una matriz, se devuelven las siguientes estadísticas de regresión. Utilice esta clave para identificar las estadísticas deseadas.

El ejemplo puede resultar más fácil si lo copia en una hoja de cálculo en blanco, de la forma siguiente:

A

B

C

D

E

1

Superficie (x1)

Oficinas (x2)

Entradas (x3)

Antigüedad (x4)

Valor tasado (y)

2

2.310

2

2

20

142.000

3

2.333

2

2

12

144.000

4

2.356

3

1,5

33

151.000

5

2.379

3

2

43

150.000

6

2.402

2

3

53

139.000

7

2.425

4

2

23

169.000

8

2.448

2

1,5

99

126.000

9

2.471

2

2

34

142.900

10

2.494

3

3

23

163.000

11

2.517

4

4

55

169.000

12

2.540

2

3

22

149.000

Función de Excel

=ESTIMACIÓN.LINEAL(E2:E12,A2:D12,VERDADERO,VERDADERO)

Cuando se introduce como una matriz, se devuelven las siguientes estadísticas de regresión. Utilice esta clave para identificar las estadísticas deseadas.

Ahora puede obtenerse la ecuación de regresión múltiple, y = m1*x1 + m2*x2 + m3*x3 + m4*x4 + b, utilizando los valores obtenidos:

Edad

Entradas

Oficinas

Superficies

A

B

C

D

E

15

-234,2372

2.553,2107

12.529,77

27,64

52.317,83

16

13,2680

530,6692

400,0668382

5,429374042

12237,3616

17

0,99675

970,5785

#N/A

#N/A

#N/A

18

459,7537

6

#N/A

#N/A

#N/A

19

1.732.393.319,2293

5.652.135,3162

#N/A

#N/A

#N/A

(x4)

(x3)

(x2)

(x1)

b

 

y = 27,64*x1 + 12.530*x2 + 2.553*x3 – 234,24*x4 + 52.318

Ahora el programador puede calcular el valor tasado de un edificio de oficinas en la misma zona con 2.500 metros cuadrados, tres oficinas, dos entradas y una antigüedad de 25 años, utilizando la ecuación siguiente:

y = 27,64*2.500 + 12.530*3 + 2.553*2 – 234,24*25 + 52.318 = 158.261 $

Para el análisis de los resultados presentados en la tabla anterior se utiliza la distribución F para determinar si todas las variables son significativas y la distribución t, para determinar la importancia de cada una de las variables independientes en el análisis de regresión.

Utilización del Estadístico t

Para medir el grado de significación de las variables independientes en cada una de las variables dependientes se utilizó el estadístico t, para los siguientes parámetros:

  • Grados de Libertad
  • G.L. = n – (k+ 1) = 6
  • Donde k = Número de variables independientes en el análisis de regresión (4)
  • y n = Número de datos considerados (11)
  • Intervalo de confianza del 95 %, dado por ( 1 – a ), donde a = 0,05

Es una prueba hipotética determinará si cada coeficiente es útil para estimar el valor tasado de un edificio de oficinas del ejemplo. Por ejemplo, para probar si el coeficiente de antigüedad tiene significado estadístico, divida -234,24 (coeficiente de la pendiente de antigüedad) entre 13,268 (el error estándar estimado de los coeficientes de antigüedad en la celda A15). El siguiente es el valor t observado:

t4 = m4 ÷ se4 = -234,24 ÷ 13,268 = -17,7

Los valores de t para cada variable serán:

Variable

valor t observado

Superficie

5,1

Número de oficinas

31,3

Número de entradas

4,8

Edad

17,7

Se realiza un contraste de hipótesis:

H0 : mi = 0

H1 : mi  0

Si se consulta una tabla de un manual de estadística, observará que el valor t crítico, de dos colas, con 6 grados de libertad y alfa = 0,05 es 2,447. Este valor crítico puede encontrarse también utilizando la función DISTR.T.INV de Excel. DISTR.T.INV (0,05.6) = 2,447. Puesto que el valor absoluto de t1 = 17,7, es superior a 2,447; la antigüedad es una variable importante para estimar el valor tasado de un edificio de oficinas. El significado estadístico de cada una de las demás variables independientes puede probarse de forma similar, con los valores de t obtenidos para cada una de las variables independientes.

Si el valor absoluto de t es suficientemente alto, puede deducirse que el coeficiente de la pendiente es útil para calcular el valor tasado del edificio de oficinas del ejemplo.

En este caso con un nivel de significación de = 0,05, todos los valores tienen un valor absoluto superior a 2,447; por tanto, todas las variables utilizadas en la ecuación de regresión son útiles (individualmente significativas en la explicación de la variable dependiente) para predecir el valor tasado de los edificios de oficinas de esta área.

Utilización del Estadístico R2 y F

En el ejemplo, el coeficiente de determinación, o r2, es 0,99675 (consultar la celda A17 en el resultado de ESTIMACION.LINEAL), que indicaría una relación marcada entre las variables independientes y el precio de venta.

Puede utilizarse el estadístico F para determinar si estos resultados, con un valor r2 tan alto, se produjeron por azar. Suponga por un momento que en realidad no existe relación entre las variables, pero que ha extraído una muestra peculiar de 11 edificios de oficinas que hace que el análisis estadístico demuestre una relación marcada.

F (estadístico) y df (Grados de Libertad) en la salida ESTIMACION.LINEAL se pueden utilizar para determinar la probabilidad de que se produzca por azar un valor F más elevado. F se puede comparar con los valores críticos de las tablas de distribución F.

En el contraste de hipótesis, para verificar si el grupo de variables independientes explican el fenómeno en forma conjunta se utilizó el estadístico F, con los siguientes parámetros:

  • Grados de Libertad

1 = k = 4 (G.L. para el numerador)

2 = n – (k+ 1) = 6 (G.L. para el denominador)

Donde k = Número de variables independientes en el análisis de regresión (4) y n = Número de observaciones considerados (11)

  • Intervalo de confianza del 95 %, dado por ( 1 –  )

 = 0,05

En el ejemplo, GL = 6 (celda B18) y F = 459,7537 (celda A18).

El valor crítico de F es 4,53 (en la tabla), puesto que F = 459,7537 es mucho más elevado que 4,53, es extremadamente improbable que un valor F tan elevado se produzca por azar. (Con Alfa = 0,05, la hipótesis de que no hay relación entre las variables independientes y la variable dependiente hay que rechazarla cuando F sobrepasa el nivel crítico, 4,53). Con DISTR.F (F,1,2) de Excel se puede obtener la probabilidad de que se produzca al azar un valor F superior, o se la probabilidad de que un valor F tan elevado se produzca por azar. DISTR.F(459,753674. 4. 6) = 1,37E-7, una probabilidad extremadamente pequeña. Recuerde que es vital utilizar los valores correctos de 1 y 2 calculados anteriormente. Con lo cual se concluye que las variables independientes en conjunto son significativas para explicar el comportamiento de la variable dependiente.

Otro Ejemplo de Regresión lineal múltiple para tasar un terreno (tomado de Stumps Marco Aurelio. Metodología para la Tasación de Inmuebles. 1 a Ed. en español, Miguel Camacaro Ediciones, Caracas, Venezuela.2006)

Suponga que un se desea tasar un inmueble de 360 m2 en un sector calificado como seis (6), a siete (7) Km. de distancia al centro comercial de la ciudad. Los datos obtenidos de un conjunto de terrenos vendidos en la región son los siguientes:

Utilizando la Función de Excel, y suponiendo que existe una relación de línea recta entre cada variable independiente (x1, x2 y x3) y la variable dependiente (Y), el valor de los edificios de oficinas en esa área.

=ESTIMACION.LINEAL(conocido_y, conocido_x,VERDADERO,VERDADERO)

Cuando se introduce como una matriz, se devuelven las siguientes estadísticas de regresión. Utilice esta clave para identificar las estadísticas deseadas.

Para obtener la ecuación de regresión siguiente:

Y = 52.331,3996 + 49,9363 x Área – 7.341,0634 x Distancia + 2.277,1421 x Local

Para el análisis de los resultados también se utilizará la distribución F para determinar si todas las variables son significativas y la distribución t, para determinar la importancia de cada una de las variables independientes en el análisis de regresión.

Utilización del Estadístico t

Para medir el grado de significación de las variables independientes en cada una de las variables dependientes se utilizó el estadístico t, para los siguientes parámetros:

  • Grados de Libertad
  • G.L. = n – (k+ 1) = 8
  • Donde k = Número de variables independientes en el análisis de regresión (3) y n = Número de datos considerados (12)
  • Intervalo de confianza del 95 %, dado por ( 1 – a ), donde a = 0,05

Los valores de t para cada variable serán:

Variable

valor t observado

Área

14,45

Distancia

11,33

Local

7,62

Se realiza una contraste de hipótesis, tal como se realizó con el ejemplo anterior, y se consulta una tabla de un manual de estadística, observará que el valor t crítico, de dos colas, con 8 grados de libertad y alfa = 0,05 es 2,306. Este valor crítico puede encontrarse también utilizando la función DISTR.T.INV de Excel. DISTR.T.INV (0,05.8) = 2,306. Puesto que el valor absoluto de t1 = 14,45, es superior a 2,306; el área es una variable importante para estimar el valor tasado del terreno. El significado estadístico de cada una de las demás variables independientes puede probarse de forma similar, con los valores de ti obtenidos para cada una de las variables independientes.

Si el valor absoluto de t es suficientemente alto, puede deducirse que el coeficiente de la pendiente es útil para calcular el valor tasado del terreno en el ejemplo.

En este caso con un nivel de significación de = 0,05, todos los valores tienen un valor absoluto superior a 2,306; por tanto, todas las variables utilizadas en la ecuación de regresión son útiles (individualmente significativas en la explicación de la variable dependiente) para predecir el valor tasado del terreno.

Utilización del Estadístico R2 y F

En el ejemplo, el coeficiente de determinación, o r2, es 0,9894 (consultar las estadísticas de regresión en el resultado de ESTIMACION.LINEAL), que indicaría una relación marcada entre las variables independientes y el precio de venta.

Puede utilizarse el estadístico F para determinar si estos resultados, con un valor r2 tan alto, se produjeron por azar. Suponga por un momento que en realidad no existe relación entre las variables, pero que ha extraído una muestra peculiar de 12 terrenos vendidos que hace que el análisis estadístico demuestre una relación marcada.

F (estadístico) y df (Grados de Libertad) en la salida ESTIMACION.LINEAL se pueden utilizar para determinar la probabilidad de que se produzca por azar un valor F más elevado. F se puede comparar con los valores críticos de las tablas de distribución F.

En el contraste de hipótesis, para verificar si el grupo de variables independientes explican el fenómeno en forma conjunta se utilizó el estadístico F, con los siguientes parámetros:

  • Grados de Libertad

1 = k = 3 (G.L. para el numerador)

2 = n – (k+ 1) = 8 (G.L. para el denominador)

Donde k = Número de variables independientes en el análisis de regresión (3) y n = Número de observaciones considerados (12)

  • Intervalo de confianza del 95 %, dado por ( 1 –  )

 = 0,05

F = 250,1882 (consultar las estadísticas de regresión en el resultado de ESTIMACION.LINEAL)

Realizando el contraste de hipótesis, tal como se efectuó en el ejemplo anterior, y se consulta una tabla de un manual de estadística, observará que el valor crítico de F es 4,07 (en la tabla), puesto que F = 250,1882 es mucho más elevado que 4,07, es extremadamente improbable que un valor F tan elevado se produzca por azar. (Con Alfa = 0,05, la hipótesis de que no hay relación entre las variables independientes y la variable dependiente hay que rechazarla cuando F sobrepasa el nivel crítico, 4,07). Con DISTR.F(F,1,2) de Excel se puede obtener la probabilidad de que se produzca al azar un valor F superior, o se la probabilidad de que un valor F tan elevado se produzca por azar. DISTR.F(250,1882. 3. 8) = 3,03145E-8, una probabilidad extremadamente pequeña. Recuerde que es vital utilizar los valores correctos de 1 y 2 calculados anteriormente. Con lo cual se concluye que las variables independientes en conjunto son significativas para explicar el comportamiento de la variable dependiente.

Con lo cual el terreno se puede tasar de la siguiente forma:

Y = 52.331,3996 + 49,9363 x Área – 7.341,0634 x Distancia + 2.277,1421 x Local

Y = 52.331,3996 + 49,9363 x 330 – 7.341,0634 x 7 + 2.277,1421 x 6

BIBLIOGRAFÍA

  • Damodar Gujarati. Econometría Básica. Ed. en español, Mc GRAW- HILL LATINOAMERICANA, Bogotá, Colombia.1998.
  • Stumps Marco Aurelio. Metodología para la Tasación de Inmuebles. 1 a Ed. en español, Miguel Camacaro Ediciones, Caracas, Venezuela.2006.
  • Shao Stephen, Estadística para Economistas y Administradores de Empresas. Ed. Herrero Hermanos. México.1970.
  • Microsof Excel. Ayuda de la Función ESTIMACION.LINEAL de Regresión Lineal Múltiple.
  • http://www.monografias.com/trabajos30/regresion-multiple/regresion-multiple.shtml
  • Torino H . Resumen del libro de Estadísticas de Berenson y Levine

Dirección: http:// www.mografias.com/trabajos13 /beren/beren.shtml)

dirección: http://www.mografias.com/trabajos7/beren/beren.shtml)

  • El Rincón Del Vago, SL C Toro 76,2º Salamanca (España)

Dirección: http://htlm.rincondelvago.com/estadistica/html)

  • arte
  • Galdos Cálculo y Estadística III Edición Única. Grupo La Republica. Lima Perú;2005.
  • Cannavos G. Probabilidad y Estadística Aplicación y métodos. Ed. en español Mc GRAW- HILL/INTERAMERICANA DE MEXICO.1995.

Valores de F para las probabilidades seleccionadas

Valores de F para las probabilidades seleccionadas

Valores de F para las probabilidades seleccionadas

 

Ing. Cruz Lezama Osaín

Ingeniero Industrial – Especialista en Finanzas –Magíster en Gerencia, Mención Finanzas

Especialista en Operaciones y Producción – Diplomado en Formación y Desarrollo Docente

ASESORÍA TÉCNICA Y GERENCIAL ENTRENAMIENTO Y FORMACIÓN

 

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente