Descargar

La recta de los mínimos cuadrados


  1. Ejemplo ilustrativo
  2. Referencias bibliográficas

Se llama línea de mejor ajuste y se define como la línea que hace mínima la suma de los cuadrados de las desviaciones respecto a ella de todos los puntos que corresponden a la información recogida.

La recta de los mínimos cuadrados que aproxima el conjunto de puntos , , ,……… tomando en cuenta a Y como variable dependiente tiene por ecuación

Y=a0+a1X

A esta ecuación suele llamarse recta de regresión de Y sobre X, y se usa para estimar los valores de Y para valores dados de X.

Si a la recta de regresión Y=a0+a1X se le suma en ambos lados Y=a0+a1X se obtiene Y=a0N+a1X

Si a la recta de regresión Y=a0+a1X se multiplica por X a ambos lados y luego se suma XY=Xa0+a1X se obtiene XY=a0X+a1X2

Las constantes y quedan fijadas al resolver simultáneamente las ecuaciones anteriormente encontradas, es decir, al resolver el siguiente sistema de ecuaciones:

Que se llaman las ecuaciones normales para la recta de mínimos cuadrados.

Las constantes y de las anteriores ecuaciones también se pueden calcular empleando las siguientes fórmulas:

a0=Y·X2-X·XYNX2-X2 a1=NXY-X·YNX2-X2

Otra ecuación para los mínimos cuadrados para y de la recta de regresión de Y sobre X es:

y=xyx2x

La recta de los mínimos cuadrados que aproxima el conjunto de puntos , , ,……… tomando en cuenta a X como variable dependiente tiene por ecuación

X=b0+b1Y

A esta ecuación suele llamarse recta de regresión de X sobre Y, y se usa para estimar los valores de X para valores dados de Y. Las constantes b0 y b1 quedan fijadas al resolver el siguiente sistema de ecuaciones:

Las constantes b0 y b1 del sistema de ecuaciones anterior se pueden calcular empleando las siguientes fórmulas:

b0=X·Y2-Y·XY NY2-Y2 b1=NXY-X·YNY2-Y2

Otra ecuación para los mínimos cuadrados para y es:

x=xyy2y

El punto de intersección entre las rectas con se simboliza y se llama centroide o centro de gravedad.

Con los datos de la siguiente tabla sobre la altura en centímetros (X) y los pesos en kilogramos (Y) de una muestra de 8 estudiantes varones tomada al azar del segundo semestre de una universidad.

X

152

157

162

167

173

178

182

188

Y

56

61

67

72

70

72

83

92

1) Ajustar la recta de mínimos cuadrados para Y como variable dependiente resolviendo el sistema:

2) Ajustar la recta de mínimos cuadrados para Y como variable dependiente empleando las fórmulas:

a0=Y·X2-X·XYNX2-X2 a1=NXY-X·YNX2-X2

3) Ajustar la recta de mínimos cuadrados para Y como variable dependiente empleando la fórmula:

y=xyx2x

4) Ajustar la recta de mínimos cuadrados para X como variable dependiente resolviendo el sistema:

5) Calcular el punto centroide.

6) Calcular el coeficiente de determinación.

7) Elaborar el diagrama de dispersión. Y en el mismo diagrama graficar las dos rectas de mínimos cuadrados obtenidas en los pasos anteriores.

8) Estimar el valor de Y cuando X = 200 en el diagrama de dispersión de Y como variable dependiente.

R: 8,2

9) Estimar el valor de X cuando Y= 100 en el diagrama de dispersión X como variable dependiente.

Solución:

Para comenzar a resolver el ejercicio se llena la siguiente tabla:

1) Reemplazando valores en el sistema se tiene:

573=a0·8+a1·135998295=a0·1359+a1·231967?8a0+1359a1=5731359a0+231967a1=98295

Resolviendo el sistema por determinantes (regla de Cramer) se obtiene:

Interpretación:

– El valor a1=0,864 indica que la recta tiene una pendiente positiva aumentando a razón de 0,864

– El valor de a0=-75,191 indica el punto en donde la recta interseca al eje Y cuanto X = 0

En Excel el sistema se resuelve de la siguiente manera:

a) Insertar la función MDETERM. Seleccionar las celdas del ?a0.

b) Repetir los pasos anteriores para calcular el ? y el ?a1, para luego calcular a0 y a1 como indica la siguiente figura:

Reemplazando valores en la ecuación respectiva se obtiene:

Y=a0+a1X?Y=-75,191+0,864X

2) Con los datos de la tabla anterior se substituye valores en las siguientes ecuaciones:

a0=Y·X2-X·XYNX2-X2=573·231967-1359·982958·231967-(1359)2=-6658148855-75,191

a1=NXY-X·YNX2-X2=8·98295-1359·5738·231967-(1359)2=76538855=0,864

Reemplazando valores en la ecuación respectiva se obtiene:

Y=a0+a1X?Y=-75,191+0,864X

3) Se calcula las medias aritméticas de X y Y para llenar la siguiente tabla:

x=xin

X=13598=169,875

Y=5738=71,625

Reemplazando valores en la fórmula respectiva se obtiene:

y=xyx2x?y=956,6251106,875x?Y-Y=956,6251106,875X-X

Y-71,625=956,6251106,875X-169,875?1106,875Y-71,625=956,625X-169,875

1106,875Y-79280,20838=956,625X-162510,4984

1106,875Y=956,625X-162510,4984+79280,20838

1106,875Y=956,625X-83230,29

Y=956,625X-83230,291106,875?Y=956,625X1106,875-83230,291106,875?Y=0,864X-75,19

Y=-75,19+0,864X

4) Reemplazando valores en sistema respectivo se obtiene:

1359=b0·8+b1·57398295=b0·573+b1·41967?8b0+573b1=1359573b0+41967b1=98295

Resolviendo el sistema se obtiene:

b0=95,871

b1=1,033

Reemplazando valores en la ecuación de la recta de mínimos cuadrados se obtiene:

X=b0+b1Y

X=95,871+1,033Y

Interpretación:

– El valor b1=1,033 indica que la recta tiene una pendiente positiva aumentando a razón de 1,033

– El valor de b0=95,871 indica el punto en donde la recta interseca al eje X cuanto Y = 0

5) Para calcular el centroide se resuelve el sistema formado por las dos rectas de los mínimos cuadrados en donde X es X y Y es Y.

Y=-75,191+0,864XX=95,871+1,033Y

Al resolver el sistema se obtiene el centroide: X = 169,3 y Y = 71,092

6) Se aplica la ecuación para calcular el coeficiente de Pearson.

r=NXY-XYNX2-X2NY2-Y2=8·98295-1359·5738·231967-135928·41967-5732

r=0,94497

Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinación.

Coeficiente de determinación = r2=0,944972=0,893

8) Reemplazando X = 200 en la ecuación solicitada se obtiene:

Y=-75,191+0,864X=-75,191+0,864·200=-75,191+172,8=97,609

9) Reemplazando Y = 100 en la ecuación solicitada se obtiene:

X=95,871+1,033Y=X=95,871+1,033·100=X=95,871+103,3=199,171

Empleando el programa Graph se obtiene la siguiente figura:

SPIEGEL, Murray, (2000), Estadística, Serie de Compendios Schaum, Ed. McGraw-Hill, México.

SUÁREZ, Mario, (2011), Interaprendizaje de Estadística Básica,

TAPIA , Fausto Ibarra, Ecuador.

SUÁREZ, Mario, (2004), Interaprendizaje Holístico de Matemática, Ed. Gráficas Planeta, Ibarra,

Ecuador.

 

 

Autor:

Mario Suarez