Se llama línea de mejor ajuste y se define como la línea que hace mínima la suma de los cuadrados de las desviaciones respecto a ella de todos los puntos que corresponden a la información recogida.
La recta de los mínimos cuadrados que aproxima el conjunto de puntos , , ,……… tomando en cuenta a Y como variable dependiente tiene por ecuación
Y=a0+a1X
A esta ecuación suele llamarse recta de regresión de Y sobre X, y se usa para estimar los valores de Y para valores dados de X.
Si a la recta de regresión Y=a0+a1X se le suma en ambos lados Y=a0+a1X se obtiene Y=a0N+a1X
Si a la recta de regresión Y=a0+a1X se multiplica por X a ambos lados y luego se suma XY=Xa0+a1X se obtiene XY=a0X+a1X2
Las constantes y quedan fijadas al resolver simultáneamente las ecuaciones anteriormente encontradas, es decir, al resolver el siguiente sistema de ecuaciones:
Que se llaman las ecuaciones normales para la recta de mínimos cuadrados.
Las constantes y de las anteriores ecuaciones también se pueden calcular empleando las siguientes fórmulas:
a0=Y·X2-X·XYNX2-X2 a1=NXY-X·YNX2-X2
Otra ecuación para los mínimos cuadrados para y de la recta de regresión de Y sobre X es:
y=xyx2x
La recta de los mínimos cuadrados que aproxima el conjunto de puntos , , ,……… tomando en cuenta a X como variable dependiente tiene por ecuación
X=b0+b1Y
A esta ecuación suele llamarse recta de regresión de X sobre Y, y se usa para estimar los valores de X para valores dados de Y. Las constantes b0 y b1 quedan fijadas al resolver el siguiente sistema de ecuaciones:
Las constantes b0 y b1 del sistema de ecuaciones anterior se pueden calcular empleando las siguientes fórmulas:
b0=X·Y2-Y·XY NY2-Y2 b1=NXY-X·YNY2-Y2
Otra ecuación para los mínimos cuadrados para y es:
x=xyy2y
El punto de intersección entre las rectas con se simboliza y se llama centroide o centro de gravedad.
Con los datos de la siguiente tabla sobre la altura en centímetros (X) y los pesos en kilogramos (Y) de una muestra de 8 estudiantes varones tomada al azar del segundo semestre de una universidad.
X | 152 | 157 | 162 | 167 | 173 | 178 | 182 | 188 |
Y | 56 | 61 | 67 | 72 | 70 | 72 | 83 | 92 |
1) Ajustar la recta de mínimos cuadrados para Y como variable dependiente resolviendo el sistema:
2) Ajustar la recta de mínimos cuadrados para Y como variable dependiente empleando las fórmulas:
a0=Y·X2-X·XYNX2-X2 a1=NXY-X·YNX2-X2
3) Ajustar la recta de mínimos cuadrados para Y como variable dependiente empleando la fórmula:
y=xyx2x
4) Ajustar la recta de mínimos cuadrados para X como variable dependiente resolviendo el sistema:
5) Calcular el punto centroide.
6) Calcular el coeficiente de determinación.
7) Elaborar el diagrama de dispersión. Y en el mismo diagrama graficar las dos rectas de mínimos cuadrados obtenidas en los pasos anteriores.
8) Estimar el valor de Y cuando X = 200 en el diagrama de dispersión de Y como variable dependiente.
R: 8,2
9) Estimar el valor de X cuando Y= 100 en el diagrama de dispersión X como variable dependiente.
Solución:
Para comenzar a resolver el ejercicio se llena la siguiente tabla:
1) Reemplazando valores en el sistema se tiene:
573=a0·8+a1·135998295=a0·1359+a1·231967?8a0+1359a1=5731359a0+231967a1=98295
Resolviendo el sistema por determinantes (regla de Cramer) se obtiene:
Interpretación:
– El valor a1=0,864 indica que la recta tiene una pendiente positiva aumentando a razón de 0,864
– El valor de a0=-75,191 indica el punto en donde la recta interseca al eje Y cuanto X = 0
En Excel el sistema se resuelve de la siguiente manera:
a) Insertar la función MDETERM. Seleccionar las celdas del ?a0.
b) Repetir los pasos anteriores para calcular el ? y el ?a1, para luego calcular a0 y a1 como indica la siguiente figura:
Reemplazando valores en la ecuación respectiva se obtiene:
Y=a0+a1X?Y=-75,191+0,864X
2) Con los datos de la tabla anterior se substituye valores en las siguientes ecuaciones:
a0=Y·X2-X·XYNX2-X2=573·231967-1359·982958·231967-(1359)2=-6658148855-75,191
a1=NXY-X·YNX2-X2=8·98295-1359·5738·231967-(1359)2=76538855=0,864
Reemplazando valores en la ecuación respectiva se obtiene:
Y=a0+a1X?Y=-75,191+0,864X
3) Se calcula las medias aritméticas de X y Y para llenar la siguiente tabla:
x=xin
X=13598=169,875
Y=5738=71,625
Reemplazando valores en la fórmula respectiva se obtiene:
y=xyx2x?y=956,6251106,875x?Y-Y=956,6251106,875X-X
Y-71,625=956,6251106,875X-169,875?1106,875Y-71,625=956,625X-169,875
1106,875Y-79280,20838=956,625X-162510,4984
1106,875Y=956,625X-162510,4984+79280,20838
1106,875Y=956,625X-83230,29
Y=956,625X-83230,291106,875?Y=956,625X1106,875-83230,291106,875?Y=0,864X-75,19
Y=-75,19+0,864X
4) Reemplazando valores en sistema respectivo se obtiene:
1359=b0·8+b1·57398295=b0·573+b1·41967?8b0+573b1=1359573b0+41967b1=98295
Resolviendo el sistema se obtiene:
b0=95,871
b1=1,033
Reemplazando valores en la ecuación de la recta de mínimos cuadrados se obtiene:
X=b0+b1Y
X=95,871+1,033Y
Interpretación:
– El valor b1=1,033 indica que la recta tiene una pendiente positiva aumentando a razón de 1,033
– El valor de b0=95,871 indica el punto en donde la recta interseca al eje X cuanto Y = 0
5) Para calcular el centroide se resuelve el sistema formado por las dos rectas de los mínimos cuadrados en donde X es X y Y es Y.
Y=-75,191+0,864XX=95,871+1,033Y
Al resolver el sistema se obtiene el centroide: X = 169,3 y Y = 71,092
6) Se aplica la ecuación para calcular el coeficiente de Pearson.
r=NXY-XYNX2-X2NY2-Y2=8·98295-1359·5738·231967-135928·41967-5732
r=0,94497
Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinación.
Coeficiente de determinación = r2=0,944972=0,893
8) Reemplazando X = 200 en la ecuación solicitada se obtiene:
Y=-75,191+0,864X=-75,191+0,864·200=-75,191+172,8=97,609
9) Reemplazando Y = 100 en la ecuación solicitada se obtiene:
X=95,871+1,033Y=X=95,871+1,033·100=X=95,871+103,3=199,171
Empleando el programa Graph se obtiene la siguiente figura:
SPIEGEL, Murray, (2000), Estadística, Serie de Compendios Schaum, Ed. McGraw-Hill, México.
SUÁREZ, Mario, (2011), Interaprendizaje de Estadística Básica,
TAPIA , Fausto Ibarra, Ecuador.
SUÁREZ, Mario, (2004), Interaprendizaje Holístico de Matemática, Ed. Gráficas Planeta, Ibarra,
Ecuador.
Autor:
Mario Suarez