{ ?x { ¯ ¯ LA RECTA DE LOS MÍNIMOS CUADRADOS Autor: Mario Suárez Se llama línea de mejor ajuste y se define como la línea que hace mínima la suma de los cuadrados de las desviaciones respecto a ella de todos los puntos que corresponden a la información recogida. La recta de los mínimos cuadrados que aproxima el conjunto de puntos (??1 , ??1 ), (??2 , ??2 ), (??3 , ??3 ), … … (???? , ???? ) tomando en cuenta a Y como variable dependiente tiene por ecuación ?? = ??0 + ??1 ?? A esta ecuación suele llamarse recta de regresión de ?? sobre ??, y se usa para estimar los valores de ?? para valores dados de ?? Si a la recta de regresión ?? = ??0 + ??1 ?? se le suma en ambos lados ? ?? = ?(??0 + ??1 ??) se obtiene ? ?? = ??0 ?? + ??1 ? ?? Si a la recta de regresión ?? = ??0 + ??1 ?? se multiplica por ?? a ambos lados y luego se suma ? ?? ?? = ? ??(??0 + ??1 ??) se obtiene ? ?? ?? = ??0 ? ?? + ??1 ? ??2 Las constantes ??0 ?? ??1 quedan fijadas al resolver simultáneamente las ecuaciones anteriormente encontradas, es decir, al resolver el siguiente sistema de ecuaciones: S?? = ??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S??2 Que se llaman las ecuaciones normales para la recta de mínimos cuadrados. Las constantes a0 y a1 de las anteriores ecuaciones también se pueden calcular empleando las siguientes fórmulas: ??0 = ? ?? · ? ??2 – ? ?? · ? ???? ?? ? ??2 – (? ??)2 ??1 = ?? ? ???? – ? ?? · ? ?? ?? ? ??2 – (? ??)2 Otra ecuación para los mínimos cuadrados para ?? = ?? – ?? , ?? = ?? – ?? de la recta de regresión de Y sobre X es: ? ???? ?? = ( 2 ) ?? La recta de los mínimos cuadrados que aproxima el conjunto de puntos (??1 , ??1 ), (??2 , ??2 ), (??3 , ??3 ), … … (???? , ???? ) tomando en cuenta a X como variable dependiente tiene por ecuación: ?? = ??0 + ??1 ?? A esta ecuación suele llamarse recta de regresión de X sobre Y, y se usa para estimar los valores de X para valores dados de Y. Las constantes ??0 y ??1 quedan fijadas al resolver el siguiente sistema de ecuaciones: S?? = ??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S??2 Las constantes ??0 y ??1 del sistema de ecuaciones anterior se pueden calcular empleando las siguientes fórmulas:
¯ ¯ ¯ ¯ { ?x { ??0 = ? ?? · ? ??2 – ? ?? · ? ???? ?? ? ??2 – (? ??)2 ??1 = ?? ? ???? – ? ?? · ? ?? ?? ? ??2 – (? ??)2 Otra ecuación para los mínimos cuadrados para ?? = ?? – ?? , ?? = ?? – ?? es: ?? = ( ? ???? ? y2 ) ?? El punto de intersección entre las rectas ?? = ??0 + ??1 ?? con ?? = ??0 + ??1 ?? se simboliza (??, ??) y se llama centroide o centro de gravedad Ejemplo ilustrativo Con los datos de la siguiente tabla sobre la altura en centímetros (X) y los pesos en kilogramos (Y) de una muestra de 8 estudiantes varones tomada al azar del segundo semestre de una universidad. X 152 157 162 167 173 178 182 188 Y 56 61 67 72 70 72 83 92 1) Ajustar la recta de mínimos cuadrados para Y como variable dependiente resolviendo el sistema: S?? = ??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S??2 2) Ajustar la recta de mínimos cuadrados para Y como variable dependiente empleando las fórmulas: ??0 = ? ?? · ? ??2 – ? ?? · ? ???? ?? ? ??2 – (? ??)2 ??1 = ?? ? ???? – ? ?? · ? ?? ?? ? ??2 – (? ??)2 3) Ajustar la recta de mínimos cuadrados para Y como variable dependiente empleando la fórmula: ? ???? ?? = ( 2 ) ?? 4) Ajustar la recta de mínimos cuadrados para X como variable dependiente resolviendo el sistema: S?? = ??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S??2 5) Calcular el punto centroide. 6) Elaborar el diagrama de dispersión. Y en el mismo diagrama graficar las dos rectas de mínimos cuadrados obtenidas en los pasos anteriores. 7) Estimar el valor de Y cuando X = 200 en el diagrama de dispersión de Y como variable dependiente. 8,2
2 2 { = = = | | = = = 8) Estimar el valor de X cuando Y= 100 en el diagrama de dispersión X como variable dependiente. Solución: Se llena la siguiente tabla: ?? 152 157 162 167 173 178 182 188 ?? 56 61 67 72 70 72 83 92 ???? 8512 9577 10854 12024 12110 12816 15106 17296 ??2 23104 24649 26244 27889 29929 31684 33124 35344 ??2 3136 3721 4489 5184 4900 5184 6889 8464 S?? = 1359 S?? = 573 S???? = 98295 S?? = 231967 S?? = 41967 1) Remplazando valores en el sistema se tiene: S?? = ??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S?? 573 = ??0 · 8 + ??1 · 1359 8??0 + 1359??1 = 573 2 ? 98295 = ??0 · 1359 + ??1 · 231967 ? {1359??0 + 231967??1 = 98295 Resolviendo el sistema por determinantes (regla de Cramer) se obtiene: ??0 = 573 1359 ???0 |98295 231967| 573 · 231967 – 98295 · 1359 -665814 ? 8 1359 8 · 231967 – 1359 · 1359 8855 1359 231967 = -75,191 ??1 = 8 573 ???1 |1359 98295| 8 · 98295 – 1359 · 573 7653 ? 8855 8855 8855 = 0,864 Para calcular los valores de ??1 ?? ??0 en Excel se calcula de la siguiente manera: a) Escribir los datos. Seleccionar las celdas donde aparecerá la respuesta
b) Insertar la función ESTIMACION.LINEAL c) En la ventana Argumentos de Función, en la casilla Conocido_y seleccione los datos de Y, es decir, B2:B9 y en la casilla Conocido_x seleccione los datos de X, es decir, A2:A9
d) Presione CTRL+SHIFT+ENTER Los cálculos en GeoGebra se muestran en la siguiente figura: Remplazando valores en la ecuación respectiva se obtiene: ?? = ??0 + ??1 ?? ? ?? = -75,191 + 0,864?? Interpretación: – El valor ??1 = 0,864 indica que la recta tiene una pendiente positiva aumentando a razón de 0,864 – El valor de ??0 = -75,191 indica el punto en donde la recta interseca al eje Y cuanto X = 0 2) Con los datos de la tabla anterior se substituye valores en las siguientes ecuaciones: ??0 = ? ?? · ? ??2 – ? ?? · ? ???? 573 · 231967 – 1359 · 98295 -665814 = = ?? ? ??2 – (? ??)2 8 · 231967 – (1359)2 8855 – 75,191 ??1 = ?? ? ???? – ? ?? · ? ?? 8 · 98295 – 1359 · 573 7653 = = ?? ? ??2 – (? ??)2 8 · 231967 – (1359)2 8855 = 0,864 Remplazando valores en la ecuación respectiva se obtiene: ?? = ??0 + ??1 ?? ? ?? = -75,191 + 0,864??
¯ ¯ ¯ ¯ ?x ¯ ¯ { 3) Se calcula las medias aritméticas de X y Y para llenar la siguiente tabla: ?? = 1359 8 = 169,875 ; ?? = 573 8 = 71,625 ?? 152 157 162 167 173 178 182 188 ?? 56 61 67 72 70 72 83 92 -17,88 -12,88 -7,875 -2,875 3,125 8,125 12,125 18,125 ?? = ?? – ?? ?? = ?? – ?? -15,625 -10,625 -4,625 0,375 -1,625 0,375 11,375 20,375 ???? 279,297 136,797 36,422 -1,078 -5,078 3,047 137,922 369,297 ?? 2 319,516 165,766 62,016 8,266 9,766 66,016 147,016 328,516 ?? 2 244,141 112,891 21,391 0,141 2,641 0,141 129,391 415,141 S?? = 1359 S?? = 573 S???? = 956,625 S?? 2 = 1106,875 S?? 2 = 925,875 Remplazando valores en la fórmula respectiva se obtiene: ? ???? ?? = ( 2 ) ?? ? ?? = 956,625 1106,875 ?? ? ?? – ?? = 956,625 1106,875 (?? – ??) ?? – 71,625 = 956,625 1106,875 (?? – 169,875) ? 1106,875(?? – 71,625) = 956,625(?? – 169,875) 1106,875?? – 79280,20838 = 956,625?? – 162510,4984 1106,875?? = 956,625?? – 162510,4984 + 79280,20838 1106,875?? = 956,625?? – 83230,29 ?? = 956,625?? – 83230,29 1106,875 ? ?? = 956,625?? 83230,29 – 1106,875 1106,875 ? ?? = 0,864?? – 75,19 ?? = -75,19 + 0,864?? 4) Remplazando valores en sistema respectivo se obtiene: S?? = ??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S?? 1359 = ??0 · 8 + ??1 · 573 8??0 + 573??1 = 1359 2 ? 98295 = ??0 · 573 + ??1 · 41967 ? 573??0 + 41967??1 = 98295 Resolviendo el sistema se obtiene: ??0 = 95,871; ??1 = 1,033
{ ¯ ¯ ¯¯ Los cálculos en Excel se muestran en la siguiente figura: Remplazando valores en la ecuación de la recta de mínimos cuadrados se obtiene: ?? = ??0 + ??1 ?? ? ?? = 95,871 + 1,033?? Los cálculos en GeoGebra insertando Ajuste Lineal se muestran en la siguiente figura: Interpretación: – El valor ??1 = 1,033 indica que la recta tiene una pendiente positiva aumentando a razón de 1,033 – El valor de ??0 = 95,871 indica el punto en donde la recta interseca al eje X cuanto Y = 0 5) Para calcular el centroide (??, ??) se resuelve el sistema formado por las dos rectas de los mínimos cuadrados en donde X es ?? y Y es ??. ?? = -75,191 + 0,864?? ?? = 95,871 + 1,033?? Al resolver el sistema se obtiene el centroide: X = 169,3 y Y = 71,092
6) En Excel, insertando gráfico de dispersión se obtiene la siguiente figura: Empleando el programa Graph se obtiene la siguiente figura: 7) Remplazando X = 200 en la ecuación solicitada se obtiene: ?? = -75,191 + 0,864?? = -75,191 + 0,864 · 200 = -75,191 + 172,8 = 97,609 8) Remplazando Y = 100 en la ecuación solicitada se obtiene: ?? = 95,871 + 1,033?? = ?? = 95,871 + 1,033 · 100 = ?? = 95,871 + 103,3 = 199,171
{ ?x { ?y ¯ ¯ TAREA DE INTERAPRENDIZAJE 1) Consulte sobre la biografía de Francis Galton y de Cramer, y realice un organizador gráfico de cada una. 2) Dada la siguiente tabla sobre la altura en centímetros (X) y los pesos en kilogramos (Y) de una muestra de 8 estudiantes varones tomada al azar del segundo semestre de una universidad. X 150 155 160 165 170 175 180 185 Y 55 60 63 67 70 74 79 85 2.1) Ajuste la recta de mínimos cuadrados para Y como variable dependiente resolviendo el siguiente sistema y empleando Excel y GeoGebra. S?? = ??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S??2 ?? = -66,869 + 0,812?? 2.2) Ajuste la recta de mínimos cuadrados para Y como variable dependiente empleando las fórmulas ??0 = ? ?? · ? ??2 – ? ?? · ? ???? ?? ? ??2 – (? ??)2 ??1 = ?? ? ???? – ? ?? · ? ?? ?? ? ??2 – (? ??)2 ??0 = -66,869 ; ??1 = 0,812 2.3) Ajuste la recta de mínimos cuadrados para Y como variable dependiente empleando la fórmula ? ???? ?? = ( 2 ) ?? ?? = -66,869 + 0,812?? 2.4) Ajuste la recta de mínimos cuadrados para X como variable dependiente resolviendo el siguiente sistema y empleando Excel y GeoGebra. S?? = ??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S??2 ?? = 83,18 + 1,22?? 2.5) Ajuste la recta de mínimos cuadrados para X como variable dependiente empleando las fórmulas ??0 = ? ?? · ? ??2 – ? ?? · ? ???? ?? ? ??2 – (? ??)2 ??1 = ?? ? ???? – ? ?? · ? ?? ?? ? ??2 – (? ??)2 ??0 = 83.18 ; ??1 = 1,22 2.6) Ajuste la recta de mínimos cuadrados para X como variable dependiente empleando la fórmula ? ???? ?? = ( 2 ) ?? ?? = 83,18 + 1,22?? 2.7) Calcule el punto centroide. ?? = 170,9 ; ?? = 71,9 2.8) Calcule el coeficiente de determinación. 0,99
2.9) Elabore el diagrama de dispersión. Y en el mismo diagrama graficar las dos rectas de mínimos cuadrados obtenidas en los pasos anteriores. Elabore de manera manual, empleando Excel y el programa Graph. 2.10) Estime el valor de Y cuando X = 173 en el diagrama de dispersión de Y como variable dependiente. 73,6 2.11) Estime el valor de X cuando Y = 73 en el diagrama de dispersión de Y como variable dependiente. 172,2 3) Cree y resuelva un ejercicio similar al anterior con datos obtenidos de 10 amigas suyas. 4) Consulte en la biblioteca o en el internet sobre un ejercicio de aplicación de la rectas de los mínimos cuadrados. Presente ejercicio resuelto en forma manual y empleando Excel y Graph.