- Correlación
- Modelo discriminativo
- Modelo de análisis de la mercadotecnia
- División geográfica de mercados
- Métodos cuantitativos de pronóstico y presupuestación
- Presupuestos
- El proceso presupuestario en las Organizaciones
- Aplicación de métodos cuantitativos en mercadotecnia
- Análisis de regresión lineal, correlación, discriminante y de agrupamiento
Regresiones lineales
La primer forma de regresiones lineales documentada fue el método de los mínimos cuadrados, el cual fue publicado por Legendre en 1805,1 y por Gauss en 1809.2 El término "mínimos cuadrados" proviene de la descripción dada por Legendre "moindres carrés". Sin embargo Gauss aseguró que conocía dicho método desde 1795.
Tanto Legendre como Gauss aplicaron el método para determinar, a partir de observaciones astronómicas, las órbitas de cuerpos alrededor del sol. En 1821, Gauss publicó un trabajo en dónde desarrollaba de manera más profunda el método de los mínimos cuadrados,3 y en dónde se incluía una versión del teorema de Gauss-Markov.
Etimología
El término regresión se utilizó por primera vez en el estudio de variables antropométricas: al comparar la estatura de padres e hijos, resultó que los hijos cuyos padres tenían una estatura muy superior al valor medio tendían a igualarse a éste, mientras que aquellos cuyos padres eran muy bajos tendían a reducir su diferencia respecto a la estatura media; es decir, "regresaban" al promedio.4 La constatación empírica de esta propiedad se vio reforzada más tarde con la justificación teórica de ese fenómeno.
El término lineal se emplea para distinguirlo del resto de técnicas de regresión, que emplean modelos basados en cualquier clase de función matemática. Los modelos lineales son una explicación simplificada de la realidad, mucho más ágil y con un soporte teórico por parte de la matemática y la estadística mucho más extenso.
El modelo de regresión lineal
El modelo lineal relaciona la variable dependiente Y con K variables explicativas Xk (k = 1,…K), o cualquier transformación de éstas, que generan un hiperplano de parámetros ßk desconocidos:
| (2) |
donde es la perturbación aleatoria que recoge todos aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar, y es la que confiere al modelo su carácter estocástico. En el caso más sencillo de dos variables explicativas, el hiperplano es una recta:
| (3) |
El problema de la regresión consiste en elegir unos valores determinados para los parámetros desconocidos ßk, de modo que la ecuación quede completamente especificada. Para ello se necesita un conjunto de observaciones. En una observación cualquiera i-ésima (i= 1,… I) se registra el comportamiento simultáneo de la variable dependiente y las variables explicativas (las perturbaciones aleatorias se suponen no observables).
| (4) |
Página siguiente |