De hecho r² es igual a +1 siempre que la línea de regresión sea un estimador perfecto.
Una segunda forma extrema en la que las variables X y Y pueden relacionarse es aquella en que los puntos podrían caer a distancias iguales en ambos lados de una línea de regresión horizontal. A continuación mostramos la gráfica:
Sustituimos los valores en la fórmula encontramos que el coeficiente de determinación de muestra es igual a 0
Por lo tanto el valor de r² es cero cuando no hay correlación.
Un r² cercano a 1 indica una fuerte correlación entre X y Y.
Un r² cercano a 0 indica que existe poca correlación entre X y Y.
Se debe subrayar fuertemente que r² mide solo la fuerza de una relación lineal entre 2 variables. Por ejemplo, si tuviéramos muchos puntos X y Y y todos cayeran en la circunferencia de un círculo, aunque dispersos aleatoriamente, claramente habría una relación entre estos puntos. (todos caen en el mismo círculo),
Pero si calculamos r² resultaría estar cerca de 0, porque los puntos no tienen una relación lineal entre sí.
Para evitar estos cálculos, los estadísticos han desarrollado una versión de atajo, usando los valores que habríamos determinado de antemano en el análisis de regresión.
La fórmula es:
Para ver que esta fórmula es un atajo, la aplicaremos a nuestra anterior regresión que relaciona los gastos de inversión y desarrollo con las ganancias. Recuerde que cuando encontramos los valores para a y b la línea de regresión para este problema es:
3,600 + 2,000 – 5,400
= ——————————-
5,642 – 5,400
200
= —— = 0.826 Coeficiente de determinación de muestra
242
Por tanto, podemos concluir que la variación en los gastos de investigación y desarrollo (la variable independiente X) explica 82.6 % de la variación en las ganancias anuales (la variable dependiente Y)
Coeficiente de correlación.
Es la segunda medida que podemos usar para describir que tan bien una variable es explicada por otra.
Cuando tratamos con muestras el coeficiente de correlación de muestra se denota como r y es la raíz cuadrada del coeficiente de determinación de muestra: r = √r²
Cuando la pendiente de la ecuación de estimación es positiva, r es la raíz cuadrada positiva, pero si b es negativa, r es la √ negativa.
El signo de r indica la dirección de la relación entre las dos variables X y Y.
Diversas características de r, el coeficiente de correlación de muestra
En el problema anterior encontramos que el Coeficiente de determinación de muestra es r² = 0.826, para encontrar r sustituimos este valor en la ecuación:
r = √r²
= √0.826
= 0.909 Coeficiente de correlación de muestra
La relación entre las dos variables es directa y la pendiente es positiva, por tanto el signo de r es positivo.
Supongamos que la cantidad gastada en boletos de cine correlaciona 0.6 con el ingreso familiar. A primera vista, 0.6 parece ser una correlación bastante fuerte ya que esta más cerca de 1 que de 0. Pero esto explica sólo el 36% (0.6 x 0.6 = 0.36) de la variación en la cantidad de dinero que las familias gastan en películas. Esto sugiere que una estrategia de comercialización diseñada para atraer familias con altos ingresos pasaría por alto una gran cantidad de clientes potenciales.
Desarrollo en Minitab.
CORRELACION
1.- Abrir el Minitab.
2.- Introducir los datos en la hoja de trabajo
3.- Colocarse en el siguiente Menú y opción:
Stat Basic Statistics Correlation
4.- Seleccionar las variables a correlacionar:
Gastos y Ganancias dando clic en cada una hasta que aparezcan en el recuadro de variables, posteriormente dar clic en el botón OK.
5.- Minitab calcula el resultado utilizando la Correlación de Pearson.
Donde en este caso tenemos una correlación de .909 que como se explicó anteriormente nos indica que los Gastos de Investigación y las ganancias están correlacionados.
El p-value (valor de probabilidad) nos indica la siguiente hipótesis:
Ho: cuando p-value > 0.05
H1: cuando p-value < 0.05
DIAGRAMA DE DISPERSIÓN.
- Para generar el diagrama de dispersión:
Colocarse en el siguiente Menú y opción:
Graph Scatterplot
2.- Seleccione la opción Con Regresión. (With Regression) y dar clic en OK
3. Seleccionar las variables de Gastos y Ganancias con un clic.
y posteriormente clic en OK para obtener la siguiente gráfica de dispersión:
LÍNEA DE REGRESIÓN Y ECUACIÓN DE REGRESIÓN.
1.- Para generar el diagrama de dispersión con la línea de regresión y la ecuación de regresión: Colocarse en el siguiente Menú y opción:
Stat Regression Fitted Line Plot…
2.- Seleccionar las variables Y y X y clic OK.
Se desplegará la siguiente gráfica que representa la función Y = 20 + 2X
Desarrollo de un Caso.
Una agencia de Viajes desea saber la relación que hay entre las ventas, el presupuesto destinado a publicidad, y las comisiones de los vendedores para esto presenta los siguientes datos. Realice los análisis respectivos.
ANÁLISIS DE DATOS:
Se van a utilizar las siguientes variables:
Variables Independientes:
1.- Gastos de Publicidad
2.- Comisión de vendedores
Variable dependiente:
– Ventas
De acuerdo a los cuadros podemos decir: – La variable que más relación tiene con la Variable Dependiente es decir las ventas es la variable Gastos de Publicidad
– En cuanto a la variable Comisiones de vendedores podemos decir que no tiene
relación relevante con las Ventas.
La variable que más relación tiene con las ventas es la variable Gastos de Publicidad.
– En cuanto a la variable Comisiones de vendedores podemos decir que no tiene relación relevante con las Ventas:
Bibliografía:
Estadística para Administradores,
Richard I. Levin y David S. Rubin.
Editorial Prentice Hall
Equipo integrado por:
Ing. Gerardo Valdes Fuentes
gerardo.valdes.fuentes[arroba]gmail.com
Ing. Rosa Isela Meléndez López
Lic. José Luis Chávez Dávila
Ing. Renato Elmer Vázquez García
Maestría en Administración y Liderazgo.
Universidad Autónoma del Noreste.
Página anterior | Volver al principio del trabajo | Página siguiente |