- Coeficiente de determinación
- Una interpretación intuitiva de r²
- Coeficiente de correlación
- Desarrollo en Minitab
- Diagrama de dispersión
- Línea de regresión y ecuación de regresión
- Desarrollo de un Caso
- Bibliografía
Este manual contiene el concepto, aplicación y ejecución en el sistema Minitab versión 15, del tema de Correlación.
Correlación
El objetivo de esta sesión es analizar el grado de la relación existente entre variables utilizando modelos matemáticos y representaciones gráficas. Así pues, para representar la relación entre dos o más variables desarrollaremos una ecuación que permitirá estimar una variable en función de la otra.
Por ejemplo:
- ¿En qué medida, un aumento de los gastos en publicidad hace aumentar las ventas de un determinado producto?
- ¿Cómo representamos que la bajada de temperaturas implica un aumento del consumo de la calefacción?
A continuación, estudiaremos dicho grado de relación entre dos variables en lo que llamaremos análisis de correlación.
Análisis de correlación:
Es la herramienta estadística que podemos usar para describir el grado hasta el cual una variable está linealmente relacionada con otra.
Mide el grado de asociación entre 2 variables.
Los estadísticos han desarrollado dos medidas para describir la correlación entre 2 variables:
a) El coeficiente de determinación.
b) El coeficiente de correlación.
La introducción de estas dos medidas es el propósito de esta sección.
Coeficiente de determinación.
Es la principal forma en que podemos medir la extensión o fuerza de la asociación que existe entre 2 variables, X y Y.
Como hemos usado una muestra de puntos para desarrollar líneas de regresión, nos referiremos a esta medida como el coeficiente de determinación de muestra.
Se desarrolla de la relación entre 2 tipos de variación:
La variación de los valores Y en un conjunto de datos alrededor de:
- La línea de regresión ajustada = Σ(Y-Y)²
- Su propia media = Σ(Y-Y)²
El coeficiente de determinación se simboliza:
Una interpretación intuitiva de r²
Revisaremos las 2 formas extremas en las que las variables X y Y pueden relacionarse. En este ejemplo cada valor observado de Y cae en la línea de estimación, como se ve en la tabla esta es una correlación perfecta.
La ecuación de estimación apropiada para este caso es fácil de determinar. Puesto que la línea de regresión pasa a través del origen, sabemos que la intersección Y es cero; y puesto que Y se incrementa en 4 cada vez que X se incrementa en 1, la pendiente debe ser igual a 4.
La línea de regresión es:
Para determinar el coeficiente de determinación de muestra para la línea de regresión, primero calculamos el numerador de la fracción en la ecuación de r².
Variación de los valores de Y alrededor de la línea de regresión =
Como cada valor de Y está sobre la línea de regresión la diferencia es 0 Σ(0)² = 0
Sustituimos los valores en la fórmula encontramos que el coeficiente de determinación de muestra es igual a + 1
Página siguiente |