Cuando se estudian en forma conjunta dos características (variables estadísticas) de una población o muestra, se dice que estamos analizando una variable estadística bidimensional. La correlación es el grado de relación que existe entre ambas características, y la regresión es la forma de expresar matemáticamente dicha relación.
Dado dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo el valor de la otra variable.
1) DIAGRAMA DE DISPERSIÓN
Los diagramas de dispersión son planos cartesianos en los que se marcan los puntos correspondientes a los pares ordenados (X,Y) de los valores de las variables.
2) CLASIFICACIÓN DE LA CORRELACIÓN
2.1) Según la relación entre variables
– Correlación lineal: Se representa mediante una línea recta.
– Correlación no lineal: Se representa con una línea curva.
2.2) Según el número de variables
– Correlación simple: La variable dependiente actúa sobre la variable independiente.
– Correlación múltiple: Cuando la variable dependiente actúa sobre varias variables independientes.
– Correlación parcial: Cuando la relación que existe entre una variable dependiente y una independiente es de tal forma que los demás factores permanezcan constantes.
2.3) Según el valor cuantitativo
– Correlación perfecta: El valor del coeficiente de correlación es 1
– Correlación imperfecta: El coeficiente de correlación es menor a 1 sea en sentido positivo o negativo.
– Correlación nula: El coeficiente de correlación es 0. No existe correlación entre las variables. Ejemplo: Número de calzado de una persona y su cociente intelectual.
2.4) Según el signo
– Correlación positiva.- Dos variables tiene correlación positiva cuando al aumentar o disminuir el valor de una de ellas entonces el valor correspondiente a la otra aumentará o disminuirá respectivamente, es decir, cuando las dos variables aumentan en el mismo sentido. Ejemplo: Peso de una persona y su talla.
– Correlación negativa.- Dos variables tiene correlación negativa cuando al aumentar o disminuir el valor de una de ellas entonces el valor de la otra disminuirá o aumentará respectivamente, es decir, una variable aumenta y otra disminuye o viceversa. Ejemplo: Número de partidos ganados por un equipo en una temporada y su posición final en la tabla.
3) COEFICIENTES DE CORRELACIÓN
Los coeficientes de correlación son medidas que indican la situación relativa de los mismos sucesos respecto a las dos variables, es decir, son la expresión numérica que nos indica el grado de relación existente entre las 2 variables y en qué medida se relacionan. Son números que varían entre los límites +1 y -1. Su magnitud indica el grado de asociación entre las variables; el valor r = 0 indica que no existe relación entre las variables; los valores ± 1 son indicadores de una correlación perfecta positiva (al crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).
No hay correlación
Correlación Positiva
Correlación Negativa
Para interpretar el coeficiente de correlación utilizamos la siguiente escala:
Valor | Significado | ||
-1 | Correlación negativa grande y perfecta | ||
-0,9 a -0,99 | Correlación negativa muy alta | ||
-0,7 a -0,89 | Correlación negativa alta | ||
-0,4 a -0,69 | Correlación negativa moderada | ||
-0,2 a -0,39 | Correlación negativa baja | ||
-0,01 a -0,19 | Correlación negativa muy baja | ||
0 | Correlación nula | ||
0,01 a 0,19 | Correlación positiva muy baja | ||
0,2 a 0,39 | Correlación positiva baja | ||
0,4 a 0,69 | Correlación positiva moderada | ||
0,7 a 0,89 | Correlación positiva alta | ||
0,9 a 0,99 | Correlación positiva muy alta | ||
1 | Correlación positiva grande y perfecta |
3.1) COEFICIENTE DE CORRELACIÓN DE KARL PEARSON
Llamando también coeficiente de correlación producto-momento.
a) Para datos no agrupados se calcula aplicando la siguiente ecuación:
r = Coeficiente producto-momento de correlación lineal
Ejemplo ilustrativo:
Con los datos sobre las temperaturas en dos días diferentes en una ciudad, determinar el tipo de correlación que existe entre ellas mediante el coeficiente de PEARSON.
X | 18 | 17 | 15 | 16 | 14 | 12 | 9 | 15 | 16 | 14 | 16 | 18 | SX =180 | ||
Y | 13 | 15 | 14 | 13 | 9 | 10 | 8 | 13 | 12 | 13 | 10 | 8 | SY= 138 |
Solución:
Se calcula la media aritmética
Se llena la siguiente tabla:
Se aplica la fórmula:
Existe una correlación moderada
En Excel se calcula de la siguiente manera:
a) Se inserta la función COEF.DE.CORREL y pulsar en Aceptar.
b) En el cuadro de argumentos de la función, en el recuadro de la Matriz 1 seleccionar las celdas de X, y en el recuadro de la Matriz 2 seleccionar las celdas de Y.
c) Pulsar en Aceptar.
El diagrama de dispersión en Excel se realiza de la siguiente manera:
a) Seleccionar los datos e insertar diagrama de dispersión.
b) En diagrama dispersión, escoger el primero.
c) Para que ver las coordenadas escoger el diseño N° 7.
d) Borrar Serie 1, las líneas horizontales y verticales (haciendo clic y suprimir en cada objeto).
e) En título del gráfico escribir Diagrama de dispersión.
f) Clic en el eje x, y luego clic derecho para dar formato al eje.
g) Poner 2 en la casilla unidad mayor para ver los números de 2 en 2 en el eje x.
h) Clic en Cerrar para culminar la elaboración del diagrama de dispersión, aunque se le puede seguir haciendo más mejoras.
Para realizar el diagrama de dispersión en el programa Graph se procede de la siguiente manera:
a) Clic en Función.
b) Clic en Insertar serie de puntos.
EL PRESENTE TEXTO ES SOLO UNA SELECCION DEL TRABAJO ORIGINAL. PARA CONSULTAR LA MONOGRAFIA COMPLETA SELECCIONAR LA OPCION DESCARGAR DEL MENU SUPERIOR.