Distribuciones bidimensionales e independencia Los sucesos aleatorios {X = x} e {Y = y} son independientes si: Y entonces, dos variables aleatorias serán independientes si la relación anterior se cumple para todos los posibles pares (x,y). Podremos entonces escribir: 13
El teorema de Bayes se expresa como: 14
15 paralelo
16
17
18
19
20
21
22
23
24
25
Cuando construimos modelos, básicamente estamos relacionando variables con argumentos del tipo: Un aumento en la variable X está asociado a un aumento (descenso) de la variable Y. Algunos ejemplos Existe una relación positiva entre el flujo de inmigrantes a un país y la renta per capita del país de acogida. Existe una relación positiva entre la nota obtenida en probabilidad y la de estadística. Existe una relación negativa entre la tasa de fecundidad y la tasa de participación femenina. No parece que exista ninguna relación entre el volumen de lluvias en Islandia y la nota del parcial de probabilidad.
Relaciones entre variables
Las relaciones entre v.a. pueden ser de muy distinto tipo: positivas o negativas (si cuando crece la una la otra también lo hace y viceversa), lineales o no lineales, etc.
También puede ocurrir que no exista ninguna relación entre dos v.a.: cuando esto ocurre diremos que dos v.a. son independientes.
Vamos a describir a continuación cómo de lineal es la relación que existe entre dos variables: para ello definimos la covarianza y la correlación (Gp:) X (Gp:) Y
Relación lineal positiva X Y Relación no-lineal X Y Sin relación
La covarianza mide la manera en que dos variables aleatorias X e Y varían juntas. En particular mide el tipo de relación lineal entre las variables aleatorias.
Un valor positivo se interpreta como existencia de relación lineal positiva entre las v.a. X e Y. Un valor negativo, apunta a la existencia de una relación lineal negativa entre las v.a. X e Y.
Covarianza Con: 28
Un valor igual a cero se interpreta como ausencia de relación lineal. Pero, ojo: Esto NO es igual a decir que las v.a. son independientes. X Y Las variables No tienen ningún tipo de relación, es decir son INDEPENDIENTES X Y O de manera más general, tienen algún tipo de relación que no es lineal.
Se cumple que: Si X e Y son variables independientes, su covarianza es cero. Observa que en este caso: Puesto que X e Y son variables independientes Si la covarianza de X e Y es cero, no necesariamente X e Y son variables independientes. 30
Nota: Aquí está el punto 2 que nos quedaba pendiente.
Propiedades de la covarianza Si a y b son constantes: 32 Nota:
Otro ejemplo: El equipo X y el equipo Y se enfrentan en un campeonato. Supón que la distribución de probabilidad conjunta del número de goles que obtienen es: Y 0 1 2 0 .10 0.08 .04 X 1 .08 .30 .10 2 .07 .03 .20
¿Existe alguna relación lineal entre el número de goles marcados por uno y otro equipo? En caso afirmativo, ¿se trata de una relación estrecha?
Calculemos la correlación entre X e Y. Para ello tenemos que calcular Cov(X,Y) = E(XY) – E(X)E(Y) Calculemos E(XY). Para ello calcularemos la función de masa de probabilidad de la variable aleatoria Z = XY: XY 0 1 2 4 0.37 0.30 0.13 0.20 P(X=2,Y=2) P(X=1,Y=2) + P(X=1,Y=2) P(X=1,Y=1) E(XY) = 0*0.37 + 1*0.30 + 2*0.13 + 4*0.20 = 1.36 E(X)=1.08; E(Y)=1.09 Por tanto, Cov (X,Y) = 1.36 – 1.08*1.09 = 0.18 Existe una relación lineal positiva entre los goles que marca uno y otro equipo por partido. Para cuantificar la fuerza de la relación hay que calcular el coeficiente de correlación.
35
Var(X) = 0.51, Desviación tip: 0.71 Var(Y) = 0.58, Desviación tip.: 0.76
Por tanto, CORR(X,Y) = 0.18/(0.71*0.76) = 0.33 El coeficiente de correlación está lejano de cero lo que confirma que existe una relación lineal positiva significativa entre los goles marcados por X e Y. Por otra parte, este valor también está lejano a 1 por lo que se puede deducir que esta relación lineal no es muy intensa que digamos… En nuestro último ejemplo:
El coeficiente de correlación
Imagina que la v. a. X = beneficio (medido en millones de euros) de la empresa X e Y = beneficio en millones de euros de la empresa Y. Y que sabemos que la covarianza entre ambas variables aleatorias es: Cov(X,Y) = -1.8 Si expresáramos lo mismo en euros, en vez de en millones de euros, tendríamos: Cov(X*1.000.000,Y*1.000.000)=1000.000.000.000*(-1.8) La covarianza depende de las unidades en que medimos las variables. Por tanto, NO podemos utilizarla para medir la intensidad de la relación lineal.
El coeficiente de correlación estandariza la covarianza de manera que no dependa de las unidades en que estamos midiendo. Definición:
Es fácil ver que esta medida ya no depende de las unidades. En el ejemplo anterior: 1
Propiedades del coeficiente de correlación No depende de las unidades Siempre está entre 1 y 1. Este resultado deriva de la conocida desigualdad de Schwartz. Para toda v.a Z y V,
Llamando: Z = X-E(X) y V = Y-E(Y) y tomando raíces cuadradas:
Página anterior | Volver al principio del trabajo | Página siguiente |