Descargar

Estadística descriptiva


    edu.red 3.0-PROPIEDADES DE YULE Propiedades de Yule: Propiedades deseables de una medida de tendencia central. 1) Definida objetivamente a partir de los datos de la serie. 2) Que dependa de todas las observaciones. 3) De significado sencillo y fácil de entender. 4) De cálculo rápido y fácil. 5) Poco sensible a las fluctuaciones del muestreo(valor parecido al de la población) 6) Adecuado a cálculos algebraicos posteriores.

    edu.red (Gp:) Mediana: La Mediana de la variable estadística X se define como el valor que verifica: Me = Xi Fi = 0,5 Si n (número de observaciones) es impar: Me = Si n es par: Me = Ejemplo: 2, 4, 6, 7, 8, 10, 10, 11 n = 8 (par) Me = (7+8)/2 = 7,5 3.1-MEDIDAS DE TENDENCIA CENTRAL (Gp:) Observación (Gp:) Posición Importante: Las observaciones deben estar ordenadas cuantitativamente.

    edu.red (Gp:) La Mediana cuando X viene en una tabla de frecuencias agrupadas en intervalos: Ii = (ei-1, ei] Fi-1 < 0,5 < Fi ó Ejemplo: (Gp:) 15 ? n/2 = 30/2 = 15 ? 30 Intervalo Mediano: (5,10] Me = 5 + ((15 – 15)/15) * 5 = 5 3.1-MEDIDAS DE TENDENCIA CENTRAL (Gp:) n/2 n = Número total de observaciones (Gp:) Intervalo mediano

    edu.red 3.1-MEDIDAS DE TENDENCIA CENTRAL (Gp:) Propiedades de la Mediana: (1) Cumple las condiciones 1, 3, 4, 5 de Yule. (2) Distancia absoluta o media al valor a. dabsoluta (a) = dabs (Me) ? dabs (a) , ?a ? R

    edu.red (Gp:) Moda: La Moda de la variable estadística X se define como aquel/llos valores más frecuentes. Mo = xi / ni = max nj ó fi = max fj j=1–>k En Tabla de Frecuencias sin agrupar: Comparar las frecuencias de cada modalidad , la que tenga mayor frecuencia será la Moda de nuestra variable estadística. En Tabla de Frecuencias agrupadas en Intervalos: Intervalo Modal–> Ii = (ei-1, ei] hi = max hj j = 1,…,k ?1 = hi-hi-1 ?2 = hi-hi+1 3.1-MEDIDAS DE TENDENCIA CENTRAL (Gp:) Propiedades de la Moda: (1) Cumple las propiedades 1, 3 y 4 de Yule. (2) Si hay dos modas = Bimodal Si hay tres modas = Trimodal …

    edu.red (Gp:) Media Aritmética: La media aritmética o media de la variable estadística X es: x = (x1 + … + xn) / n x = (x1* n1 +…+ xk* nk) / n x = x1* f1 +…+ xk* fk Propiedades de la Media Aritmética: (1) Cumple las Propiedades 1, 2, 3, 4, 6 de Yule. (2) (3) Distancia Cuadrática(a) = (4) y = a*x + b a, b ? R x : x1,…, xk y : y1= a*x1 + b ,…, yk = a*xk + b (5) Z = a*X + b*Y z = a*x + b*y X, Y, a, b ? R 3.1-MEDIDAS DE TENDENCIA CENTRAL (Gp:) k = modalidades diferentes (Gp:) Relación entre Media Aritmética, Mediana y Moda: 3 ( x – Me ) ? ( x – Mo )

    edu.red (Gp:) Media Geométrica: La Media Geométrica (G) de una variable estadística X, positiva, se define como: Media Armónica: La Media Armónica (H) de una variable estadística X, positiva, se define como: Media Cuadrática: La Media Cuadrática (Q) de una variable estadística X, positiva, se define como: 3.1-MEDIDAS DE TENDENCIA CENTRAL (Gp:) Comparación de las diversas Medias: H ? G ? X ? Q

    edu.red 3.2-CARACTERÍSTICAS DE DISPERSIÓN (Gp:) Desviación Absoluta Media La desviación absoluta media con respecto a la Mediana (Me), se define como: La desviación absoluta media con respecto a la Media (x), se define como: DMe ? Dx

    edu.red (Gp:) Varianza: La Varianza de X, se define como: S2 = ?2 = var(X) = Desviación Típica: La desviación Típica de X, se define como: S = ? = + ?s2 ? 0 Se vuelve a la misma unidad de la variable original. Cuasivarianza: La Cuasivarianza de X, se define como: Cuasivarianza Típica: Sc = +?S2c 3.2-CARACTERÍSTICAS DE DISPERSIÓN (Gp:) Relación entre estas Dispersiones: n*S2 = (n-1)*S2c

    edu.red 3.2-CARACTERÍSTICAS DE DISPERSIÓN (Gp:) Coeficiente de Variación de Pearson El Coeficiente de Variación de Pearson de la variable estadística X, se define como: |x| es muy pequeña Si x = 0 no se usaría el CVx CVx no cambia si utilizamos escalas distintas. Para averiguar o comparar donde hay más o menos variación de varias variables estadísticas podemos utilizar cual es su CVx, ya que las escalas pueden ser diferentes( no tiene unidad de Medida, es adimensional).

    edu.red 3.2-CARACTERÍSTICAS DE DISPERSIÓN (Gp:) Cuantiles Se define el Cuantil de orden ? (0 < ? < 1), como la proporción igual o mayor de observaciones que ?. Casos Particulares: Cuartiles: Q1 = X0,25 , Q2 = X0,50 , Q3 = X0,75 Deciles: D1 = X0,1 , D2 = X0,2 ,…, D9 = X0,9 Percentiles: P1 = X0,01 , P2 = X0,02 ,…, D99 = X0,99

    edu.red 3.2-CARACTERÍSTICAS DE DISPERSIÓN (Gp:) Cálculo de los cuantiles X? X no agrupada en Intervalos: 1) ? = Fi X? = ( xi + xi+1 ) / 2 2) Fi-1 < ? < Fi x? = xi X agrupada en Intervalos: Fi-1 ? ? ? Fi (ei-1 , ei] ? Xa

    edu.red 3.2-CARACTERÍSTICAS DE DISPERSIÓN Recorrido Intercuartílico El Intervalo Intercuartílico de X, se define como: [ Q1 , Q3 ] ( 50 % de las observaciones más centradas) El rango Intercuartílico de X, se define como: IQR = Q3 – Q1 El rango o recorrido de X, se define como: Rg(X) = Max xi – Min xi

    edu.red (Gp:) Momentos El Momento de Orden r respecto a c se define como: Momentos no Centrales(c=0): Momentos Centrales de orden r (c=x): 3.2-CARACTERÍSTICAS DE DISPERSIÓN (Gp:) Propiedades (1) (2) (3)

    edu.red 3.2-CARACTERÍSTICAS DE DISPERSIÓN Indice de Diversidad El Indice de Diversidad de X trata la dispersión en variables nominales y se define como: Donde H es: n = Número total de observaciones (Gp:) Teoría de la Información (SHANNON-1948) (Gp:) Propiedades (1) (2) (3) (4) (5) (6)

    edu.red 3.3-CARACTERÍSTICAS DE FORMA (Gp:) Coeficientes de Asimetría Coeficiente de Simetría de PEARSON de X: Si: As = 0 Situación de Simetría As > 0 Situación de Simetría a la Derecha AS < 0 Situación de Asimetría a la Izquierda Medida Adimensional(Sin Medida)

    edu.red 3.3-CARACTERÍSTICAS DE FORMA (Gp:) Coeficiente de Simetría de FISHER de X: Si: = 0 Situación de Simetría > 0 Situación de Simetría a la Derecha < 0 Situación de Asimetría a la Izquierda Medida Adimensional(Sin Medida)

    edu.red 3.3-CARACTERÍSTICAS DE FORMA (Gp:) Coeficiente de Curtosis El Coeficiente de Curtosis de Fisher de la Variable Estadística X se define como: Interpretación: = 0 > 0 < 0 Mesocúrtica Leptocúrtica Platicúrtica

    edu.red 3.4-CARACTERÍSTICAS DE CONCENTRACIÓN Medidas de Concentración Las Medidas de Concentración ponen de relieve el mayor o menor grado de igualdad en el reparto de la suma total de los valores de la variable. Suelen ser variables de tipo económico: Producción, Salarios, Ventas, …

    edu.red 3.4-CARACTERÍSTICAS DE CONCENTRACIÓN (Gp:) Curva de Lorentz La Curva de Lorentz es la poligonal que une los puntos (qi,Pi), i = 0, … , k , donde P0 = 0 , q0 = 0 si : Es la suma de todas las observaciones que caen en el intervalo i-ésimo. si = xi * ni para (ei-1,ei] Si : Acumulación del número de observaciones entre intervalos. Si = s1 + … + si Pi : Porcentaje Pi = Fi * 100 qi : Porcentaje de la suma total que hay menores o iguales que el extremo superior del intervalo.

    edu.red 3.4-CARACTERÍSTICAS DE CONCENTRACIÓN (Gp:) Ejemplo(Curva de Lorentz): X = “Salario en miles de pesetas” (Gp:) (0,0) (Gp:) (0,80) (Gp:) (100,100) (Gp:) qi (Gp:) Pi (Gp:) Concentración Máxima(debido a que la curva de Lorentz esta bastante alejada de la recta que une los puntos extremos)

    edu.red (Gp:) Indice de GINI El Indice de Gini se define como el área encerrada entre la bisectriz y la Curva de Lorentz, dividida por la mitad del área del cuadrado [0,100] x [0,100]: 3.4-CARACTERÍSTICAS DE CONCENTRACIÓN (Gp:) Interpretación Concentración Máxima Concentración Mínima

    edu.red 3.4-CARACTERÍSTICAS DE CONCENTRACIÓN (Gp:) Mediala La Mediala de una variable estadística positiva es el valor: Ml = xi / qi = 50 (Gp:) La Mediala sólo se puede utilizar en variables acumuladas en intervalos, ya que para las no acumuladas utilizamos la Mediana.