Descargar

Estadística (página 3)


Partes: 1, 2, 3, 4

Ej.

Obs.

  • el valor del coeficiente de variación es independiente de las unidades de los datos.
  • el coeficiente de variación CV > 0, luego

Ejercicios.

  1. Determine el coeficiente de variación de la población P = {12, 34, 56, 32, 67, 86, 54}
  2. Compare los coeficientes de variación de las siguientes poblaciones y dé una conclusión en base a los resultados obtenidos.

P1 (Kg.) = {21, 87, 104, 204, 12} P2 (años) = {10, 20, 30, 40, 50, 60, 70}

P3 (mts.) = {7, 12, 456, 598, 978, 2} P4 ($) = {101, 220, 130, 440, 550, 760, 708}

  • Determinación del número de elementos de un rango.

Ej. Si consideramos la media aritmética = 35,5 y la desviación típica s = 14,4 de la distribución de frecuencias indicada en la tabla siguiente:

li

ls

fi

xi

xi*fi

fi*(xi-x')^2

0

10

2

5

10,00

1863,55

11

21

5

16

80,00

1906,13

22

32

9

27

243,00

654,08

33

43

12

38

456,00

73,51

44

54

8

49

392,00

1452,61

55

65

4

60

240,00

2396,10

40

1421,00

8345,98

35,53

208,65

14,44

Determine el número de datos del rango (– s; + s).

Solución. El rango (– s; + s) = (35,5 – 14,4 ; 35,5 + 14,4) = (21,1 ; 49,9).

El número de elementos de este rango es = nº (22 ; 32) + nº (33 ; 43) + nº (44 ; 49,9)

= 9 + 12 + x

el valor de x se calcula mediante la regla proporcional

x = (5,9 * 8) / 10 = 4,72

Luego el total de elementos que contiene el rango es:

9 + 12 + 4,72 = 25,72.

  • Determinación del porcentaje de elementos pertenecientes a un rango.

Ej. Calcular además el % del total de datos que pertenecen a ese rango, si se consideran los datos

del ejemplo anterior.

Solución. El total de elementos pertenecientes al rango es 25,72, que representa el:

25,72*100/40 = 64,3 % del total de frecuencias de la población.

  • Cálculo del número y porcentaje de datos pertenecientes a un rango interfractilítico.
    • Si el rango es del tipo (Q1, D7) el porcentaje entre las dos medidas es 70% – 20% = 50%.

Ej. En una población de 40 datos, al rango anterior contiene a 50% de 40 = 20 elementos.

  • Otros rangos interfractilíticos a los cuales se les puede obtener sus frecuencias y % son:
  • Rango intercuartilítico.
  • Rango interpercentilítico.
  • Rango interquintilítico.
  • Rango interpercentilítico – cuartilíticos.

Ejercicios.

1. Considerando los datos entregados por la tabla siguiente, determine número y % de personas que contienen los siguientes rangos:

1.1 (Q1, P78) 1.2 (C1, D8) 1.3 (D3, D7)

1.4 (Q1, Q6) 1.5 (C3, P90) 1.6 (P10, P90)

sueldo

101

125

186

265

295

340

456

589

604

780

Nº de personas

14

25

34

56

45

36

28

15

12

5

  • Análisis del Sesgo.

Def. El coeficiente de SESGO determina el grado de asimetría (alargamiento de la distribución

hacia la izquierda o hacia la derecha). Para determinar el sesgo de una distribución de frecuencias se utiliza el :

  • Si el coeficiente de sesgo tiene un valor positivo se dice que la distribución es SESGADA a DERECHA o que tiene SESGO POSITIVO.
  • Si el coeficiente de sesgo tiene un valor negativo se dice que la distribución es SESGADA a IZQUIERDA o que tiene SESGO NEGATIVO.
  • Si el coeficiente de sesgo tiene un valor 0 se dice que la distribución es INSESGADA o que tiene SESGO 0.

sesgo negativo sesgo positivo insesgada

Obs. Otras expresiones que se utilizan para el sesgo son:

  • Análisis de la Curtosis

El coeficiente de CURTOSIS determina el grado de alargamiento de la distribución hacia arriba o

hacia abajo. Para determinar la curtosis de una distribución de frecuencias se utiliza el:

– Si el coeficiente de curtosis es mayor que 3 se dice que la distribución es LEPTOCÚRTICA.

– Si el coeficiente de curtosis es menor a 3 se dice que la distribución es PLATICÚRTICA

– Si el coeficiente de curtosis es igual a 3 se dice que la distribución es MESOCÚRTICA.

Mesocúrtica Leptocúrtica Platicúrtica.

Ej. Sea la población P cuyos elementos (40) están distribuidos de la manera que indica la tabla siguiente:

Lim.Inf.

Lim.Sup.

fi

xi

fi xi

xi – x

(xi -x )2 fi

(xi – x )3 fi

(xi – x )4 fi

0

10

2

5

10

-30.5

1860.5

-56745.25

1730730.1

11

21

5

16

80

-19.5

1901.25

-37074.375

722950.31

22

32

9

27

243

-8.5

650.25

-5527.125

46980

33

43

12

38

456

2.5

75

187.5

468.7

44

54

8

49

392

13.5

1458

19683

267520.5

55

65

4

60

240

24.5

2401

58824.5

1441200.2

Totales

40

 

1421

 

8348

-20648.75

4208054.422

Entonces, para analizar sesgo y curtosis se necesitan los siguientes datos:

  • = 1421 / 40 = 35,5
  • v = 8346 / 40 = 208,7
  • s = 14,44
  • = -20648,75 / 40 = -516,21
  • = 4208054,422 / 40 = 105201,36
  • coef. sesgo = -516,21 / 3010,93 = – 0,171 < 0
  • coef. curtosis = 105201,36 / 43477,92 = 2,41 < 3

Conclusión. La población P es sesgada a la izquierda y platicúrtica.

Obs. Otra expresión que se utiliza para medir la curtosis de una población es:

Obs. Este coeficiente para una distribución normal es 0,263

Ejercicios.

1. La tabla dada representa los años de servicio de 52 personas de una empresa textil:

Años de servicio

0 – 3

4 – 7

8 – 11

12 – 15

16 – 19

20 – 25

frecuencia

8

10

15

9

6

4

1.1 Construya un gráfico lineal para dicha población.

1.2 Determine sesgo y curtosis de la población.

1.3 Dé una interpretación a los resultados obtenidos.

1.4 Encuentre el número de personas que pertenecen al intervalo (mediana – d: moda + s)

1.5 Encuentre el número de personas que pertenecen al rango (Q1, P83)

1.6 Determine el porcentaje de personas que pertenecen al intervalo

2. Obtenga una muestra de 10 datos de la población dada en el cuadro siguiente aplicando el azar.

123 213 345 234 65 365 45 214 78 465

324 210 567 23 76 241 45 1287 598 587

456 43 765 34 88 854 365 65 236 685

432 54 234 65 976 458 1258 258 2541 954

2.1 Compare las medidas estadísticas de posición de la muestra con las respectivas de la población.

2.2 Compare las medidas de dispersión de la muestra con las respectivas de la población.

2.3 Encuentre el número de personas que pertenecen al intervalo (mediana – s: moda + s) de la población.

2.4 Encuentre el número de personas que pertenecen al rango (Q1, P93) de la población.

2.5 Determine el porcentaje de personas que pertenecen al intervalo:

3.

3.1 Clasifique los datos dados en el item 2 en a lo menos cinco clases.

3.2 Compare las medidas estadísticas de dispersión de la muestra con las respectivas de la población y las de su clasificación.

3.3 Compare las medidas estadísticas de posición de la muestra con las respectivas de la población y las de su clasificación.

4. En la tabla contiene los datos de un estudio realizado sobre las edades de un grupo de personas.

0 a 10 años

23

10 a 20 años

34

20 a 30 años

47

30 a 40 años

53

40 a 50 años

45

50 a 60 años

15

60 a 70 años

18

70 a 80 años

4

4.1 Determine las medidas de posición de dicho estudio

4.2 Determine las medidas de dispersión de dicho estudio

4.3 Analice sesgo y curtosis.

4.4 ¿Cree Ud. que la villa, según los datos que obtuvo, se puede considerar "vieja"?

4.5 Encuentre el número de personas que pertenecen al intervalo (media aritmética – s: moda + s)

4.6 Encuentre el número de personas que pertenecen al rango (Q1, D8)

4.7 Determine el porcentaje de personas que pertenecen al intervalo:

5. En una empresa que fabrica tubos de cemento se analiza la producción mensual, en unidades de producción, obteniéndose los siguientes datos:

Enero

Febrero

Marzo

Abril

Mayo

Junio

Julio

Agosto

Sept.

Oct.

Nov.

Dic.

1450

1234

2345

1678

3245

1897

2087

1980

2313

1008

2056

1235

5.1 ¿Cuál es el promedio anual?

5.2 Si ese promedio anual se considera como la producción normal de la empresa ¿en cuántos meses se produjo menos de lo normal y en cuántos mas de lo normal?

5.3 Construya un gráfico circular de los datos dados en la tabla indicando el % que representa cada mes con respecto a la producción anual.

6. Indique el % que corresponde a cada clase según los datos y el gráfico dados.

Distribuciones Bidimensionales

Def. Una DISTRIBUCION BIDIMENSIONAL es una tabla de doble entrada en la cual participan dos variables simultáneamente. Cada dato obtenido verifica las dos variables.

Ej. Si se analiza una población de reos que sean monreros y que tengan una edad entre los 20 y 30 años, entonces, todos aquellos reos que cumplan ambas condiciones, pertenecen a dicho grupo o clase.

Gráfico de una distribución bidimensional.

Tabulación de una distribución bidimensional.

Los datos de una distribución bidimensional en las variables X y Y se tabulan en una tabla de doble entrada.

donde Xi son los valores (o marcas de las clases) de la variable X; Yi son los valores (o marcas de las clases) de la variable Y y Fij son las frecuencias relativas a las dos variables.

Ej. La tabla siguiente entrega los datos de un estudio con respecto de la edad de mujeres y de hombres en matrimonios constituidos legalmente:

La frecuencia F23 = 18 representa el número de matrimonios donde la edad de la mujer está entre los 19 a 22 años y la edad de los hombres entre los 26 a 30 años.

Obs. Para determinar algunas medidas estadísticas para distribuciones bidimensionales, con datos clasificados, se utiliza la siguiente: Tabla de las marcas de las clases de la distribución bidimensional.

Según los datos dados de la distribución bidimensional del ejemplo anterior, el gráfico correspondiente es:

Distribuciones Marginales

Def. La distribución que contiene sólo las frecuencias de la variable X, se le llama distribución

MARGINAL de X con respecto a Y. Análogamente, si se consideran sólo las frecuencias de la

variable Y se le llama distribución MARGINAL de Y con respecto a X..

Ej. Tabla marginal de las edades de las mujeres. Tabla marginal de las edades de los hombres

Total 200

Distribuciones Condicionales

A la distribución de las frecuencias de la variable X ( ó Y) con algún intervalo de la distribución de las frecuencias de la variable Y ( ó X ) se le llama DISTRIBUCION CONDICIONAL.

Ej. Los datos ennegrecidos del gráfico, corresponden al total de matrimonios cuyas mujeres tienen una edad entre los 19 años y los 32 años y cuyos hombres tienen una edad entre los 21años y los 30 años. En total serían 14 + 18 + 8 + 20 + 5 + 9 = 74.

Medidas en una distribución bidimensional.

Covarianza.

Correlación.

Def. La CORRELACIÓN de una relación entre dos variables, nos indica el grado de relación existente entre ellas. Uno de los instrumentos que se utilizan para determinar la correlación es el Coeficiente de Correlación, cuyo valor se determina mediante la expresión:

Ej. Consideremos la distribución bidimensional de los 200 matrimonios dados en la tabla anterior.

Determine la correlación entre las edades de las mujeres y la de los hombres.

 

Marcas

hombresè

  

Marcas mujeres ê

17,5 años

23 años

28 años

33 años

16,5 años

13

12

15

4

20,5 años

6

14

18

10

24,5 años

3

8

20

14

29,5 años

2

5

9

23

34 años

1

2

3

18

17,5

23

28

33

16,5

3754

4554

6930

2178

20,5

2153

6601

10332

6765

24,5

1286

4508

13720

11319

29,5

1033

3393

7434

22391

34

595

1564

2856

20196

XI

YI

FI

GI

Xi*Fi

Yi*Gi

(xi-x)^2*fi

(yi-y)^2*gi

17,5

16,5

25

44

437,5

726

2444,066406

2406,1851

23

20,5

41

48

943

984

789,2564063

553,2492

28

24,5

65

45

1820

1102,5

24,38515625

16,471125

33

29,5

69

39

2277

1150,5

2173,510781

1225,224975

0

34

0

24

0

816

0

2450,6646

5477,5

4779

5431,21875

6651,795

x

y

media aritmética

27,39

23,90

varianza

desviación típica

27,1560

5,21

33,2589

5,77

covarianza

13,376

correlación

0,4451

Conclusión: como el coeficiente de correlación es positivo (0,4451) se concluye que cuando la edad de la mujer aumenta la edad del hombre también aumenta.

Ejercicios.

Determine la correlación de la tabla bidimensional que relaciona los años de servicio con los sueldos, en miles de $, de una institución fiscal.

Años de servicioê

Sueldos è

70 a 99

100 a 129,99

130 a 159,99

160 a 189,99

190 a 220

0 a 2,99

12

4

5

3

2

3 a 5,99

10

8

9

6

3

6 a 8,99

6

5

12

8

6

9 a 11,99

3

4

9

12

12

12 a 14,99

2

2

4

8

7

15 a 18

2

1

3

4

3

1.1 Determine sesgo y curtosis de las dos distribuciones marginales de item 1.

1.2 Determine sesgo y curtosis de las distribuciones condicionales siguientes:

1.2.1 Años de servicio con los sueldos desde 130 a 190 mil pesos

1.2.2 Sueldos con los años de servicio desde los 6 a 15 años

1.3 Determine la correlación entre las variables.

2. El gráfico siguiente representa un estudio entre los años de edad de los fallecidos en los cuatro trimestres de un año cualesquiera.

2.1 Construya una tabla bidimensional de dicho gráfico

2.2 Construya la tabla marginal de los trimestres con respecto a los años de los fallecidos

2.3 Determine cuantos fallecidos hubo entre el segundo y tercer trimestre de personas que tenían entre 20 y 40 años

  1. El siguiente cuadro contiene los datos de la relación peso (en Kgs.) y altura (en mts.) de personas pertenecientes a una población X.

  1. Determine la correlación de las variables peso – altura.
  2. Analice su resultado.
  1. El siguiente cuadro representa los datos de la relación de la variable años de trabajo (en años) y de la variable sueldo (en miles de $) de empleados de una empresa X.

  1. Determine la correlación de las variables años de servicio – sueldo.
  2. Analice su resultado.
  3. ¿ Cuántas personas tienen entre 11 y 20 años de servicio y ganan un sueldo mayor de 200 y menor 801 mil pesos?.

Curvas de ajuste

En la relación entre dos variables X y Y, por ejemplo, entre costo y venta de una determinada empresa, muchas veces no se advierte una tendencia clara de dicha relación. En algunos períodos esta venta es creciente, en otras decrecientes, o bien, es estable.

Para determinar alguna tendencia que pueda proyectarse en el tiempo, la estadística hace uso de funciones matemáticas, como la línea recta, la parábola, y en general, funciones polinomiales, logarítmicas, exponenciales, trigonométricas reales. A estas funciones se les denominan

CURVAS DE AJUSTE.

Curva de Ajuste Lineal.

Sean los n datos o puntos (x1 , y1 ), (x2 , y2 ),….., (xn , yn ), de la relación entre las variables X y Y, que se muestran en la tabla siguiente:

Variable X

x1

x2

x3

….

……

xn

Variable Y

y1

y2

y3

……

yn

Método libre.

Para determinar la ecuación de una línea recta de ajuste, por el método libre, se seleccionan dos puntos cualesquiera de los n datos. Reemplazando los datos elegidos, A(x1, y1) y B(x2, y2), en la ecuación:

se obtiene la ecuación de la Curva de ajuste lineal.

Ej. La producción quincenal de cobre se presenta en la siguiente tabla:

Quincena

Producción en ton.

2

6

4

8

5

9

Consideremos los puntos A(1, 2) y B(6, 9). La curva de ajuste lineal libre tiene por ecuación la expresión:

Según la curva de ajuste resultante, según cuadro y gráfico, se puede apreciar que la tendencia de producción sería creciente en las próximas quincenas.

Quincena

10ª

11ª

12ª

Producción en ton.

10,4

11,8

13,2

14,6

16

17,4

Partes: 1, 2, 3, 4
 Página anterior Volver al principio del trabajoPágina siguiente