Descargar

Estadística (página 2)


Partes: 1, 2, 3, 4

Variable

Dato

Observaciones o características

………..

…………

…………………

………….

………….

………………..

……….

……….

……………

Ej. Las calificaciones obtenidas por los alumnos indicados, son las siguientes:

José Aldunate 5,6 ; María Jonquera 3,8 ; Roberto Melo 2,4 ; Mario Suazo 6,5, ……..

Según estos datos la tabulación sería:

Nombre

Calificación

Aldunate, José

5,6

Jorquera, María

3,8

Melo, Roberto

2,4

Suazo, Mario

6,5

…………………….

 

Obs. Si los resultados, como datos agrupados, fuesen los siguientes: 15 alumnos aprobaron el curso

de Estadística; la reprobaron 2 y se retiraron 3, entonces una tabulación sería:

Variable

conteo

frecuencia

porcentaje

Alumnos aprobados

///////////////

15

75%

Alumnos reprobados

///

3

15%

Alumnos retirados

//

2

10%

Total.

 

20

100%

Los GRÁFICOS ESTADÍSTICOS son representaciones gráficas de la tabulación. Existen gráficos de distintos tipos, como barras, circulares, de puntos, líneas, de dispersión, etc..

Gráfico de barras. Gráfico circular o de torta.

Ej. En la consulta ¿Cuántos estudiantes del Primer Nivel de la Carrera X del Santo Tomás en Talca

aprobaron la asignatura de Estadística en el año 2007? se tiene que:

Población = Estudiantes del Primer Nivel de la Carrera X del Santo Tomás de 2007.

Muestra = Si la población considerada es "Estudiantes del Santo Tomás en Talca", la población

anterior sería una muestra.

Variable = aprobar asignatura de Estadística.

Dato individual = María Jorquera, José Aldunate, ……, etc.

Número total de datos = 20 alumnos.

Ejercicios.

1. Supongamos que P es una población de 50 personas. La tabla siguiente es un resumen de las

alturas de las personas medidas en centímetros.

125

136

154

128

187

169

144

155

185

187

135

158

129

135

156

179

188

176

195

130

158

169

163

147

139

153

166

186

177

140

148

147

159

129

146

157

180

190

158

155

167

156

147

132

178

179

139

140

147

166

  1. Determine:
    1. La persona de mayor altura

    1.1.2 La persona de menor altura

    1.1.3 El valor de la altura que más aparece

    1. cuantas personas miden menos de 160 cms.
    2. cuantas personas miden entre 145 cms. y 178 cms.
    3. cuantas personas miden mas de 190 cms.
  2. Determine:
  1. Hallar el número de personas que tienen una altura:
    1. entre 120 cms. y 135 cms. (inclusive los extremos)
    2. mayor de 156 cms y menor de 185 cms.
    3. mayor de 106 cms. y menor de 155 cms
    4. mayor de 126 cms. y menor de 195 cms.
  2. Determine el porcentaje que es cada intervalo de item 1.3 del total de personas de la población.
  3. Aplique distintos tipos de gráficos para los item 1.2; 1.3 y 1.4.

Encuestas

Una ENCUESTA es la formulación ordenada de preguntas que se hacen en una población, ó muestra estadística, para conseguir los datos necesarios para un estudio especifico. Estas preguntas dependerán, en cuanto a la cantidad, de la o las variables que se deseen analizar.

Ej. En el análisis anterior puede haber una sola pregunta:

¿aprobó la asignatura de Estadística? Si ƒ No ƒ

Ej. También se pudo haber construido la siguiente encuesta:

¿ aprobó la asignatura de Estadística ? Si ƒ No ƒ

¿ reprobó otra asignatura ? Si ƒ No ƒ

¿ reprobó otra asignatura, además de la asignatura de Estadística ? Si ƒ No ƒ

¿ se retiró antes de finalizar el semestre académico? Si ƒ No ƒ

¿ el retiro se debió : a) condición económica Si ƒ No ƒ

b) resultado académico Si ƒ No ƒ

Escalas

Los gráficos utilizan diferentes tipos de escalas. Una ESCALA es la razón con la que se refleja en un gráfico la realidad de los datos conseguidos. Generalmente al construir un mapa geográfico se utiliza una escala, es así, que al ver en un mapa la expresión 1:100 debemos interpretar esta notación como por cada 1 cm2 de área de la superficie del mapa existen 100 cm2 en el terreno real.

También se utiliza las escalas o proporciones en el ámbito de la salud, es el caso de tener un resultado referente a que de cada 100 mujeres 80 sufren problemas de osteoporosis.

Ej. Si los datos son: hombres casados 100.000; mujeres casadas 150.000; divorciados 55.000 entonces la escala que se puede utilizar es: por cada espacio del gráfico corresponden 50.000 hombres o mujeres casados, es decir, es una escala de 1: 50000. Así el gráfico quedaría:

III. Medidas estadísticas

Las medidas estadísticas tienen la importancia de dar a conocer algunos aspectos de la población, en cuanto a la cantidad y calidad de los valores de los elementos de ella.

Las medidas estadísticas se clasifican en:

  • MEDIDAS ESTADÍSTICAS DE POSICIÓN.

(ubicadas entre los valores extremos de la variable analizada).

  • MEDIDAS ESTADÍSTICAS DE DISPERSIÓN.

(denominadas también de abarcamiento, generalmente alrededor de la media aritmética )

Fórmulas para las medidas estadísticas de Posición ( D.N.C.).

Def. Sean x1 , x2 , x3 ,…………., xn-1 , xn, n valores obtenidos por una variable X en una población P.

Se definen las medidas estadísticas de posición como sigue:

1. Media Aritmética

2. Media Geométrica.

3. Media Armónica.

4. Mediana.

Es el valor de la variable que deja la mitad (50%) a la derecha y la otra mitad (50%) a la izquierda.

Para calcular el valor de la mediana primeramente deben ordenarse de menor a mayor, o viceversa, todos los n elementos de la población. Una vez ordenados se aplica uno de los siguientes criterios:

– si el número de datos de la población es un número par, la Mediana es la media aritmética de los términos centrales.

– si el número de datos de la población es un número impar, la Mediana es el término central.

5. Moda.

La Moda es el valor de los n datos de una población que más veces aparece, comparativamente con los otros datos.

Al número de veces que un elemento aparece en la población le llamaremos frecuencia. (fi)

En caso que ninguno de los n datos tenga mayor frecuencia que los otros, se dice que no existe moda para la población o que la población es Amodal.

Si dos o más datos tienen mayor frecuencia que otros, se dirá que la población es Multimodal.

Ej. La población P = {2, 3, 6, 9, 8} no tiene moda, es AMODAL.

Ej. La población P = {2, 3, 6, 9, 8, 2, 3, 1} tiene dos modas, es BIMODAL.

6. Fractiles.

Estas medidas de posición, que son llamados los T – iles o Fractiles, están basados en los diferentes porcentajes ( % ) en que puede dividirse el número total de datos de la población.

– Los CUARTILES representan la división en cuartos de la población, luego cada una de esas partes contiene al 25% del total de datos de la población. Existen 3 cuartiles que se denotan C1 , C2 , C3

– Los QUINTILES dividen a la población en cinco partes iguales, cada una de ellas contiene al 20% de los datos de la población. Existen 4 quintiles que se denotan por Q1, Q2, Q3, Q4

– Los DECILES dividen a la población en diez partes iguales, cada una de ellas contiene al 10% de los datos de la población. Existen 9 deciles que se denotan por D1, D2,……,D7, D8, D9.

– Los PERCENTILES son 99 y contienen al 1% de la población y se denominan P1, P2,.., P98, P99.

Obs. Nótese que C1 = P25; C2 = mediana = P50 = D5; D3 = P30 Q1 = D2 = P20

Ej. Sea P = { 2, 4, 6, 8, 3, 7} algunos fractiles son:

Cuartil 1 = 2 (25% de 6) Quintil 4 = 6.5 (80% de 6)

Decil 7 = 6 (70% de 6 ) Percentil 95 = 7.5 ( 95% de 6 )

Ejercicios.

  1. En la población P, se han obtenido los datos de la Variable : sueldo de empleados, medidos en miles de $,que están indicados en la tabla siguiente,

102

412

698

125

365

254

458

668

378

402

204

236

279

235

269

754

418

387

565

142

369

549

348

547

267

658

700

501

440

264

587

537

264

358

158

468

301

408

600

540

658

369

549

348

269

754

267

658

700

987

387

565

142

204

236

279

235

358

158

468

458

635

789

200

195

321

487

265

125

145

458

258

149

378

892

957

678

695

712

845

  1. Hacer una tabulación.
  2. Determinar la media aritmética, geométrica y armónica.
  3. Determinar la mediana y la moda.
  4. Determinar las medidas de posición C3 , Q2 , D8 , P95
  1. Considerando los datos del ejercicio 1, determine las frecuencias de los siguientes rangos

conteo frecuencia

Empleados que ganan un sueldo menor de $100.000

Empleados que ganan un sueldo entre $100.001 y $200.000

Empleados que ganan un sueldo entre $200.001 y $350.000

Empleados que ganan un sueldo entre $350.001 y $500.000

Empleados que ganan un sueldo mayor de $500.001

3.

  1. Construya un gráfico de barras de los resultados del ejercicio 2.
  2. Calcule que % es la frecuencia de cada rango del total de las frecuencias y construya un gráfico de torta.

4. En una encuesta sobre la preferencia de 400 personas por los candidatos X, Y, Z se obtuvo el

siguiente resultado: a) 198 personas por el candidato X ; b) 234 por el candidato y c) el resto por

el candidato Z.

  1. Determine que porcentaje de preferencia, del total de personas, obtienen los candidatos X, Y, Z.
  2. Construya un gráfico de torta de los resultados del item 4.1. Considere 1% » 3,6º.

5. La tabla siguiente contiene la información de las unidades de automóviles vendidos en los años

indicados.

Año.

2004

2005

2006

2007

Nº de autos vendidos.

1257

957

1365

1587

5.1 Construya un gráfico lineal que represente dichos datos.

5.2 Construya un gráfico de torta que represente el % de vehículos vendidos por año con respecto a

la venta total del período 2004 – 2007

Obs. En el caso que los datos x1, x2, x3, .. , xp de una población P, tengan frecuencias f1, f2, f3 ,… , fp , respectivamente, siendo n = S fi = f1 + f2 + f3 +…..+ fp y p el número de elementos distintos, las medidas estadísticas asumen la siguiente forma:

  1. Media Aritmética.

2. Media Geométrica.

3. Media Armónica.

4. Mediana.

Primeramente se deben ordenar todos los elementos, incluso aquellos que aparecen mas de una vez, enseguida se aplica uno de los criterios ya vistos.

5. Moda.

El dato (o los datos) xi que tenga(n) la frecuencia fi de mayor valor numérico, comparativamente

con otros datos, es la moda.

Obs. Las demás medidas estadísticas de posición, se calculan utilizando las mismas fórmulas ya

establecidas.

Ej. Sea la población P = {2, 4, 4, 6, 8, 6, 3, 7, 6 }. Su tabulación es

Valor

Conteo

Frecuencia

2

/

1

3

/

1

4

//

2

6

///

3

7

/

1

8

/

1

Sus medidas estadísticas de posición son:

Media Aritmética = ( 2× 1 + 4 + 6 + 8× 1 + 3× 1 + 7× 1 ) / 9 = 46 / 9 = 5.11

Mediana = ( 6 + 6 ) / 2 = 6 orden: 2 – 3 – 4 – 4 – § 6 § – 6 – 6 – 7 – 8 ( el número es impar)

Moda = 6 (aparece 3 veces )

Cuartil 3 = C3 = 6 (75% de 9)

Quintil 1 = Q1 = 3 (20% de 9)

Decil 4 = D4 = 4 (40% de 9)

Percentil 60 = P60 = 6 (60% de 9)

Obs. Una forma de obtener los valores de las diferentes medidas estadísticas de posición es construir el siguiente cuadro de cálculo:

Valor de la variable xi

Frec. fi

Frec. acum..fa

xi × fi

xi fi

fi log(xi)

fi / xi

32

4

4

32 × 4

324

4 × log32

4/32

40

5

9

……

……

……

……

……

……

……

……

……

……

……

……

……

n

……

……

……

……

Totales

n = S fi

 

S (xi × fi)

P

S

S

Ejercicios.

  1. Determine las medidas de posición de los valores dados en la tabla siguiente:

Valor

134

235

214

346

98

135

345

408

240

208

frecuencia

23

45

65

8

21

13

56

76

34

20

2. Construya un gráfico: a) lineal b) de barras c) de torta, considerando los datos del

ejercicio 1.

3. La tabla contiene los sueldos, en miles de pesos, de 270 personas:

sueldo

101

125

186

265

295

340

456

589

604

780

Nº de personas

14

25

34

56

45

36

28

15

12

5

3.1 ¿cuántas personas ganan un sueldo menor que el primer cuartil?

3.2 ¿cuántas personas ganan un sueldo mayor al decil 4?.

3.3 ¿cuántas personas ganan un sueldo entre el percentil 22 y el percentil 95?

3.4 ¿cuántas personas ganan un sueldo entre los 125 mil y los 456?

3.5 ¿cuál es el % de personas que ganan un sueldo entre los 186 mil y los 589?

3.6 ¿cuántas personas ganan un sueldo entre el quintil 1 y el quintil 4?

IV. Fórmulas de las medidas estadísticas de Dispersión (D. N. C.)

Def. Sean x1 , x2 , x3 ,……., xn-1 , xn , los n valores obtenidos de una variable X en una población P.

Se definen las medidas estadísticas de dispersión como sigue:

Varianza

Desviación típica.

Desviación Absoluta

Momento de orden r

Momento de orden r con respecto a la media aritmética.

Ej. Ej. Sea P = {2, 4, 6, 8, 3, 7}. Su media Aritmética = 5

Obs. Si los valores xi tienen frecuencia fi, respectivamente, entonces las expresiones que calculan el

valor de las medidas de dispersión toman la forma siguiente:

Ej. Ej. Sea P = {2, 4, 6, 8, 3, 7, 4, 6}. Su media aritmética = 5

Varianza = [ (2 – 5)2 + 2× (4 – 5)2 + 2× (6 – 5)2 + (8 – 5)2 + (3 – 5)2 + (7 – 5)2 ] / 8 = 3.62

Desviación Típica = = 1.9

m3 = [23 + 2× 43 + 2× 63 + 83 + 33 + 73 ]/ 8 = 181.25

= [ (2 – 5)4 + 2× (4 – 5)4 + 2× (6 – 5)4 + (8 – 5)4 + (3 – 5)4 + (7 – 5)4 ] / 8 = 24.75

Ejercicios.

1. Sean las poblaciones

P = {2, 4, 3, 6, 7, 8, 9}; R = { ½ , 3/4, 5/6, 4/3, 6/7, 2/5, 3/7, 9/11 };

Q = { 2,5; 4,3; 5,6; 8,3; 9,2; 10,5; 12,3; 4,7; 3,9; 5,8}; S = {1234; 3245; 4356; 2341; 9876; 5678}

1.1 encuentre las medidas de posición de las poblaciones P y Q.

  1. encuentre las medidas de dispersión de las poblaciones R y S.
  2. determine si la media aritmética de la población PÈ Q es igual a la suma de la media aritmética de P con la media aritmética de Q.
  3. compare la media aritmética, geométrica y armónica de las poblaciones P, Q, R y S.
  1. El cuadro dado es el resultado de las edades años de los alumnos del III nivel de la carrera de

Asistente Judicial. ( M = mujer ; H = hombre )

M – 21

H – 22

M – 19

H – 20

H – 23

M -19

M – 23

M – 21

M – 22

H – 23

H – 21

H – 21

H – 23

H – 19

H – 19

M – 22

H – 24

M – 24

M – 25

H – 22

H – 22

H – 26

M – 25

M – 24

M – 23

H – 23

H – 23

H – 24

H – 19

M – 18

M – 18

H – 18

H – 19

M – 18

M – 18

H – 19

H – 22

H – 23

M – 21

M – 21

2.1 ¿cuál es el promedio de edad de los hombres?

2.2 ¿cuál es el promedio de edad de las mujeres?

2.3 construya un gráfico que represente el % que corresponde a las mujeres y a los hombres del

total de elementos de la población.

2.4 hallar el nº de alumnos que pertenecen al intervalo (m. aritmética – s; m. aritmética + s)

2.5 determine el % de alumnos que pertenecen al intervalo (mediana -2s, mediana + 2s )

Clasificación de datos ( D.C.)

Sea P una población de n datos. En ocasiones los datos de la población requieren ser clasificados en p – clases ( grupos, intervalos) de manera cualitativa o cuantitativa.

En las clasificaciones cuantitativas, cada clase tiene un valor menor llamado LÍMITE INFERIOR (L.I.) y un valor mayor llamado LÍMITE SUPERIOR (L.S.).

La media aritmética de esos límites, (LI + LS) / 2, es llamada MARCA de la clase y se denota por xi.

El número total de datos de una variable X que pertenecen a una clase es llamada FRECUENCIA de la clase y se denota por fi .

La diferencia entre el límite inferior y el límite superior, | LI – LS |, de cada clase es el TAMAÑO de la clase y se denota por ti

Obs.

1. la clasificación de una población puede ceñirse a un criterio personal o por criterios de

importancias.

2. el número de clases de una distribución de frecuencias puede ser sugerido por la expresión:

k = 1 + 3,3 × log n

donde n es el número de datos de la población.

Una vez que se haya determinado el número de clases k de una distribución, para conseguir que las clases tengan el mismo tamaño, el rango total (diferencia entre el menor valor y el mayor valor de los datos de la variable de la población) se divide por k.

rango total = V. Menor – V. Mayor Þ . Tamaño clase = (V. Menor – V. Mayor ) / k

Ej. Si n = 100 Þ K = 1 + 3,3*log100 = 1 + 3,3*2 = 7,6 » 8. Luego, la expresión sugiere que la

distribución de las frecuencias tenga 8 clases.

Ej. Considerando la sugerencia anterior, 8 clases, y si el mínimo valor de los datos de la población es 34 y el mayor es 234, entonces el rango de cada clase es (234 – 34 ) / 8 = 25 y una clasificación sería:

34 – 59

60 – 85

86 – 111

112 – 137

138 – 163

164 – 189

190 – 215

216 – 241

Otra puede ser:

30 – 55

56 – 81

82 – 107

108 – 133

134 – 159

160 – 185

186 – 211

212 – 237

Obs. Lo importante al hacer una clasificación, es asegurar que todos los datos de la población pertenezcan a alguna de las clases.

Ej. Determine los números de clases sugeridas por la fórmula para una población de a) 200; b) 300;

c) 500; d) 1000; e) 2000; f) 10000 datos.

Solución.

  1. número de clases sugeridos = 1 + 3,3 log200 = 1 + 3,3 × 2,301 = 1 + 7,59 = 8,59 » 9
  2. número de clases sugeridos = 1 + 3,3 log300 = 1 + 3,3 × 2,477 = 1 + 8,17 = 9,17 » 9
  3. número de clases sugeridos = 1 + 3,3 log500 = 1 + 3,3 × 2,699 = 1 + 8,9 = 9,9 » 10
  4. número de clases sugeridos = 1 + 3,3 log1000 = 1 + 3,3 × 3 = 1 + 9,9 = 10,9 » 11
  5. número de clases sugeridos = 1 + 3,3 log2000 = 1 + 3,3 × 3,301 = 1 + 10,89 = 11,89 » 12
  6. número de clases sugeridos = 1 + 3,3 log10000 = 1 + 3,3 × 4 = 1 + 13,2 = 14,2 » 15

Medidas de posición ( D.C.)

Media aritmética.

Media Geométrica.

Media Armónica.

Mediana.

Moda.

Fractiles.

Simbología

fi = frecuencia de la clase i – ésima

xi = marca de la clase i – ésima =

N = número total de elementos de la distribución = S fi

L Me = límite inferior de la clase mediana. La clase mediana es aquella clase donde se produce la

mitad del total de las frecuencias

L Mo = límite inferior de la clase modal. La(s) clase(s) modal(es) es (son) aquella(s) clase(s) que

tiene(n) la mayor de las frecuencias.

D 1 = exceso de frecuencias de la clase modal con respecto a la clase inmediatamente anterior.

D 2 = exceso de frecuencias de la clase modal con respecto a la clase inmediatamente posterior.

L q = límite inferior de la clase q – tila. La clase q- tila es aquella clase donde se produce la cantidad

de frecuencias correspondiente al q% de N.

fa/me = frecuencia acumulada desde la primera clase hasta la clase mediana.

fa /q = frecuencia acumulada desde la primera clase hasta la q – tila clase.

fme = frecuencia de la clase mediana.

fq = frecuencia de la clase q – tila.

t me = tamaño de la clase mediana.

t mo = tamaño de la clase modal.

t q = tamaño de la clase q – tila.

Ej. Sea la población P cuyos datos están dados en la siguiente tabla de datos clasificados. La

variable de las clases es sueldo en miles $. Los datos correspondientes a 50 empleados de alguna

empresa E están dados en la tabla siguiente:

Lím. Inf.

Lím. Sup.

fi

xi

f i xi

fa

0

100

12

50

600

12

ª 101

200

15

150.5

2257.5

27

201

300

13

250.5

3256.5

40

301

400

10

350.5

3505

50

N = 50

S = 9619

Las medidas estadísticas de posición se calculan aplicando las fórmulas correspondientes a datos clasificados. Así se tiene que:

Media aritmética = 9619 / 50 = $192.380

Mediana = 101 + 99 (25 – 12)/15 = $186.800 ª clase mediana: 101 – 200

Moda = 101 + 99 3/(3+2) = $160.400 ª clase modal: 101 – 200

Cuartil 1 C1 = T25 = 101 + 99  (12.5 – 12)/15 = $104.300

Quintil 3 Q1 = T60 = 201 + 99  (30 – 27)/13 = $223.846

Decil 4 D4 = T40 = 101 + 99 (20 – 12)/15 = $153.800

Percentil 82 = P82 = T82 = 301 + 99  (41 – 40)/13 = $308.615

Obs. Según las medidas obtenidas en el ejemplo anterior se puede concluir que el 25% (C1 ) de los

empleados de la empresa E gana un sueldo menor que $104.300; mientras que el 82% (P82)

gana un sueldo menor que $308.615.

Medidas estadísticas de dispersión ( D.C.)

Varianza.

Desviación típica o estándar.

Desviación Absoluta.

Momento de orden r.

Momento de orden r con respecto a la media aritmética.

Ej. Determinar las medidas de dispersión varianza, desviación típica, momento de orden 2 y

momento de orden 3 con respecto a la media aritmética, de la distribución en clases siguiente:

varianza = v = 9,2736

desviación típica = s = 3,04

momento de orden 2 = m2 = 57,16

momento de orden 3 con respecto a la media aritmética = m = -4,33.

Aplicaciones.

Las diversas medidas estadísticas, tanto de posición como de dispersión, pueden ser útiles en las siguientes instrumentos:

  • Coeficiente de variación.

Def. Se define el COEFICIENTE de VARIACIÓN como el valor dado por la expresión:

donde = media aritmética y s = desviación típica de la población.

Ej. Si de una población es 35 y s = 7 entonces: CV = 7/35 = 1/5 = 0,2.

Partes: 1, 2, 3, 4
 Página anterior Volver al principio del trabajoPágina siguiente