Descargar

Análisis estadístico descriptivo (página 2)


Partes: 1, 2
do en que los resultados de la muestra pueden ser atribuidos a toda la población o universo . Se trabaja con los valores de Z ( niveles de confianza utilizando las áreas de la curva Normal ) y el valor de e ( máximo error permitido por el investigador ).

Luis Flores Cebrián

edu.red

1.5 • • • • • 6 Escalas de medición de los datos

Las escalas a considerar son :

Nivel nominal Nivel ordinal Nivel de intervalos Nivel de razón

Nivel Nominal

Escala cualitativa que asigna arbitrariamente un número a cada respuesta de modo que sólo tenga valor como un número de identificación. El número de escala no tiene ningún significado por sí sólo.

Ejemplo : ¿ Cuál es la tarjeta de crédito de su preferencia ? 1. 2. 3. 4. VISA Mastercard American Express Diners ( ( ( ( ) ) ) ) Porcentajes Estadística permisible : Moda Prueba binomial – Ji cuadrado

El número que se asigna en esta escala no representa magnitudes absolutas. Solo sirven para clasificarlos en determinada categoría, en otras palabras 1, no es la mitad de 2 .

Nivel Ordinal

Escala cualitativa que no sólo clasifica , sino establece jerarquías entre los valores. Entre mayor sea el número, mayor (o menor) es la existencia del atributo , pero sin indicar la distancia que hay entre las posiciones , es decir que el numero cuatro en preferencia no es 300% superior al número 1, solo indica que es preferido respecto del anterior

Ejemplo : Clasifique en una escala de 1 a 4 las siguientes marcas de gaseosa, en función de su preferencia : 1. 2. 3. 4. Inca Kola Coca Cola Real Kola Pepsi Cola ( ( ( ( ) ) ) ) Percentiles – mediana Estadística permisible Desviación cuartil Correlación rango-orden

Luis Flores Cebrián

edu.red

7 Nivel de intervalo

Escala cuantitativa que clasifica, ordena y establece distancias o intervalos iguales entre las unidades de medida . Asigna un punto de cero en forma arbitraria por convención por los expertos , pero que no implica la ausencia del atributo. Por ejemplo una prubea de coeficiente de inteligencia va tener un punto cero , pero no hay una persona con cero de inteligencia. Otros ejemplos son la medición del calendario , o la medición de la temperatura Ejemplo : Resultados económicos de empresas de un sector ($) Estadística permisible de 20´000 -10´000 0 10´000 a -10´000 0 -10´000 20´000

Media –Mediana-Moda Desviación estándar- Varianza Coeficientes de Correlación Prueba T – Prueba Z

Nivel de Razón

Escala cuantitativa es igual que las escalas de intervalos, pero poseen un cero absoluto. (origen natural) en el cual hay una ausencia de la propiedad o atributo, ejemplo el peso o los ingresos monetarios de una persona Ejemplo : Nivel de ingresos mensuales de las familias de un distrito ( en soles) Estadística permisible De 0 1,000 2,000 3,999 A 999 1,999 2,999 4,000

Media geométrica Media armónica Coeficiente de variación

La estadística permisible va en sentido acumulativo, así en la escala de razón se pueden estudiar todos los indicadores anteriores a las escalas de intervalos, ordinales y nominales

Luis Flores Cebrián

edu.red

2. 8 CONSTRUCCION DE TABLAS DE FRECUENCIA

Una primera aproximación al análisis descriptivo es la construcción de la tabla de frecuencias , las cuales presentan la distribución de un conjunto de elementos de acuerdo a las categorías de una variable x . En la tabla se observa la frecuencia o repetición de cada uno de los valores en el correspondiente intervalo de clase Se presentan los siguientes casos :

2.1 Variable discreta , es aquella cuyo valor se expresa únicamente por números enteros, adquieren valores absolutos y por lo general son cualitativas.

Ejemplo 1 :

En una muestra de veinte bodegas del distrito X ,se desea conocer la cantidad de marcas de crema dental que ofrecen a sus clientes. La variable (xi) es el número de marcas de crema dental ofrecidas. Hecho el estudio se obtuvieron los siguientes resultados : Bodega Nº 1 2 3 4 5 6 7 8 9 10 xi

6 5 4 4 3 3 4 4 5 6 Bodega Nº 11 12 13 14 15 16 17 18 19 20 xi

4 5 6 2 4 3 4 6 5 3 N : 20 bodegas Construyendo la tabla tendríamos :

1º Clasificación : xi máximo : 6 marcas de crema dental xi mínimo : 2 marcas de crema dental

2º Las clases serían : 2,3,4,5,y 6

3º Tabulación : Se determina cuantas veces de repite cada valor de xi ( frecuencia). Se denomina frecuencia absoluta ( fi ) cuando se contabiliza en valores absolutos (número de bodegas) Se denomina frecuencia relativa ( hi ) cuando se contabiliza en valores relativos (porcentajes )

4º El cuadro de frecuencias quedaría presentado de la siguiente manera :

Luis Flores Cebrián

edu.red

Nºbodegas 2.2 9 Cuadro Nº 1 :

Distribución de 20 bodegas del distrito X en función al número de marcas de crema dental que ofrecen a sus clientes xi 2 3 4 5 6 tabulación / //// /////// ///// //// TOTALES fi 1 4 7 5 3 20 hi (%) 5 20 35 25 15 100 Fuente : encuesta área de mercadeo

Gráficamente tenemos :

Oferta de marcas de crema dental – Bodegas distrito X

7

6

5

4

3

2

1

0 2 3 4 5 6 Nº marcas crema dental

Este gráfico se conoce como Histograma

Variable continua, es aquella que puede tomar cualquier valor del conjunto de los números racionales ( enteros o fraccionarios). Son variables cuantitativas

Ejemplo 2 :

Se desea conocer el ingreso mensual promedio del asentamiento “Galápagos” .

La variable xi : será ingresos mensuales expresados en Soles

Para tal efecto se ha seleccionado una muestra de 50 familias y se han obtenido los siguientes datos :

Luis Flores Cebrián

edu.red

1º 2º Familia Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 xi

730 750 580 430 490 650 670 750 510 970 820 650 890 590 550 700 600 700 380 600 450 750 730 650 760 Familia Nº 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 xi

500 870 550 710 750 700 400 610 750 690 540 720 780 850 350 320 830 890 650 450 750 640 930 850 630 n : 50

Se calcula el Rango (R)

R = mayor valor de xi – menor valor de xi

R = x10 – x41

R = 970 – 320 = 650

Se obtiene el numero de clases e intervalos – para tal efecto se utiliza la Regla de Sturges : Si el tamaño de la muestra es Menor de 100 Mayor de 100 Regla de Sturges m = 1 + 3.322 x Log n m =3 + 3.322 x Log n En este caso n < 100 entonces :

m = 1 + 3.322 x Log 50

m = 1 + 3.322 × l.69897 m = 6.64 ˜ 7 intervalos Luis Flores Cebrián 10

edu.red

familias 3º 4º i i xi xs fi Fi hi Hi El tamaño de clase ( c ) sería : C = R / m

c = 650 / 7 = 92.8 ˜ 93

Construimos la tabla de frecuencias : Intervalo de clase Marca de Frecuencias absolutas Frecuencias relativas xi xs clase – xi fi Fi hi Hi 1 2 3 4 5 6 7 320 413 506 599 692 785 878 413 506 599 692 785 878 971 366.5 459.5 552.5 645.5 738.5 831.5 924.5 4 5 6 11 15 5 4 4 9 15 26 41 46 50 8 10 12 22 30 10 8 8 18 30 52 82 92 100 TOTALES 50 100 Donde : : número de intervalo : intervalo de clase inferior : intervalo de clase superior : muestran la repetición de los datos en determinado intervalo de clase- invalores absolutos ( familias) : muestran la acumulación progresiva de las frec.absolutas : expresan a las frec. absolutas en términos relativos (%) : muestran la acumulación progresiva de las frec. Relativas

Gráficamente vamos a elaborar el histograma de frecuencias absolutas ( fi ) :

Galapagos : ingreso mensual

16

14

12

10

8

6

4

2

0 413 320 506 413 599 506 692 599 785 692 878 785 971 878 soles Luis Flores Cebrián 11

edu.red

• • • • • • 1 1 2 Es importante acotar que los gráficos deben de tener las siguientes condiciones básicas :

Título : descripción abreviada del contenido Leyendas y cifras tanto en el eje de las abscisas como de las ordenadas Debe ser simétrico, no muy horizontal o vertical En el eje de las abscisas se colocan los valores de la variable x En el eje de las ordenadas se colocan las frecuencias ( fi , hi ) De ser posible se colocan las fuentes de la información En relación al número apropiado de los intervalos Christensen Howard siguiente : plantea lo Número de valores en el conjunto De 10 a 100 De 100 a 1,000 De 1,000 a 10,000 Número apropiado de intervalos de clase De 4 a 8 De 8 a 11 De 11 a 14 Avila Acosta 2 en cambio define los intervalos de clase en tres categorías :

a. Intervalos de igual amplitud

Alumnos por aula 20 – 29 30 – 39 40 – 49 50 – 69 70 – 69

b. Intervalos de diferente amplitud

Edad de clientes 3–5 6- 14 25 – 24 25 – 39

c. Intervalos abiertos por la izquierda y cerrados por la derecha

Sueldos mensuales ( ] 320 – 370 370 – 420 420 – 470 470 – 520 520 – 570

En este caso NO está incluido el extremo inferior, pero si el extremo superior

CHRISTENSEN Howard. Estadística Paso a Paso AVILA Acosta . Estadística Elemental Luis Flores Cebrián 12

edu.red

Otra forma de presentar este cuadro es :

Alumnos por aula 320.01 – 370 370.01 – 420 420.01 – 470 470.01 – 520 520.01 – 570

Esta segunda forma de presentación es más práctica ,pues indica directamente los valores comprendidos en cada intervalo.

Por lo general el número de intervalos de clase va depender de : La naturaleza de la variable El número de valores observados El recorrido de la variable Los objetivos del estudio Luis Flores Cebrián 13

edu.red

miles$ 3. LOS GRÁFICOS ESTADÍSTICOS

3.1 Concepto

Son representaciones pictóricas ( figuras geométricas o de superficie ) utilizados con el objeto de mostrar magnitudes , cambios de una variable o comparar dos o más variables relacionadas.

Un gráfico bien elaborado debe tener los siguientes elementos :

Numero de grafico y título

Grafico 2 : Ventas de la empresa A – primer semestre del año 20X1

2,500

2,000

1,500

1,000

500

0 Enero Febrero Marzo Abril Mayo Junio meses Fuente : Área de ventas Escalas y leyendas en los Diagrama cuerpo

Luis Flores Cebrián o ejes 14

edu.red

3.2 Tipos de Gráficos 3.2.1 Gráfico Lineal Grafico 2 : Agencia de Viajes " El Sol " Clientes atendidos en sucursal Cuzco

Clientes 14,000

12,000

10,000

8,000

6,000

4,000

2,000

0 Años 2001 2002 2003 2004 2005 2006 Este gráfico de evolución es útil para representar la evolución de una sola variable en el tiempo ( serie de tiempo) 3.2.2 Gráfico circular Restaurante "El norteño" – formas de pago por consumo

Mastercard, 2% Diners, 7% Efectivo 26% American, 17%

Visa, 48%

Es utilizado para expresar una variable que esta compuesta de varios subconjuntos es decir es un gráfico de estructura ( de una sola variable) Luis Flores Cebrián 15

edu.red

ventas(miles) tasa% % 3.2.4 3.2.3 Gráfico de barras comparativas Estructura de la oferta Hotelera en La Alborada 2005-2006

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 2005 2006 Años Hotel A Hotel B Hotel C Hotel D Se recomienda para comparar estructuras con varios subconjuntos en más de un período de tiempo

Gráfico Combinado ( valores en dos abscisas )

Empresa W : Ventas y tasas de crecimiento 2003 -2006 30

25

20 14

12

10 8 15 6 10

5

0 4

2

0 2003 2004 2005 2006 años Ventas tasa crec. Es muy útil para mostrar dos frecuencias que tienen valores diferentes (dólares y porcentajes por ejemplo); cada una de ellas se ubica en uno de los ejes verticales y su lectura es a través de los valores allí expresados Luis Flores Cebrián 16

edu.red

miles 1º 2º 3º EJEMPLO PRÁCTICO DE ELABORACIÓN DE UN GRÁFICO ESTADISTICO CON EXCEL

Supongamos que estamos estudiante la cantidad de turistas que visitan el valle de Lunahuana y se tienen los siguientes datos estadísticos : (datos supuestos) 1 Año 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2 Turistas ( miles) 224 271 310 325 319 308 304 365 392 415 488 3 Crecim (%) 17.28 20.98 14.39 4.84 -1.85 -3.45 -1.30 20.07 7.40 5.87 17.59 En primer lugar vamos a utilizar un gráfico de barras para representar las cifras .

Grafico 1 : Lunahuana ingreso de turistas

500 450 400 350 300 250 200 150 100 50 0 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 años

Apreciamos que hay tres etapas claramente definidas:

De 1997 al año 2000 se aprecia un crecimiento De 2001 al año 2003 vemos que se estanca el impulso inicial y cae el número de turistas y visitantes A partir de del año 2004 se vuelva a tener un impulsote crecimiento mucho mayor Luis Flores Cebrián 17

edu.red

% ? V ? ? V Vn Vn-1 ? 325 ? Estos gráficos tienen la ventaja que nos permiten ver el comportamiento de un variable en un largo lapso de tiempo y podemos apreciar la tendencia de largo plazo ( mas de cinco años) que en este caso es de crecimiento.

Pero es importante acompañar el análisis con otro tipo de gráficos, en este caso usaremos el gráfico lineal para apreciar cómo es el crecimiento relativo ( en porcentajes ) de cada año, conforme se aprecia en la columna 3 del cuadro y cuya expresión gráfica es :

Grafico 2 : Tasa de crecimiento anual de la llegada de turistasa Lunahuana 25

20

15

10

5

0 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 -5 años

Aquí apreciamos más claramente la situación y se pueden graficar los valores negativos como son los años 2001, 2002, 2003 y 2004 , en los cuales no hubo crecimiento sino todo lo contrario se experimento una reducción en la cantidad de visitantes a la localidad

El calculo del crecimiento se efectuó con la fórmula :

crec. = ? n – 1? × 100 ? n -1 ? Donde :

: valor de la variable el año “n” : Valor de la variable el año “n-1” ( año anterior)

Por ejemplo el valor del año 2000 se obtuvo de la siguiente manera :

. crec. = ? – 1? × 100 ? 310 ?

crec. = 4.84 % Luis Flores Cebrián 18

edu.red

Una dificultad evidente es la elaboración de gráficos con la hoja electrónica EXCEL , vamos a presentar los pasos a continuación con los datos del gráfico 2 :

1º paso : ingresamos los datos de los años y las tasas de crecimiento

2º paso : accionamos el icono de gráficos y vamos a tener el asistente para gráficos

3º paso : elegimos la opción de gráfico lineal- Líneas

4º paso : presionamos el comando de Siguiente > Luis Flores Cebrián 19

edu.red

5º paso : Ingresamos el rango de datos : C4;C14, aparece la gráfica de las tasas de crecimiento

6º paso : Se acciona el comando de series para colocar los datos de los años Luis Flores Cebrián 20

edu.red

7º paso : Se coloca el rango de los periodos de tiempo B4; B14 y se acciona el comando siguiente

8º paso : Se coloca : • Título del gráfico : tasa de variación anual de llegada de turistas a Lunahuana • Eje de categorías : años • Eje de valores : %

9º paso : Se presiona siguiente y se tiene concluido el gráfico indicando Finalizar Luis Flores Cebrián 21

edu.red

4. • • • ANALISIS DE TENDENCIA CENTRAL

Las medidas de tendencia central o de resumen son indicadores que tienden a sintetizar o describir de la manera más representativa las características de un conjunto de datos. Las medidas más importantes son :

La Media aritmética La Mediana La Moda

4.1 La Media Aritmética ( ?)

La media aritmética es la clase que determina el centro de gravedad de un conjunto de datos, es decir es el valor más representativo

a) Media aritmética de datos no agrupados :

Formula : ?= n ? xi i =1 n Donde : xi : clase n : número de clases S : Sumatoria ( desde i = 1 , hasta i = n)

Ejemplo 3 :

Se ha efectuado la medición de cuanto demora la atención a los clientes en un Supermercado. Se ha tomado una muestra de 10 clientes y los resultados obtenidos son : Cliente xi 1 2 3 4 5 6 7 8 9 10 S Duración de la atención 3.24 4.01 2.33 2.08 3.30 3.25 3.00 4.02 4.15 2.88 32.26 ?= 32.26 10

? = 3.23 minutos , que es el promedio de duración de la atención a los clientes Luis Flores Cebrián 22

edu.red

Utilizando Excel el procedimiento es el que sigue :

b) Media aritmética de datos agrupados ?= n ? xi × fi i =1 N Donde : xi : marca de clase fi : frecuencia absoluta n : total de frecuencias

Ejemplo 4 :

La gerencia de mercadeo de un Hotel ha decidido estudiar un estudio acerca de la edad promedio de los clientes del Café Bar “ El Sol ”. Se ha elegido una muestra de 300 clientes recogida durante todo un mes típico . Aplicada la encuesta se han obtenido los siguientes resultados : Clase ( i ) 1 2 3 4 5 6 7 8 9 Intervalo 19 – 23 23 – 27 27 – 31 31 – 35 35 – 39 39 – 43 43 – 47 47- 51 51- 55 TOTALES xi 21 25 29 33 37 41 45 49 53 fi 5 9 13 48 67 58 54 29 17 300 xi ×fi 105 225 377 1,584 2,479 2,378 2,430 1,421 901 11,900 Luis Flores Cebrián 23

edu.red

a) 3 La media aritmética es igual a : ? = 11,900 300 ? = 39.67 años

El promedio de edad de los clientes del Café Bar “ El Sol “ es de 39. años y medio

LA MEDIA ARITMÉTICA : RESUMEN CARACTERISTICAS

VENTAJAS

DESVENTAJAS • En su valor influyen todos los componentes de la distribución • Puede ser manipulada algebraicamente • Es la medida más fácil de calcular • Es la medida más conocida y utilizada • Su valor puede ser distorsionado por los valores extremos o singulares

4.2 La Mediana ( Me)

Es la medida de tendencia central que corresponde al valor de la variable que divide a la frecuencia total en dos partes iguales .

Mediana de datos no agrupados En este caso se procede de la siguiente manera :

1º Se ordena el conjunto de valores en orden creciente 2º Se halla el valor que ocupa la posición media 3º Si el número es impar, el valor central es la mediana 4º Si el número es par , el promedio de los dos centrales es la mediana

Ejemplo 5 :

Se tiene el siguiente conjunto de datos : 4 8 5 3 9 7 2 Se ordena 2 3 4 5 7 8 9 3 Me 3 Ejemplo 6 :

Se tiene el siguiente conjunto de datos : 6 8 9 10 11 15 Se ordena 6 8 9 9.5 10 11 15 Me = (9+10) / 2 = 9.5 Luis Flores Cebrián 24

edu.red

? N / 2 – Fa ? fi Me = 39 + 4 × ? ? 3.2 Mediana de datos agrupados

Formula :

Me = Li + c × ? ? ? fi ? Donde :

Li : limite inferior del intervalo de la clase que contiene a la Me c : Tamaño del intervalo de clase n : Total de frecuencias absolutas Fa : Frecuencia absoluta acumulada anterior al la clase que contiene a la Me fi : frecuencia absoluta de la clase que contiene a la Me

Utilizando el ejercicio desarrollado en el ejemplo Nº 4 tenemos : Clase ( i ) Intervalo Fi 1 2 3 4 5 6 7 8 9 19 – 23 23 – 27 27 – 31 31 – 35 35 – 39 39 – 43 43 – 47 47- 51 51- 55 TOTALES 5 9 13 48 67 58 54 29 17 300 5 14 27 75 142 200 254 283 300 El valor de N/2 es = 300/2 = 150, este valor se encuentra ubicado en el 6º intervalo

? (300 / 2) – 142 ? ? 58 ?

Me = 39 + 0.55

Me = 39.55 años

El 50% de los asistentes al Café Bar “ El Sol ” está en el intervalo de 19 a 39.55 años y el 50% restante está en el intervalo de 39.55 a 55 años. Luis Flores Cebrián 19 50% 39.55 años 50% 55 25

edu.red

a. ? fp ? ? fp + fa ? fi LA MEDIANA : RESUMEN CARACTERISTICAS

VENTAJAS

DESVENTAJAS • Es un promedio de posición • Cuando la agrupación de datos es muy estrecha es el mejor indicador • Calculo relativamente fácil de efectuar • No es distorsionada por los valores extremos • Su interpretación es bastante restringida • No se manejar algebraicamente, la mediana de varios subconjuntos no puede ser promediada para obtener la mediana del total • No es muy conocida ni entendida

4.3 La Moda ( Mo)

Es la medida de tendencia central que corresponde al valor de la clase cuya frecuencia es la que más repite (fi mayor ) No se puede calcular la Moda en datos no agrupados

Moda de datos agrupados

Formula : Mo = Li + c? ? ? ? Donde : Li : limite inferior del intervalo de la clase que contiene a la Moda c : Tamaño del intervalo de clase n : Total de frecuencias absolutas fp : Frecuencia absoluta posterior a la clase que contiene a la Moda fa : frecuencia absoluta anterior de la clase que contiene a la Moda

Utilizando el ejercicio desarrollado en el ejemplo Nº 4 tenemos : Clase ( i ) Intervalo 1 2 3 4 5 6 7 8 9 19 – 23 23 – 27 27 – 31 31 – 35 35 – 39 39 – 43 43 – 47 47- 51 51- 55 TOTALES 5 9 13 48 67 58 54 29 17 300 La frecuencia mayor se encuentra ubicada en el 5º intervalo = 67 clientes Luis Flores Cebrián 26

edu.red

? 58 ? ? 58 + 48 ? Mo = 35 + 4 × ? ?

Mo = 35 + 2.19

Mo = 37.19 años

La edad más frecuente de los asistentes al Café Bar “ El Sol ” es de 37.19 años.

LA MODA : RESUMEN CARACTERISTICAS

VENTAJAS

DESVENTAJAS • Es absolutamente independiente de valores extremos • Es un valor típico • Es la medida más descriptiva • Cuando el número de valores es pequeño es fácil determinarla por observación • No es posible calcularla en caso de datos no agrupados

Relación empírica entre Media, Mediana y Moda : DISTRIBUCIONES

SIMETRICAS

ASIMETRICAS A LA DERECHA

ASIMETRICAS A LA IZQUIERDA

Con los datos del ejercicio 4 :

? : 39.67 años Relación

? = Me = Mo

Mo >Me > ?

Mo < Me < ? Me : 39.55 años Asimetría a la izquierda Mo : 37.19 años

La asimetría también se puede calcular de la siguiente ,manera : As = ( X – Mo ) s Los resultados obtenidos se pueden clasificar de la siguiente manera : AS > 0 Asimetría positiva Sesgo hacia la izquierda Cola hacia la derecha

Luis Flores Cebrián Simetría As = 0 As < 0 Asimetría negativa Sesgo hacia la derecha Cola hacia la izquierda 27

edu.red

clientes Utilizando los datos del ejemplo tenemos : As = (39.64 – 37.19) 7.12 As = 0.017 que es una asimetría positiva o a la izquierda

Clientes del Bar 80

70

60

50

40

30

20

10

0 23 27 31 35 39 43 47 51 55 Edad Luis Flores Cebrián 37.19 Mo 39.55 Me 39.67 ? 28

edu.red

edad edad 5. ANALISIS DE DISPERSIÓN

Las medidas de dispersión son un conjunto de indicadores que nos expresan el grado de concentración o alejamiento de los datos respecto de la media aritmética.

Ejemplo 7 : Tenemos las siguientes distribuciones de datos : xi 1 2 3 4 5

Hallamos la Media y la mediana :

Media mediana A 3 7 46 67 81

40.8 46 B 20 40 46 47 51

40.8 46 Aparentemente ambas distribuciones son iguales, pero ¿ esto es así? : veamos los Los gráficos :

GRUPO A 90 80 70 60 50 40 30 20 10 0 1 2 3 4 5 elementos

GRUPO B 60 50 40 30 20 10 0 ? 1 2 3 4 5 elementos

A pesar que ambos grupos tienen los mismos indicadores de tendencia central , las distribuciones de los datos muestran que el grupo B es más homogéneo que el grupo A, pues los datos están más cerca del valor de la edad promedio ( 40.6 años) , en cambio el grupo A está más disperso o menos concentrado.. Luis Flores Cebrián 29

edu.red

5.2 Para poder medir el grado de concentración o dispersión de los datos , respecto de la media aritmético se tienen las siguientes medidas de dispersión : • El Rango – R • La desviación media – DM • La desviación estándar – s • El coeficiente de variación – CV 5.1 El Rango ( R )

Es la medida de dispersión que mide la amplitud o recorrido de la distribución y se obtiene de la siguiente manera : R = Mayor Valor – Menor Valor Utilizando el ejemplo anterior tenemos :

Rango A = 81 – 3 = 78

Rango B = 51 – 20 = 31

La distribución B tiene un ,menor recorrido que la distribución A La utilización del Rango es muy limitada pues sólo considera los valores extremos y no indica como se dispersan los valores intermedios.

La Desviación Media (DM)

Es una medida de dispersión que es el promedio aritmético de las desviaciones de las clases respecto de la media aritmética

a) Desviación Media de datos no agrupados :

Formula : DM = n ? xi – x i =1 n Donde : xi : clase ? : media aritmética n : número de clases S : Sumatoria ( desde i = 1 , hasta i = n)

Utilizando los datos del ejemplo 7 tenemos : Luis Flores Cebrián xi 1 2 3 4 5 X A 3 7 46 67 81 40.6 B 20 40 46 47 51 40.6 30

edu.red

fi La desviación media del primer grupo es : DMA = 3 – 40.6 + 7 – 40.6 + 46 – 40.6 + 67 – 40.6 + 81 – 40.6 5 DMA = 28.68

La desviación media del grupo B : DMB = 20 – 40.6 + 40 – 40.6 + 46 – 40.6 + 47 – 40.6 + 51 – 40.6 5 DMB = 8.68 años

En otras palabras la dispersión del grupo B 2.3 veces menor que la del grupo A, por tanto este grupo es más homogéneo o más concentrado

b) Datos agrupados

Fórmula : DM = n ? xi – x i =1 n × fi Donde : xi : clase ?: media aritmética n : número de frecuencias absolutas fi : frecuencia absoluta | | : Valor absoluto ( la resta debe ser siempre positiva)

Utilizamos el ejemplo Nº 4 – edad promedio de los clientes del Café Bar “ El Sol Clase ( i ) Intervalo xi | xi – ? | | xi – ? | ×fi 1 2 3 4 5 6 7 8 9 19 – 23 23 – 27 27 – 31 31 – 35 35 – 39 39 – 43 43 – 47 47- 51 51- 55 21 25 29 33 37 41 45 49 53 5 9 13 48 67 58 54 29 17 18.67 14.67 10.67 6.67 2.67 1.33 5.33 9.33 13.33 93.35 132.03 138.71 320.16 178.89 77.14 287.82 270.57 226.61 Totales

Nota : La media aritmética es ? = 39.67 años

La desviación media sería :

Luis Flores Cebrián 300 1,625.28 31

edu.red

5.3 2 sA = DM = 1,625.28 300 DM = 5.42 años

El promedio de las desviaciones de los datos respecto a la media aritmética es de 5.42 años

La Desviación Estándar (s)

Es una medida de dispersión más utilizada y confiable es igualmente un promedio de las desviaciones de los datos pero elevados al cuadrado.

a) Desviación Estándar de datos no agrupados :

Formula : s = n ? ( xi – x ) i =1 n Donde : xi : clase ? : media aritmética n : número de clases S : Sumatoria ( desde i = 1 , hasta i = n)

Utilizando los datos del ejemplo 7 tenemos : xi 1 2 3 4 5 ? A 3 7 46 67 81 40.6 B 20 40 46 47 51 40.6 La desviación estándar del grupo A es :

(3 – 40.6) 2 + (7 – 40.6) 2 + (46 – 40.6) 2 + (67 – 40.6) 2 + (81 – 40.6) 2 5

sA =31.31 años

La desviación estándar del grupo B : Luis Flores Cebrián 32

edu.red

sB = 2 (20 – 40.6) 2 + (40 – 40.6) 2 + (46 – 40.6) 2 + (47 – 40.6) 2 + (51 – 40.6) 2 5

sB = 10.98 años

Estos resultados ratifican los obtenidos con la desviación media , la diferencia es que son más exactos Nota : cuando se trata de una muestra (n) en la fórmula se varía el denominador por n-1

b) Desviación estándar de Datos agrupados

Fórmula : DM = n ? ( xi – x) i =1 n × fi Donde :

xi : clase ? : media aritmética n : número de frecuencias absolutas fi : frecuencia absoluta v : raiz cuadrada

Utilizamos el ejemplo Nº 4 – edad promedio de los clientes del Café Bar “ El Sol “ Luis Flores Cebrián 33

edu.red

xi fi 5.4 ? s ? s = ? ? × 100 = ? ? × 100 Clase ( i ) Intervalo ( xi – ? )2 ( xi – ? )2×fi 1 2 3 4 5 6 7 8 9 19 – 23 23 – 27 27 – 31 31 – 35 35 – 39 39 – 43 43 – 47 47- 51 51- 55 21 25 29 33 37 41 45 49 53 5 9 13 48 67 58 54 29 17 384.16 243.36 134.56 57.76 12.96 0.16 19.36 70.56 153.76 1920.80 2190.24 1749.28 2772.48 868.32 9.28 1045.44 2046.24 2613.92 300 15,216.16 Nota : La media aritmética es ? = 39.67 años. Su desviación estándar es : s = 15,216.16 300 s = 7.12 años El promedio de las desviaciones de los datos respecto a la media aritmética es de 7.12 años

El Coeficiente de variación (CV)

Es el indicador de dispersión que se expresa en valores independientes de la naturaleza de la variable. Se utiliza para comparar dos o mas distribuciones cuando las unidades de medida de las variables están expresadas en diferentes unidades o escalas de medida . Comparando dos o más distribuciones de datos , es más homogénea aquella que tiene el menor CV

Formula :

CV = ? ? × 100 ? x ?

Con los datos del ejemplo Nº 7 ( edad de dos grupos de personas ) tenemos : indicador

?

El CV seria :

CV A 31.3 40.8

A

? 31.3 ? ? 40.8 ? B 10.98 40.8

B

? 10.98 ? ? 40.8 ? Luis Flores Cebrián = 76.72% = 26.91% 34

edu.red

El grupo de personas B tiene un indicador de dispersión que es casi la tercera parte del grupo A, lo cual significa que es un grupo más homogéneo, menos disperso o más concentrado , alrededor del valor representativo, que en este caso es la media aritmética o edad promedio. Dicho de otro modo, la media aritmética del grupo B es de mejor calidad y representatividad que la media aritmética del grupo A. Luis Flores Cebrián 35

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente