Descargar

Estadística descriptiva (página 4)


Partes: 1, 2, 3, 4

edu.red

4. El costo de 25 artículos es el siguiente:¿ Conviene agrupar o construir un cuadro de frecuencias? Le sugiero ordenar en una serie de frecuencias o tipo II. Luego

encuentre:

La mediana

40 – 43 – 40 – 46 – 40 La moda

41 – 44 – 45 – 45 – 42 La media geométrica

42 – 43 – 41 – 43 – 41

43 – 44 – 42 – 44 – 40

44 – 41 – 40 – 44 – 40

5. Verifique si el modo es 46,62; por el método que indica el texto básico pág. 78.

AUTOEVALUACIÓN

1 . E N C I E R R E E N U N C Í R C U L O E L A S T E R I S C O D E L E N U N C I A D O

C O R R E C T O

* Las medidas de tendencia central son las que toman en consideración al valor alrededor del cual se agrupan los demás valores de la variable.

* La media aritmética es la suma de las puntuaciones dividida para el número de casos.

* La mediana divide a una serie en dos partes con igual número de casos a cada lado.

* La media geométrica es utilizada cuando la serie corresponde a una progresión geométrica.

2. COMPLETE

Las últimas calificaciones de Liliana en matemáticas fueron: 13 – 16 – 16 –17 – 14 – 12

–11 – 10.

La media aritmética es

La mediana

La moda

¿Para qué nos sirven estas medidas de tendencia central?

Una vez que usted sabe calcular estas medidas también debe conocer su utilidad.

En las unidades 13 –16 de su texto básico puede usted enriquecerse con este contenido.

Por Ejemplo:

Tenga presente que entre las múltiples aplicaciones de la mediana tenemos:

Nos sirve para encontrar el valor central de una serie.

Nos ayuda a dividir el área de un polígono de frecuencias en dos part iguales.

Nos sirve para verificar una hipótesis

Su cálculo determina el valor central más fiable en ciertos tipos de variables: cualitativas como: salarios, estaturas, pesos, etc.

El modo, se utiliza para resaltar lo más sobresaliente de una investigación.

UNIDAD # 6.

Medidas de Dispersión

RANGO

VARIANZA

DESVIACIÓN MEDIA

DESVIACIÓN TÍPICA

En la unidad anterior se estudiaron las medidas de la tendencia central en lo que se refiere a su cálculo, significado y empleo. Sin embargo, como se pondrá de manifiesto en esta unidad, dichas medidas, por sí mismas, no son suficientes para describir la distribución.

Los promedios determinan el centro de la distribución, pero nada indican acerca de cómo están situados los datos, medidas o puntuaciones respecto al centro.

Veamos dos ejemplos:

edu.red

Al presentar estas dos distribuciones de las puntuaciones obtenidas en un mismo test; vemos que cada una tiene de media el valor 67. En la primera, la puntuación mayor es 72 y la menor es 62. En la segunda distribución, la puntuación más alta es 107 y la más baja 25. El recorrido de la primera distribución es 11, mientras que el correspondiente de la segunda es 83.

Atención

Por esta razón, y para obtener una imagen más nítida de una distribución, se necesita conocer tanto una medida de la tendencia central como otra de la variabilidad Es decir su dispersión y su forma.

En estadística se expresa que la primera distribución del ejemplo es de un grupo homogéneo. Los elementos dentro del mismo son muy parecidos en cuanto a la cualidad medida. La otra distribución corresponde a un grupo heterogéneo, porque la variabilidad es grande. Estos dos términos se usan mucho en sicología, sociología y pedagogía, comunicación, etc.

¿ QUÉ MEDIDAS NOS AYUDANA EFECTUAR UNA DISTRIBUCIÓN?

EL RANGO O RECORRIDO

El recorrido se define como la diferencia entre las puntuaciones mayor y menor . Algunos a este valor aumentan la unidad. Recuerde que utilizamos cuando se trató de la representación de una distribución de frecuencias.

De todos las mediadas de dispersión, el recorrido es la más inestable. Esto quiere decir que de una muestra a otra, el recorrido varía más que cualquiera de las otras medidas.

Un ejemplo aclarará lo dicho. Supongamos una distribución de puntuaciones, siendo 30 la menor y 103 la mayor. La puntuación inmediatamente inferior a 103 es 90. Teniendo en cuenta la definición, el recorrido es 74; sin embargo, 13 de los puntos que integran este recorrido corresponden a la puntación más alta 103. La posibilidad de que la muestra siguiente no contenga esta puntuación alta y desviada es grande y, por tanto, el recorrido será mucho menor. El recorrido, lo mismo que la moda, es un estadígrafo muy inestable, ya que puede variar considerablemente de una muestra a otra.

El empleo del recorrido puede estas justificado cuando se precise rápidamente una medida de dispersión y no haya tiempo de calcular alguna de las otras. No obstante, si se considera la población en lugar de una muestra, el recorrido sería mucho más útil.

En el siguiente cuadro ¿Cuál es el rango?. Usted ya lo encontró es 22. Por que 26-04 = 22

El rango en el cuadro 17.1 de su texto básico es …….?

LA DESVIACION MEDIA

Vamos a la unidad 18 del texto básico para descubrir a esta medida.

La desviación media, también llamada desviación promedio, apenas se emplea en estadística, habiendo sido sustituida por la desviación típica. Sin embargo, un breve examen de este estadígrafo hará más fácil comprender el significado de la desviación típica. Antes de proseguir definiremos con el símbolo (d) la desviación (diferencia) de una puntuación cualquiera respecto de la media aritmética. Matemáticamente.

edu.red

d =

siendo d = desviación

X = puntuación bruta

En cualquier distribución, la suma de las desviaciones respecto de la media es nula.

Como se observó anteriormente, constituye una propiedad muy importante de la media.

Cálculo de la

desviación media

edu.red

Puesto que la suma de las desviaciones respecto de la media es cero, se deduce que no es posible calcular la desviación media a menos que se modifique en algo el procedimiento de cálculo. En la práctica, la desviación media, es la media aritmética de las desviaciones consideradas en valor absoluto (prescindiendo del signo). La definición matemática de la desviación media es.

El cálculo ordenado de la desviación media muestra en el ejemplo. Para dicha distribución, las puntuaciones se desvían, en promedio, 6 unidades de la media.

¿Cómo calcular las distribuciones en una serie de frecuencias y de intervalos?

Su fórmula será igual. ¿Por qué?. Analice la página 95 cuadro 18.1 y verifique su desarrollo.

LA DESVIACIÓN TÌPICA

De todas las medidas de dispersión, la desviación típica es la medida que más se utiliza en la práctica. Empezaremos por indicar cómo se calcula, tanto en el caso de datos agrupados como no agrupados.

Con datos no agrupados, el proceso se inicia de la misma forma que si se tratara de hallar la desviación media. Es decir, en primer lugar, se calcula la media. Luego se hallan las desviaciones de cada puntuación respecto de dicha media. Después se elevan al cuadrado cada una de estas desviaciones y se suman los resultados obtenidos.

Tenga presente que una forma de ir comprobando la bondad de los cálculos consiste en observar que la suma de las desviaciones respecto de la media (suma de las x) es cero.

En nuestro caso en Estadística descriptiva solo interesa conocer cómo se distribuyen, respecto de la media de la muestra, un conjunto de datos o puntuaciones.

edu.red

Cálculo de la desviación típica en el caso de datos no agrupados : = 12.4

edu.red

edu.red

En el ejemplo la desviación típica (s) es 4.5.

Algunos autores la representan por edu.red

Otros ejemplos usted encontrará en su texto básico página 90.

Si se dispone de una máquina de calcular, es más cómodo aplicar la fórmula que se llama de las puntuaciones brutas para obtener la suma de los cuadrados de las

desviaciones. En la misma, se han escrito las puntuaciones y la primera columna se encabeza por la letra X. La segunda columna es, sencillamente, el cuadrado de cada

d. (Luego se suman los valores en ambas columnas. Debe observarse que si se emplea una máquina de calcular, no es necesario escribir las puntuaciones originales o sus cuadrados, como aparecen a continuación.

Se registran las puntuaciones en la máquina una a una, y en la misma se acumula la suma.

Al final, ambos valores se leen directamente en la máquina. Con este modo de proceder, la suma de cuadrados (de las desviaciones) viene dada por la siguiente fórmula:

Este valor de la suma de cuadrados es el mismo que se obtiene al sumar los cuadrados de las desviaciones de cada puntuación respecto de la media. Aún sin máquina de calcular, el método anterior puede resultar más cómodo que el primero. Obtenida la suma de cuadrados, se sustituyen los valores en la fórmula dada.

Cálculo directo de la desviación típica a partir de las puntuaciones brutas

edu.red

Otros ejemplos usted encontrará en su texto básico página 90, a fin de que desarrolle este ejercicio.

A veces, se abrevia la expresión calculando por medio de la fórmula que plantea su texto básico en la unidad 19.

¿Cuál le parece más fácil?

Cómo se podrá cuenta la combinación de este cálculo da lugar a la desviación típica a partir de las puntuaciones brutas:

¿Qué sucede si la serie es de frecuencias o tipo II?

Tendremos que incluir este dato. Así:

s= edu.red

LA DESVIACIÓN TÍPICA EN EL CASO DE DATOS AGRUPADOS.

El ejemplo que plantea su texto básico en la página 98. Puede usted calcular de manera más abreviada. Siguiendo el mismo procedimiento anterior.

Recuerde:

Que para calcular la desviación típica: primero encontramos la media aritmética, luego las desviaciones al cuadrado y finalmente sumamos el producto de las frecuencias por las desviaciones elevadas al cuadrado.

Por lo tanto necesitamos obtener las siguientes columnas

X

f

Xm

d

d2

fd2

La misma fórmula resume este cálculo:

OTRA MEDIDA DE VARIABILIDAD O DE DISPERSIÓN ES LA VARIANZA Su cálculo es similar a la desviación típica..

Observe y analice su representación puesto que es el mismo valor de la desviación típica elevada al cuadrado.

Tenga presente que el recorrido intercuartílico, que presentaremos por la letra Q, se llama a veces desviación cuartílica. En la unidad siguiente hablamos de cuartiles, Q1 o centil veinticinco, y Q3 o centil setenta y cinco. El recorrido intercuartílico es la mitad de la distancia entre estos dos cuarteles. Matemáticamente se puede escribir:

Su texto básico presenta una amplia información al respecto.

Esta medida es muy fácil de calcular. Para explicarlo de una manera sencilla se ha realizado la siguiente serie con la distribución de las puntuaciones de un test de Estadística. En primer lugar se han de calcular Q1 y Q3. Por definición, Q1 es el punto de la distribución que deja un 25 por 100 de las puntuaciones por debajo de él. El 25 por 100 de 40 casos es 10.

Cálculo del recorrido intercuartílico

Haciendo el recuento de casos a partir del extremo inferior se obtiene que hasta el límite inferior del intervalo 45-49 hay exactamente 10 casos. No es preciso realizar interpolación alguna en estas circunstancias, con lo que Q1 = 44,5. Para hallar Q3, se repite el procedimiento, salvo que en lugar de contar el 75 por 100 de los casos a partir del extremo inferior se hace el recuento del 25 por 100 a partir del extremo superior.

En estas condiciones se deduce que hasta 64,5 (límite inferior del intervalo 65-69) hay 7 casos. Se precisan, pues, 3 casos más. El intervalo citado contiene 4 casos, con lo que se hallan los tres cuartos de su amplitud. La operación se realiza como sigue:

INTERPRETACIÓN DE Q.

En una distribución normal, si a partir de la mediana se llevan a cada lado un recorrido intercuartílico se abarca, aproximadamente, el 50 por 100 de los casos.

¿CUANDO EMPLEAR EL RECORRIDO INTERCUARTÍLICO?.

Como el recorrido intercuartílico está asociado a la mediana, se deduce que siempre que se utilice la mediana como medida de la tendencia central, el recorrido intercuartílico es una medida apropiada de la dispersión. Recordemos que la mediana es el estadígrafo que se ha de emplear como medida de tendencia central cuando la distribución sea asimétrica. Aun en estas condiciones de asimetría, la comprobación se hará considerando el 50 por 100 de los casos.

AUTOEVALUACION

En el paréntesis correspondiente escriba una V si el enunciado es verdadero o una F si el enunciado es falso.

1.

Las medidas de dispersión nos indican el valor con el cual se separan los

datos en relación a la media

( )

2.

La suma algebraica de las desviaciones es igual a cero

( )

3.

La desviación media nos ayuda al cálculo de (s) y (s2)

( )

4.

Al coeficiente de variación se lo puede representar en %

( )

En el siguiente conjunto de datos: 14,12,12,10,10,10,8,8,7

5.

La desviación media es 10.11

( )

6.

La varianza es 4.54

( )

7

La desviación típica es 2.13

( )

8.

El rango es 14

( )

9.

El rango semicuartílico es 7

( )

10. El símbolo de la varianza es s2 ( )

UNIDAD # 7.

Cuartiles, deciles y percentiles de una serie estadística simple y de frecuencias

Estas medidas son una generalización de la mediana, de tal forma que si la mediana

divide a la serie en dos partes iguales, los cuartiles la dividen en cuatro partes iguales,

los deciles en diez partes iguales, y los centiles en 100. Es decir.

CUARTILES (Q), divide la serie en 4 partes iguales (25 % c/u) DECILES (D), divide a la serie en 10 partes iguales (10 % c/u)

CENCILES o PERCENTILES (C) ¿ En cuánto dividirán a una serie estadística?

edu.red

Recuerde:En una distribución normal a partir de la mediana podemos dividir las series en partes iguales. La frecuencia acumulada bien obtenida nos facilita el cálculo respectivo. Por lo tanto tenga presente que la frecuencia acumulada es la suma de las frecuencias desde la menor variable. Estas medidas son muy utilizadas en medicina, educación, economía etc.

Para determinar los cuartiles, generalmente se calculan las frecuencias acumuladas y se busca el valor de la variable que ocupa la posición N/4 si es Q1 (cuartil 1), o 2N/4 si es Q2 (cuartil 2), o 3N/4 si es Q3 (cuartil 3).

De igual forma para determinar los deciles aplicamos el mismo procedimiento: El primer decil es el valor de la variable que ocupa la posición N/10. El segundo es el valor que ocupa la posición 2N/10 y así sucesivamente, hasta el noveno que es el valor que ocupa la posición 2N/10.

Ejemplo

edu.red

Siguiendo el proceso anterior , y si deseamos obtener el Q3, D7 y C48.

Tenemos, primero que obtener la frecuencia acumulada, luego la posición.

Así.

edu.red

¿ Q u e o p i n i ó n m e re c e n e s t a s m e d i d a s e n u n a s e r i e d e i n t e r v a l o s ?

El proceso para calcular los cuartiles, centiles o los percentiles es igual a los anteriores.

Es decir, se debe :

edu.red

Es decir, cuando tenemos una serie estadística de intervalos el cálculo de los cuartiles, deciles y centiles se lo hace de forma similar a la mediana, sus fórmulas son similares a esta medida.

Por ejemplo:

En una clínica de la ciudad de Loja, por medio de una encuesta se pregunto la edad a los enfermos, se tabulo la información y se obtuvieron los siguientes resultados.

edu.red

Determine;

a) El segundo cuartil b) El sexto decil

c) El centil 50

Desarrollo:

a) Primero encuentre la posición del cuartil 2

2 N/4 = 2.105/4 = 52.5

Este valor se localiza en la frecuencia acumulada (próximo mayor). Observamos que

el intervalo donde se encuentra este valor es (30 – 34 ) y para el calculo matemático se

emplea la fórmula.

edu.red

Quiere decir que Quiere decir que el 50 % de enfermos tienen una edad inferior a 30,75 años.

b) Calculamos la posición del 6 decil

6N/10 = 6.105/10 = 63

Este valor esta localizado en el mismo intervalo del cuartil 2, para su cálculo matemático se aplica la fórmula.

edu.red

edu.red

Es decir el 60% de los enfermos tienen edades inferiores a 33 año.

¿El cálculo del Cserá igual al de la mediana? Justifique su respuesta

AUTOEVALUACIÓN

1. En el paréntesis correspondiente escriba una C o una I si el enunciado es correcto o incorrecto.

a)

El cuartil 50 divide a la serie en dos partes iguales

(

)

b)

El decil 5 de la siguiente serie: 18,17,15,14,13,12 es 14

(

)

c)

El centil 50 de la serie anterior es 3.5

(

)

d)

El valor de la mediana es igual al cuartil 2

(

)

2. En los cuadros siguientes determine el valor correspondiente a las medidas anotadas

edu.red

Resumen…

Antes de desarrollar las actividades de las evaluaciones a distancia revise cuidadosamente los procesos, operaciones, cálculo en la obtención de cada una de estas medidas centrales y las de dispersión. Por lo tanto los siguientes ejercicios muestran el cálculo de estas medidas en los tres tipos de series que se nos puede presentar.

Para asegurarnos de llegar a resultados correctos aplique las fórmulas que plantea su texto básico y /o esta guía didáctica así comprobará que las soluciones obtenidas por Ud. son correctas o incorrectas. Una forma de operar en el cálculo sería por ejemplo:

a) Serie Simple Tipo(I)

edu.red

Medidas centrales

edu.red

edu.red

Mdn =N/2= 7/2 = 3.5(corresponde a 95) Mo ( No hay)

Medidas de dispersión

Rango = VM-Vm 98 – 92 = 6

b) Serie de frecuencias Tipo (II)

edu.red

Medidas centrales

edu.red

edu.red

Mdn=N/2= 40/2 = 20 17 Mo = 16

Para el Modo(a) observe en el cuadro que la mayor frecuencia es 12 y que corresponde a la variable 16. En cambio en el caso anterior no existe puesto que no hay casos que se repiten.

Medidas de dispersión

edu.red

Rango = VM-Vm 20 -15 = 5

c) Serie de intervalos o Tipo (III)

edu.red

edu.red

FÓRMULAS:

Medidas de tendencia central

edu.red

Medidadas de dispersión

edu.red

Resumen de las medidas de dispersión

Las cuatro pricipales medidas de dispersión son:

1. El recorrido. Es la menos estable de las cuatro medidas. Su utilización es limitada, excepto cuando se haya de actuar con rapidez, o en situaciones sencillas, como en la realización de una distribución de frecuencias.

2. La desviación media. Se puede utilizar, junto con la media, en una distribución normal. Hace tiempo, era un estadígrafo muy empleado, pero hoy en día se ha sustituido por la desviación típica.

3. La varianza es el cuadrado de la desviación típica

4. La desviación típica. Es el estadígrafo de dispersión más fiable y el que con más frecuencia se emplea. Está asociado a la media y se utiliza, en particular, en todo estudio o interpretación relacionado con la distribución normal. Como veremos, la desviación típica tiene muchas aplicaciones en toda la estadística moderna y es una de las herramientas más importantes de que se dispone.

Así mismo recuerde que las medidas de variabilidad permiten conocer la intensidad con que los valores se ubican alrededor de un valor medio. Para ello consideramos el cálculo de la mediana para estas medidas: ya sean cuartiles, deciles, percentiles.

Por ejemplo si queremos obtener el Cuartil 2.

Recurrimos a la fórmula:

edu.red

Lógico como podemos apreciar coincide este cuartil con el valor de la Mda.

FORMULARIO DE ESTADÍSTICA DESCRIPTIVA

edu.red

A o R = VM – Vm i = ls – li + 1 fr = f/N

edu.red

edu.red

S2 =

V=

Evaluación final de estadística descriptiva

CIENCIAS ADMINISTRATIVAS

NIVEL 2

FECHA: 28 DE MARZO 2009

PROFESOR: ING. GERARDO GONZÁLEZ M.

TEMAS:

  • 1. Como estadístico residente de Pigs and People (P & P) Airlines, el director de la división de análisis estadístico le pide recolectar y agrupar los datos sobre el número de pasajeros que han decidido viajar con P&P. Tales datos correspondientes a los últimos 50 días aparecen en la siguiente tabla.

68 71 77 83 79

72 74 57 67 69

50 60 70 66 76

70 84 59 75 94

65 72 85 79 71

83 84 74 82 97

77 73 78 93 95

78 81 79 90 83

80 84 91 101 86

93 92 102 80 69

  • a) Realice la tabla de distribución de frecuencia con 6 clases. ¿Está trabajando con datos continuos o discretos?

  • b) Construya un Histograma, Polígono de frecuencia y Ojiva

2) Su firma esta introduciendo un nuevo chip de computador del cual se promociona que realiza cálculos estadísticos mucho más rápidamente que los que actualmente se encuentran en el mercado. Se hacen 20 cálculos diferentes, produciendo los tiempos en segundos que se ven más adelante. Aunque usted no puede tergiversar su producto, usted desea presentar los resultados de la manera más favorable para su empresa. Determine la media, la mediana y la moda.

3.2 4.1 6.3 1.9 0.6 5.4 5.2 3.2 4.9 6.2

1.8 1.7 3.6 1.5 2.6 4.3 6.1 2.4 2.2 3.3

EVALUACION FINAL DE ESTADÍSTICA DESCRIPTIVA

CIENCIAS ADMINISTRATIVAS

NIVEL 2

FECHA: 19 DE JULIO 2009

PROFESOR: ING. GERARDO GONZÁLEZ M.

TEMAS:

58 76 89 45 67 34

64 76 34 65 45 39

79 74 56 71 85 87

74 38 69 79 61 71

69 62 56 38 69 79

71 54 31 69 62 39

65 79 47 46 77 66

55 75 62 57 77 36

73 72 64 69 51 50

40 50 74 61 69 73

  • c) Realice la tabla de distribución de frecuencia con n clases. ¿Está trabajando con datos continuos o discretos?

  • d) Construya un Histograma, Polígono de frecuencia y Ojiva

2) Su firma esta introduciendo un nuevo chip de computador del cual se promociona que realiza cálculos estadísticos mucho más rápidamente que los que actualmente se encuentran en el mercado. Se hacen 20 cálculos diferentes, produciendo los tiempos en segundos que se ven más adelante. Aunque usted no puede tergiversar su producto, usted desea presentar los resultados de la manera más favorable para su empresa. Determine la media, la mediana y la moda.

52 43 30 38 30 42 12 46 39 37

34 46 32 18 41 5

EVALUACION FINAL DE ESTADÍSTICA DESCRIPTIVA

CIENCIAS ADMINISTRATIVAS

NIVEL 2

FECHA: 19 DE JULIO 2009

PROFESOR: ING. GERARDO GONZÁLEZ M.

TEMAS:

  • 3. Los siguientes datos son los ingresos de 60 ejecutivos de marketing para empresas de Estados Unidos. Los datos están expresados en ,iles de dólares.

58 76 89 45 67 34

64 76 34 65 45 39

79 74 56 71 85 87

74 38 69 79 61 71

69 62 56 38 69 79

71 54 31 69 62 39

65 79 47 46 77 66

55 75 62 57 77 36

73 72 64 69 51 50

40 50 74 61 69 73

  • e) Realice la tabla de distribución de frecuencia con n clases. ¿Está trabajando con datos continuos o discretos?

  • f) Construya un Histograma, Polígono de frecuencia y Ojiva

2) Su firma esta introduciendo un nuevo chip de computador del cual se promociona que realiza cálculos estadísticos mucho más rápidamente que los que actualmente se encuentran en el mercado. Se hacen 20 cálculos diferentes, produciendo los tiempos en segundos que se ven más adelante. Aunque usted no puede tergiversar su producto, usted desea presentar los resultados de la manera más favorable para su empresa. Determine la media, la mediana y la moda.

52 43 30 38 30 42 12 46 39 37

34 46 32 18 41 5

 

 

 

 

 

Autor:

Carlos Alarcón

Partes: 1, 2, 3, 4
 Página anterior Volver al principio del trabajoPágina siguiente