Distribución de frecuencias para datos agrupados en intervalos
Enviado por Mario Orlando Suárez Ibujes
- Introducción
- Reglas generales para formas distribuciones de frecuencias para datos agrupados en intervalos
- Ejemplo ilustrativo
- Referencias bibliográficas
INTRODUCCIÓN
Las distribuciones de frecuencias son tablas que resumen los datos originales en frecuencias.
Los tipos de frecuencia pueden ser:
– Frecuencia Absoluta (f).- Es el número de veces que se repite el valor de cada variable. La suma de frecuencias absolutas es siempre al total de datos observados.
– Frecuencia Relativa (fr).- Indica la proporción con que se repite un valor. Es el cociente entre la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es siempre 1
– Frecuencia Acumulada (fa).- Indica el número de valores que son menores o iguales que el valor dado. Es la suma de la frecuencia absoluta primera con la segunda, este valor con la tercera, y así sucesivamente.
– Frecuencia Porcentual (f%).- Llamada también frecuencia relativa porcentual. Se obtiene multiplicando la frecuencia relativa por 100. La suma de las frecuencias porcentuales es siempre 100%. Se calcula así:
– Frecuencia Relativa Acumulada (fra).- Es la suma de la frecuencia relativa primera con la segunda, este valor con la tercera, y así sucesivamente.
– Frecuencia Relativa Acumulada Porcentual (fra%).- Indica el número de valores que son menores o iguales que el valor dado. Se obtiene multiplicando la frecuencia relativa acumulada por 100. Se calcula así:
REGLAS GENERALES PARA FORMAS DISTRIBUCIONES DE FRECUENCIAS PARA DATOS AGRUPADOS EN INTERVALOS
Cuando los datos contienen una gran cantidad de elementos, para facilitar los cálculos es necesario agruparlos, a estos grupos se los llama intervalos o clases. Un intervalo es una serie de números incluidos entre dos extremos, así por ejemplo, el intervalo 40 – 45 está formado por 40, 41, 42, 43, 44 y 45, siendo 40 el límite inferior, 45 el límite superior, 39,5 límite real inferior (límite inferior disminuido en 5 décimas) y 40,5 el límite real superior (límite superior aumentado en 5 décimas).
Las reglas generales para formas distribuciones de frecuencias para datos agrupados en intervalos son:
1) Calcule el Rango (R).- También se llama recorrido o amplitud total. Es la diferencia entre el valor mayor y el menor de los datos.
2) Seleccione el Número de Intervalos de Clase (ni).- No debe ser menor de 5 y mayor de 12, ya que un número mayor o menor de clases podría oscurecer el comportamiento de los datos. Para calcular el número de intervalos se aplica la regla de Sturges:
Siendo n el tamaño de la muestra.
3) Calcule el Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el número de intervalos
Cuando el valor de i no es exacto, se debe redondear al valor superior más cercano. Esto altera el valor de rango por lo que es necesario efectuar un ajuste así:
Por ejemplo:
Si una distribución de 40 datos el valor mayor es 41 y el menor es 20 se tiene:
Calculando el Rango se obtiene:
Calculando el número de intervalos se obtiene:
Calculando el ancho se obtiene:
Redondeando se obtiene: i = 4
Calculando el nuevo rango se obtiene:
El exceso de 3 que se tiene en este caso se distribuye entre xmáx y xmín. Por lo general se agrega al mayor y se quita al menor. Como por ejemplo, se podría agregar 2 al valor mayor y quitar 1 al valor menor, obteniéndose los siguientes nuevos valores:
O también se podría agregar 1 al valor mayor y quitar 2 al valor menor, obteniéndose los siguientes nuevos valores:
4) Forme los Intervalos de Clase agregando i-1 al límite inferior de cada clase, comenzando por el Xmín del rango.
5) Se realiza el Conteo de Datos que cae dentro de cada clase (frecuencia absoluta)
6) Calcule la Marca de Clase (xm).- Es el valor medio de cada clase, se obtiene sumando los límites superior (Ls) e inferior (Li) del intervalo y dividiendo ésta suma entre 2
7) Calcule las Frecuencias
EJEMPLO ILUSTRATIVO
A 40 estudiantes se les pidió que estimen el número de horas que habrían dedicado a estudiar la semana pasada (tanto en clase como fuera de ella), obteniéndose los siguientes resultados:
36 | 30 | 47 | 60 | 32 | 35 | 40 | 50 |
54 | 35 | 45 | 52 | 48 | 58 | 60 | 38 |
32 | 35 | 56 | 48 | 30 | 55 | 49 | 39 |
58 | 50 | 65 | 35 | 56 | 47 | 37 | 56 |
58 | 50 | 47 | 58 | 55 | 39 | 58 | 45 |
Solución:
1) Calculando el Rango se obtiene:
2) Calculando el número de intervalos se obtiene:
3) Calculando el ancho se obtiene:
Redondeando se obtiene: i = 6, por lo que es necesario realizar un ajuste al rango.
Los cálculos realizados en Excel se muestran en la siguiente figura:
4) Calculando el nuevo rango se obtiene:
El exceso de 1 que se tiene en este caso se distribuye entre xmáx y xmín. En este ejemplo, se podría agregar 1 al valor mayor y no quitar nada al valor menor, o no agregar nada al mayor y quitar 1 al menor. Al elegir la primera opción se obtiene:
5) Formando los intervalos de clase agregando i-1 (6-1=5) al límite inferior de cada clase, comenzando por el Xmín del rango se obtiene:
30+5 = 35; 36+5 = 41; 42+5 = 47; 48+5 = 53; 54+5 = 59; 60+5 = 65
6) Realizando el conteo de datos que cae dentro de cada clase, calculando la marca de clase y las frecuencias se obtiene:
Clases | f | xm | fr | fa | f% | fra | fra% | |||
30-35 | 8 | (30+35)/2 = 32,5 | 0,2 | 8 | 20 | 0,2 | 20 | |||
36-41 | 6 | (36+41)/2 = 38,5 | 0,15 | 14 | 15 | 0,35 | 35 | |||
42-47 | 5 | (42+47)/2 = 44,5 | 0,125 | 19 | 12,5 | 0,475 | 47,5 | |||
48-53 | 7 | (48+53)/2 = 50,5 | 0,175 | 26 | 17,5 | 0,65 | 65 | |||
54-59 | 11 | (54+59)/2 = 56,5 | 0,275 | 37 | 27,5 | 0,925 | 92,5 | |||
60-65 | 3 | (60+65)/2 = 62,5 | 0,075 | 40 | 7,5 | 1 | 100 | |||
Total | 40 | 1 | 100 |
A continuación se presenta algunas interpretaciones de la tabla:
El valor de f =8: Significa que 8 estudiantes dedicaron a estudiar la semana pasada entre 30 y 35 horas.
El valor de xm = 50,5: Significa que 7 estudiantes dedicaron en promedio a estudiar la semana pasada 50,5 horas.
El valor de fr = 0,15 y f% = 15%: Significa que el 0,15 o el 15% de los estudiantes dedicaron a estudiar la semana pasada entre 36 y 41 horas.
El valor de fa = 26: Significa que 26 estudiantes dedicaron a estudiar la semana pasada entre 30 y 53 horas.
El valor de fra = 0,65 y fra% = 65%: Significa que el 0,65 o el 65% de los estudiantes dedicaron a estudiar la semana pasado entre 30 y 53 horas.
Para realizar los cálculos de la frecuencia absoluta empleando Excel se procede de la siguiente manera:
a) Digite los datos, las clases y límites superiores de las clases. Seleccione C8:C13 donde las frecuencias absolutas deben ser calculadas. Escriba la fórmula: =FRECUENCIA (A1:H5; B8:B13)
b) Presione CTRL+SHIFT+ENTER
Los cálculos de la marca de clase y de las otras frecuencias empleando Excel se muestran en la siguiente figura:
REFERENCIAS BIBLIOGRÁFICAS
DAZA, Jorge, (2006), Estadística Aplicada con Microsoft Excel, Grupo Editorial Megabyte, Lima, Perú.
SUÁREZ, Mario, (2011), Interaprendizaje de Estadística Básica,
TAPIA , Fausto Ibarra, Ecuador.
SUÁREZ, Mario, (2004), Interaprendizaje Holístico de Matemática, Ed. Gráficas Planeta,
Ibarra, Ecuador.
Autor:
Mario Suarez