Descargar

Distribución de frecuencias – Proceso de tabulación de la información (página 2)


Partes: 1, 2

  1. Escalas de medición:

Corresponde a la Situación 1, es decir, es una escala en que se establece un número determinado de clases o categorías de tal modo que cada elemento de la población pertenece a una y sólo una clase. Matemáticamente se dice que se ha establecido una relación de equivalencia entre los elementos de la población. Si sólo existen dos clases se denomina escala dicotómica. La única operación matemática que se puede realizar con las clases de cualquier escala nominal es determinar las cantidades de elementos que les corresponden determinar sus frecuencias.

Por ejemplo:

  • Sexo: las clases son masculino o femenino.
  • Especialidad: las diferentes especialidades (carreras) del CRUSAM.
  • Número de cedula de identidad personal.
  • Temperatura de una persona: sanguíneo, flemático, melancólico, colérico.
  • Número de placa de automóviles del país.
  1. Escala Nominal:

Corresponde a la Situación 1, es decir, es una escala en que se establece un número determinado de clases o categorías de tal modo que cada elemento de la población pertenece a una y sólo una clase. Matemáticamente se dice que se ha establecido una relación de equivalencia entre los elementos de la población. Si sólo existen dos clases se denomina escala dicotómica. La única operación matemática que se puede realizar con las clases de cualquier escala nominal es determinar las cantidades de elementos que les corresponden determinar sus frecuencias.

Por ejemplo:

  • Sexo: las clases son masculino o femenino.
  • Especialidad: las diferentes especialidades (carreras) del CRUSAM.
  • Número de cedula de identidad personal.
  • Temperatura de una persona: sanguíneo, flemático, melancólico, colérico.
  • Número de placa de automóviles del país.
  1. Escala Ordinal:

Corresponde a la Situación 2. Es una escala nominal entre cuyas clases está definido un orden, de modo que cualquiera que sean dos de ellas, una será mayor o superior, en algún sentido, que la otra.

Por ejemplo:

  • Evaluaciones en un examen: 5, 4, 3 y 2.
  • Grado de satisfacción de una necesidad: alto, medio, bajo
  • Conocimiento de un idioma: excelente, bien, regular, mal
  1. Escala de Intervalos:

Corresponde a la situación 3 y no es más que una escala ordinal con una distancia, una unidad de medida entre sus clases de modo tal que dado dos puntajes cualesquiera se puede saber cuan distante está uno del otro. La unidad de medida es arbitraria, pero común y el punto de inicio (cero) es también arbitrario.

Cuando se tiene una escala de intervalo se pueden realizar las operaciones de adición y sustracción, pero no necesariamente la multiplicación y división dentro de la escala.

Por ejemplo:

  1. Escala de Razones:

Corresponde a la situación 4 y es una escala de intervalos donde existe un cero absoluto que marca la ausencia total del atributo en estudio.La proporción entre los atributos de dos individuos cualesquiera es independiente de la escala de medida utilizada. En ella la razón entre dos clases (puntajes) cualesquiera permanece invariable ante toda la transformación de la escala de razón, o sea ante toda transformación del tipo y=Φ(x). De aquí que siempre el cero de la escala transformada coincide con el cero de la escala original.

En las escalas de razones es posible realizar todas las operaciones aritméticas con los puntajes.

Por ejemplo:

  • Estatura de los alumnos: la estatura en metros es proporcional a la estatura en pulgadas.
  • Peso de los alumnos: (en libras o kilogramos)
  • El tiempo invertido en una prueba de velocidad en educación física (en minutos o segundos).
  1. La representación de los datos: FRECUENCIAS.

Cuando se reúne gran cantidad de datos primarios es útil distribuirlos en clases y categorías y determinar las frecuencias de las clases, o sea, el número de elementos que pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente con las frecuencias de clases se denomina distribución de frecuencias

El caso que se describe a continuación, variables discretas se denomina distribución por conteo de valores individuales. Supongamos que un determinado colectivo, representado por la variable estadística Xi, que para mayor sencillez consideraremos como unidimensional; sean los datos de esta variable (representativo cada uno de ellos de un suceso) X1, X2, … , Xn (supuesto que sean n los valores de la variable considerada.)

Definiremos como frecuencia de un dato el número de veces que este aparece en el colectivo; consecuentemente, si una variable estadística toma r valores, cada uno de los cuales puede repetirse un cierto número de veces, podríamos decir que el número de datos representado por la variable serían N, siendo N la suma de las respectivas frecuencias de cada dato (N=ΣXi).

Este valor N será denominado como frecuencia total, mientras que la frecuencia de cada dato recibirá el nombre de frecuencia absoluta o simplemente frecuencia (fi). La frecuencia absoluta nos habla del número de veces que un dato aparece en un colectivo, más ello no nos dice demasiado en orden al establecimiento de comparaciones sobre la importancia de este dato. Para obtener una idea de la importancia que un dato posee en el seno de un colectivo, puesto que no es suficiente concepto de frecuencia, se utiliza el concepto frecuencia relativa, que se definirá como: el coeficiente entre la frecuencia absoluta del dato considerado y la frecuencia total (fr=fi/ΣXi).

Para efectos prácticos, asumiremos las siguientes definiciones de frecuencias:

  • frecuencias absolutas : es el número de veces que aparece en la muestra dicho valor de la variable y se representa por fi.
  • frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fri
  • frecuencias absoluta acumulada: para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular, en la tabla estadística) en orden ascendente (fa↑) o descendente (fa↓).
  • frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (N) y la denotaremos por fra.

Resumiendo lo expuesto, si Xi es un valor de la variable, podemos representar por fi a su frecuencia y por fi/ΣXi a su frecuencia relativa (siendo ΣXi=N o la frecuencia total). Para el conjunto de los valores de la variable Xi tendríamos, así la tabla #1, compresiva de la información sobre dicha variable, a través de las respectivas frecuencias:

Tabla #1: Variables Discretas

Valores de la variable Xi

(datos)

frecuencias absolutas

fi

frecuencias relativas

fi/N

X1

f1

f1/N

X2

f2

f2/N

Xn

fn

fn/N

Donde: N=Σfi y Σfi/N=1

Otro es el caso de las clases representadas en forma de intervalos, variables continuas, llamados intervalos de clases que poseen extremos llamados limite inferior y limite superior, Un intervalo se dice que es abierto o no cerrado, por un extremo si no contiene el límite correspondiente.

La longitud, tamaño o amplitud de un intervalo de clases (C) es la diferencia entre los limites superior e inferior (C=lim sup – lim inf). El Recorrido (R) es la diferencia entre el dato mayor y el menor del conjunto da datos en estudio (R=Xn – X1)

En el caso de variables continuas será necesario fijar intervalos de frecuencias para llegar a un resumen efectivo de la información original. A menudo es necesario representar una clase, o más particularmente, un intervalo por un único valor, este representará a todo el intervalo y se denominará marca de clases. Matemáticamente el punto medio de cada intervalo corresponde a lo que denominamos marca de clase, se denotará por Xi, y constituirá el valor representativo de cada intervalo. El número de observaciones que correspondan a cada intervalo se denominará frecuencias absolutas.

Tabla #2: Variables Continuas

Intervalos

(C)

Marcas de Clases

Xi

Frecuencias Absolutas

fi

X1-X2

X1

f1

X2-X3

X2

f2

Xn-1-Xn

Xn

fn

Donde

N = Σfi = Número de observaciones

C = X’ – X" = Amplitud del intervalo

Por último, en el caso de variables no mensurables, dicha tabla adoptará una forma como la siguiente:

Tabla #3: Variable Ordinales

Variable

Frecuencias

Característica A

fA

Característica B

fB

Característica Z

fZ

    1. Reglas Generales para construir las distribuciones de frecuencias por intervalos

    A = ( X1, X2, … , Xn )

  1. Efectuar el arreglo ordenado (Ascendente o Descendente) de la población o muestra
  2. Obtener la frecuencia absoluta mediante la tabulación o conteo de los datos (homogenizar los datos)

    R = (valor mayor – valor menor) = Xn – X1

  3. Encontrar el rango o recorrido (R) de los datos:
  4. Encontrar el número de clases o intervalos de clases (K). El número de clases debe ser tal que se evite el detalle innecesario, pero que no conduzca a la perdida de más información de la que puede ser convenientemente ignorada. Para este cálculo se utiliza la formula de Sturges

K = 1 + 3.322(log. N)

5- Determinar la amplitud de la clase ( C ):

R

C = ——–

K

Nota: el resultado siempre se aproxima al siguiente entero si excede al número entero obtenido, no importa el monto de la fracción excedida al entero

˜ C = se lee "se aproxima a…"

  1. El dato menor (X1) será el limite inferior de la primera clase. A él se le suma C y se obtiene el limite superior de la primera clase que también será el limite inferior de la segunda clase. Luego se suma nuevamente C y se obtiene el limite superior del segundo intervalo e inferior del tercero. Y así sucesivamente hasta que el limite superior corresponda o supere ligeramente el valor mayor ( Xn ), la cantidad de clases obtenidas deberá corresponder con el número K calculado mediante la formula de Sturges.
  2. Una vez construidos los intervalos se calculan, mediante tabulación de acuerdo a los limites inferiores y superiores de las clases, las frecuencias absolutas, relativas, porcentuales y acumuladas correspondientes.
  3. Con los datos obtenidos se procede a construir la tabla de distribución de frecuencia.
  1. Tabla de distribución de frecuencias.

Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla, que denominaremos distribución de frecuencias, en la que cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc.

Por tanto, llamaremos distribución de frecuencias a un agrupamiento de datos en clases acompañada de sus frecuencias: frecuencias absolutas, frecuencias relativa o frecuencia porcentuales. En caso de que las variables estén al menos en escala ordinal aparecen opcionalmente las frecuencias acumuladas absolutas, y frecuencias acumuladas porcentuales. Las distribuciones de frecuencias varían en dependencia si corresponden a una variable discreta o a una variable continua.

Ejemplo #1: Variable Continua:

La tienda CABRERA’S Y ASOCIADOS estaba interesada en efectuar un análisis de sus cuentas por comprar. Uno de los factores que más interesaba a la administración de la tienda era el de los saldos de las cuentas de crédito. Se escogió al azar una muestra aleatoria de 30 cuentas y se anotó el saldo de cada cuenta (en unidades monetarias) como sigue:

77.97 13.02 17.97 89.19 12.18 8.15 34.40 43.13 79.61 90.99

43.66 29.75 7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97

32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68

Solución:

  1. A= ( 7.42, 8.15, …, …, …, 90.99, 93.91 )

    donde: X1 = valor mínimo = 7.42

    Xn= valor máximo = 93.91

  2. Efectuar el arreglo ordenado de la población o muestra:

    R = valor mayor – valor menor = Xn – X1 = 93.91 – 7.42 = 86.49

  3. Encontrar el rengo o recorrido de los datos: "R"

    K=1+3.322(log N)

    Nota: en el ejemplo en estudio N=30 por cuanto que son 30 clientes en la muestra:

    K = 1 + 3.322 (log 30)

    = 1 + 3.322 (1.477) el log fue obtenido según calculadora

    = 1+ 4.9069

    = 5.9069 ~6 aproximado al siguiente entero

  4. Encontrar en número de clases "K" , según la fórmula de Sturges:
  5. Determinar la amplitud de la clase: "C"

Nota: obsérvese que se va a trabajar con una cifra significativa más cómoda, o sea como los datos están dados en centésimos, se calculo C hasta los milésimos para evitar que algún dato coincida con el límite de clases

Clases

P.M.

Xi

fi

fr

fa↓

fa↑

fra↓

fra↑

7.420 – 21.835

14.628

10

0.33

10

30

0.33

1.00

21.835 – 36.250

29.043

4

0.13

14

20

0.46

0.67

36.250 – 50.665

43.458

5

0.17

19

16

0.63

0.54

50.665 – 65.080

57.873

3

0.10

22

11

0.73

0.37

65.080 – 79.495

72.288

3

0.10

25

8

0.83

0.27

79.495 – 93.910

86.703

5

0.17

30

5

1.00

0.17

Total

XXX

30

1.00

XXX

XXX

XXX

XXX

Simbología utilizada:

XI = Punto medio o marca de clases

fi = frecuencia absoluta

fr = frecuencia relativa

fa↓ = frecuencia absoluta acumulada descendente

fa↑ = frecuencia absoluta acumulada ascendente

fra↓ = frecuencia relativa acumulada descendente

fra↑ = frecuencia relativa acumulada ascendente

Nota:

  1. Obsérvese que el límite inferior de la primera clase es el valor mínimo ( X1=7.42 ) y el límite superior es el resultado de X1+C = 7.42+14.415 = 21.835.
  2. El límite inferior de la siguiente clase es igual al límite superior de la clase anterior y el límite superior es el resultado de adicionarle nuevamente la amplitud de la clase ( C ).
  3. Obsérvese que el límite superior de la última clase es igual al valor mayor ( Xn=93.91 )
  1. Representaciones Gráficas de la Distribución de Frecuencias

  1. Los Cuadros estadísticos:

La estadística es una disciplina que nos enseña a organizar los datos recogidos para poder analizar sus características y posteriormente inferir, a partir de las muestras tomadas, las características de la población investigada. Los cuadros o tablas corresponden a arreglos sistemáticos de los datos por filas y columnas y son un buen complemento del texto en los informes

El primer procedimiento estadístico consiste en tabular los datos según el tipo de escala de medición utilizada. La tabulación de los datos conlleva a representar la información a través de tablas que de forma general contiene las siguientes partes fundamentales:

  1. Numeración (siempre que se presenten dos o más cuadros)

  2. Título: es la descripción que precede al cuadro, la cuál deberá estar redactada en forma breve y clara, de tal manera que exprese su contenido, siguiendo el ordenamiento del mismo. Es necesario abarcar las características: Qué, Dónde, Cómo y Cuándo
  3. Encabezamiento: se refiere al número de atributos o variables que se quieren representar en el cuadro y se anotan como denominaciones de las columnas y subcolumnas; puede ser unidimensional, bidimensonial o multidimensional. Los títulos de las columnas van en mayúsculas y los subtítulos en minúsculas
  4. Cuerpo: es el conjunto de columnas y líneas que contiene el cuadro en orden vertical y horizontal, donde se colocan los datos sobre los hechos observados
  5. Pie: se refiere a la información adicional necesaria a saber: notas, llamadas, fuentes de información y otras. Se anotan en el espacio debajo de la línea inferior que limita el cuerpo del cuadro.
  1. Los Gráficos Estadísticos:

El gráfico es quizás el auxiliar más valioso y utilizado para expresar datos estadísticos, este elemento no le añade novedad a las tablas o cuadros estadísticos, es de fácil comprensión y accesible a un número mayor de usuarios. El gráfico además de expresar visualmente los hechos más importantes de la información numérica, permite una mejor y más fácil comprensión y ahorra tiempo y esfuerzo en el análisis de datos estadísticos al facilitar su apreciación visual en forma conjunta:

-Histogramas de frecuencias:

Un histograma es un gráfico que sirve para representar una distribución de frecuencias. Este gráfico está formado por un conjunto de rectángulos (caso de variables continuas) que tienen como base un eje horizontal (generalmente el eje de las abscisas o de las X), y como centro los puntos medios de las clases. Los anchos de las clases y las áreas de los rectángulos son proporcionales a las frecuencias de las clases. En el caso de las variables discretas el gráfico consiste de un conjunto de barras verticales en lugar de rectángulos, hallándose cada barra sobre la observación respectiva y con una altura proporcional a la frecuencia de la observación

– Polígono de frecuencias:

El polígono de frecuencias es un gráfico formado por líneas quebradas, que tiene los centros de las clases representadas en un eje horizontal (eje de las X) y las frecuencias de las clases en un eje vertical (eje de las Y). La frecuencia correspondiente a cada centro de clase se señala mediante un punto y luego los puntos consecutivos se unen por líneas rectas. Del correspondiente histograma se puede lograr el polígono de frecuencia uniendo los puntos medios de las bases superiores de cada rectángulos mediante líneas rectas.

-Ojivas:

Las ojivas se refieren a los gráficos que se construyen utilizando una distribución acumulativa de frecuencias, el orden de acumulación se aplica al cuadro de distribución de frecuencia y puede ser descendente (fa↓, fra↓) o ascendente (fa↑, fra↑). La figura que se forma al unir los puntos del polígono de frecuencias acumulativas es lo contrario del orden anunciado (por ejemplo si se utilizó el orden descendente en la acumulación de los datos en el cuadro, la ojiva resulta ser ascendente).

LABORATORIO

(Resolver y entregar en grupos de tres estudiantes, equivalen a nota de un parcial)

Problema #1: Variable Continua

En la siguiente tabla se presentan los pesos de 40 estudiantes de la Universidad de Panamá, con una aproximación de una libra.

138

164

150

132

144

125

149

157

146

164

140

147

136

148

152

144

168

126

138

176

163

118

154

165

146

173

142

147

135

153

140

135

161

145

135

142

150

156

145

126

  1. Construya una tabla de distribución de frecuencias, indicando las frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas.
  2. Construya un histograma, un polígono de frecuencias y una ojiva de la distribución.

Problema #2: Variable Discreta:

Una encuesta entre un grupo de madres-solteras, para analizar los problemas económicos que enfrentan, en determinada comunidad; arrojó los siguientes resultados acerca del número de niños en el hogar.

1

4

2

3

5

3

5

3

3

5

1

1

2

1

4

1

2

1

4

1

2

1

1

2

1

2

3

2

3

3

3

1

3

4

1

1

3

5

4

2

2

5

1

4

2

3

1

2

5

1

  1. Construya una tabla de distribución de frecuencias y sus respectivas representaciones gráficas.

Problema #3:

Una compañía de transmisiones electrónicas registro como sigue el número de recibos de servicios prestados por cada una de sus 20 sucursales en el último mes:

808

641

628

731

641

446

342

545

910

568

335

459

727

848

229

347

309

649

575

757

La compañía piensa que una tienda realmente no puede esperar alcanzar financieramente el punto de equilibrio con menos de 456 servicios prestados mensualmente. Además su política es dar un bono financiero al gerente que genere más de 683 servicios al mes. Disponga los datos en una arreglo e indique cuántas sucursales no están consiguiendo el punto de equilibrio y cuántas ganan el bono.

Problema #4:

Una agencia de viajes ofrece precios especiales en ciertas travesías por el Caribe. Planea ofrecer varios de estos paseos durante la próxima temporada invernal en el hemisferio norte y desea enviar folletos a posibles clientes. A fin de obtener el mayor provecho por cada unidad monetaria gastada en publicidad, necesita la distribución de las edades de los pasajeros de travesías anteriores. Se consideró que si participaban pocas personas de un grupo de edad en los paseos no sería económico enviar un gran número de folletos a personas de ese grupo de edad. La agencia seleccionó una muestra de 40 clientes anteriores de sus archivos y se registró sus edades, como sigue:

77

18

63

84

38

54

50

59

54

56

36

50

50

34

44

41

58

58

53

62

62

43

52

53

63

62

62

61

61

52

60

60

45

66

83

63

63

58

61

71

  1. Organice los datos en una tabla de distribución de frecuencias de las edades de los clientes en la muestra
  2. ¿Cuál grupo de edad presenta la mayor frecuencia relativa? ¿Cuál la menor frecuencia relativa?.
  3. Saque conclusiones que puedan ayudar a la agencia a planear una campaña de publicidad para los paseos invernales.

BIBLIOGRAFÍA

Caballero , Wilfredo Introducción a la Estadística

Serie Libros y Materiales Educativos N° 28

I edición. San José, Costa Rica

IICA, 1981

Carrasquilla E. Pedro Manual para la confección de gráficos estadístico

DEC-CGR, Dirección de Estadísticas y Censos

Panamá. República de Panamá.

DEC-CGR Manual para la elaboración y publicación de

Cuadros estadísticos (tercera edición)

Dirección de estadística y Censos.

Panamá. República de Panamá.

Nuñez del Benavente Estadística básica para planificación. 6ta.edición

Arturo Siglo XX! Editores S.A,

México. 1977

 

 

 

Autor:

Francisco Antonio Cabrera González

f_cabrera51[arroba]hotmail.com

Graduado en mayo de 1980 de Economista-Organizador de la Producción Agrícola y Master en Ciencias Económicas en la Academia Agrícola K. A. Timiriazev de Moscú –Rusia.

Profesor de la Universidad de Panamá desde 1981. Ha ejercido la docencia universitaria en los Centros Regionales de Azuero (Chitré), Los Santos, Veraguas, Coclé y San Miguelito. Catedratico (Profesor Regular) desde 1991 del Departamento de Estadística Económica y Social de la Facultad de Economía.

En su vida universitaria, como docente, ha sido representante de los profesores del CRU-Azuero (Chitré) ante el Consejo General Universitario -CGU (1990-1992), Vicepresidente de la Asociación de Profesores de la Universidad de Panamá –APUDEP (1991-1993), Presidente de la APUDEP (1993-1995), Director del Centro Regional Universitario de San Miguelito –CRUSAM (1995-2000) y en la actualidad es docente investigador de la Universidad de Panamá.

UNIVERSIDAD DE PANAMÁ

CENTRO REGIONAL UNIVERSITARIO DE SAN MIGUELITO

FACULTAD DE ECONOMÍA

DEPARTAMENTO DE ESTADÍSTICA ECONÓMICO Y SOCIAL

Curso: Est.115 : "Estadística Económica I".

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente