TOTAL | 2610 |
? Ordenación de datos en tablas de frecuencia
Para mayor comodidad en el análisis y extracción de conclusiones es primordial proceder al ordenamiento de los datos:
? Amplitud Total o Recorrido de la Variable (a). Es la diferencia que se establece entre el valor mayor XM y el valor menor Xm, más uno, es decir:
a = (XM – Xm) + 1
|
? Intervalo de Clase (i). A los números extremos y los incluidos en ellos forman el intervalo de clase: 16-20 está formado por 16, 17, 18, 19, 20. Los números extremos constituyen los límites de clase: en el intervalo 16-20, significa que empieza en 16 y termina en 20. Aclaramos que estos límites no son reales, ya que, el intervalo 16-20 varía desde 15,5 hasta 20,5 que son los límites verdaderos en su orden, al primero se llama límite real inferior (Li) y al segundo límite real superior (Ls). A la diferencia de los límites reales se denomina tamaño o ancho del intervalo, es decir:
I = Ls – Li |
En una serie estadística, el ancho del intervalo es un número entero supuesto, de preferencia impar, a efecto de que su marca de clase sea un entero.
? Marca de Clase (Xm). Se denomina al valor medio de cada intervalo; es decir, del ejemplo de intervalo quedaría así:
Li + Ls Xm = ———- 2 |
? Número de Intervalo (ni) es un número entero que representa la totalidad de clases. La fórmula que define al número de intervalos es:
A ni = —– + 1 i |
NOTA: El número conveniente de intervalos oscila entre 3 y 15 para evitar la concentración y dispersión de las frecuencias, en este orden.
? Ejercicio de Aplicación
En una clase de 39 alumnos se han obtenido estas calificaciones en la asignatura de Estadística:
16 | 17 | 18 | 15 | 15 | 12 | 12 | 19 | 14 | 13 | 19 |
14 | 17 | 13 | 09 | 14 | 11 | 06 | 09 | 14 | 13 | 11 |
09 | 12 | 05 | 05 | 12 | 04 | 09 | 14 | 14 | 07 | 13 |
10 | 17 | 14 | 09 | 13 | 15 |
|
|
|
|
|
¿Determinar la amplitud (a) y el número de intervalos, si el ancho (i) se decide que sea 3?
AMPLITUD
Se encuentra el Valor mayor XM = 19
Luego encontramos el valor menor Xm = 04
Como:
A = (XM – Xm) + 1 (19 – 4) + 1 = 15
NUMERO DE INTERVALOS
ni = a / i + 1 15 / 3 ) + 1 = 5,0 + 1 = 6,0
? Tabulación de datos. Es el proceso que ordena el material agrupando en forma conveniente:
? Serie estadística, constituye un conjunto de valores de una variable ordenada ascendente o descendentemente:
? Serie estadística de frecuencias. Es el ordenamiento de la variable ascendente o descendentemente, pudiendo repetirse algunos valores, mismos deben exponerse en tablas.
PROCESO
1. Se ordena la variable en forma ascendente (o descendente)
2. Se escribe en tablas los datos repetidos mediante rayas horizontales o verticales.
3. Se suma el número de rayas, para formar la columna de las frecuencias.
Ejemplo de peso de ganado vacuno, en arrobas:
Ordenación de datos y determinación de frecuencia
X (Descendente) | VALOR QUE SE REPITEN | Frecuencia |
19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 | / // /// / // ////// ///// //// // // /////
/ / // / | 1 2 3 1 2 6 6 4 2 2 5 0 1 1 2 1 |
TOTAL |
|
?f = 39 |
? Serie Estadística de Intervalos. Es el ordenamiento de valores en forma ascendente o descendente, de acuerdo a los intervalos de clase que han sido previamente establecidos.
PROCESO
1. Encontramos la amplitud o recorrido (a)
2. Proponemos el ancho del intervalo (i)
3. Calculamos el número de intervalo (ni)
4. Construimos la columna de los intervalos, de modo que el límite superior del primer intervalo sea el mayor valor de la variable. A este límite se resta el ancho del intervalo y se le agrega 1, obteniendo el límite inferior, quedo así el primer intervalo.
5. El segundo intervalo se obtiene restando el ancho del intervalo a los límites del primero, y así sucesivamente.
6. En el último intervalo debe incluirse el menor valor de la variable.
7. Efectuamos la ubicación y el conteo de los valores repetidos.
8. Construimos la columna de frecuencias.
Ejemplo.
El peso en kilogramos de 75 cerdos, luego de haber administrado una ración alimenticia, es:
Desarrollo
1. Encontramos la amplitud o recorrido (a); como tenemos XM = 79 y Xm = 34 Entonces aplicamos la formula.
a = (XM – Xm) + 1 = (79 – 34 )+ 1
a = 46
2. Proponemos que el ancho de intervalo sea i = 5
3. Se calcula el Número de Intervalo; con la amplitud que es a = 46 y el intervalo que es i = 5
ni = (a / i) + 1 ni = (46 / 5) +1 ni = 10,2 ? 10
4. Construimos la columna de los intervalos; Si el límite superior del primer intervalo es 79 (ls), entonces:
li = (ls – i) + 1 = (79-5) + 1 = 75, por tanto, primer intervalo (79-75).
El Segundo Intervalo (74-70);
El Tercer Intervalo (69-65)
El Cuarto Intervalo (64-60)
El Quinto Intervalo (69-65)
5. En el último conteo se debe incluir el valor menor de la variable entonces queda así: El Ultimo Intervalo (34- 30)
6. Ubicación y conteo de los valores repetidos y señalamos con rayas.
7. Cconstrucción de la columna de las frecuencias en forma descendente, haciendo corresponder a cada intervalo una frecuencia.
Ordenación de datos y número de datos repetidos (F) por intervalo
X (en intervalos) |
Valores que se repiten |
F |
75 – 79 70 – 74 65 – 69 60 – 64 55 – 59 50 – 54 45 – 49 40 – 44 35 – 39 30 – 34 | /
///// //// //////// /////////////// ////////////////////// /////////// //////// / | 01 00 05 04 08 15 22 11 08 01 |
TOTAL |
| ? f = 75 |
? Frecuencia Acumulada o Efectivos Acumulados
Efectivo acumulado o frecuencia acumulada es la suma de las frecuencias a partir del menor valor de la variable. La tabla anterior queda de esta forma con las frecuencias o efectivos acumulados.
Representación de la frecuencia acumulada
X |
F |
Fa |
75 – 79 70 – 74 65 – 69 60 – 64 55 – 59 50 – 54 45 – 49 40 – 44 35 – 39 30 – 34 |
01 00 05 04 08 15 22 11 08 01 |
75 74 74 69 65 57 42 20 9 1 |
TOTAL |
? f = 75 |
|
Desarrollo:
Empezamos por la última frecuencia del último intervalo así:
1 = 01
(1+8) = 09
(9+11) = 20
(20+15) = 42
(35+22) = 57
(57+8) = 65
(65+4) = 69
(69+5) = 74
(74+0) = 74
(74+1) = 75
? Frecuencia Relativa (Fr)
Frecuencia relativa es la relación entre la frecuencia de la variable y el número total de casos (N), es decir:
Fr. = f / N
|
La suma de las frecuencias relativas siempre es igual a 1
Ejemplo:
Determine la columna de frecuencia relativa de la distribución del peso en un ejemplo de 120 toretes.
Obtención de la frecuencia relativa
Peso en Kg. |
f |
Fr |
48 53 58 63 68 73 |
08 23 48 34 05 02 |
0,067 0,192 0,400 0,283 0,042 0,017 |
TOTAL | ?F= 120 | 1,000 |
Desarrollo:
Numero de casos N = 120
Fórmula fr = f / N
Primer caso para 48 Kg. fr = 8 / 120 = 0,067
Segundo caso para 53 Kg. fr = 23 / 120 = 0,192
Etc…
? Porcentaje de las Frecuencias (P %)
El porcentaje de la frecuencia es el valor que corresponde a cada frecuencia y que está dado por cada 100 casos de un hecho investigado. Su fórmula es:
P = (f *100) / N
|
Es decir P es igual al producto de la frecuencia por 100 dividido para el número total de casos N.
La suma de los porcentajes de las frecuencias relativas siempre es igual a 100
Ejemplo
Calcular el porcentaje de las frecuencias de la distribución del ejemplo anterior.
Determinación del porcentaje de frecuencias
Peso en Kg. | F | P(%) |
48 53 58 63 68 73 |
08 23 48 34 05 02 |
06,67 19,17 40,00 28,33 04,17 01,67 |
TOTAL | ?F= 120 | 100,00 |
Desarrollo:
Numero de casos N = 120
P = (f * 100) / N
P = (8 * 100)/120 P = 6,67
P = (23 * 100)/120 P = 19,67
P = (48 * 100)/120 P = 40,00
P = (2 * 100)/120 P = 1,67
? Porcentaje de las Frecuencias Acumuladas (Pa)
Este porcentaje se lo determina a través de la fórmula:
Pa = (fa * 100) / N
|
El límite superior siempre es igual al 100%
Ejemplo:
Determine los porcentajes de las frecuencias de la distribución del ejemplo anterior.
Determinación del porcentaje de frecuencias acumuladas
Peso en Kg. | F | Fa | Pa | |
48 53 58 63 68 73 | 08 23 48 34 05 02 | 08 31 79 113 118 120 | 06,67 25,83 65,83 94,17 98,33 100,00 | |
TOTAL | ?F=120 |
|
|
Desarrollo:
4.3.2. Métodos Gráficos
Las gráficas de distribución de frecuencia, son útiles porque ponen de relieve y aclaran las tendencias que no se captan fácilmente en las tablas. Atraen la atención del lector sobre las tendencias de los datos, las gráficas nos ayudan además a resolver los problemas concernientes a las distribuciones de frecuencias, estimar algunos valores con una simple observación y nos brindan una verificación gráfica de la veracidad de nuestras soluciones.
Las gráficas que se describen: Diagrama de Barras, Diagrama de Puntos, Histogramas, Polígonos de Frecuencias, Ojivas o Polígono de Frecuencia Acumulada, Diagrama de Sectores.
? Diagramas de barras
Se lo utiliza para representar datos de una variable continua y está constituido por rectángulos o barras cuyas áreas son proporcionales a los datos de un fenómeno. Para su construcción se debe tener en cuenta:
Una escala adecuada
El ancho de las barras debe ser uniforme
La distancia entre las barras tiene que ser constante
Los diagramas de barras mas utilizados son:
a) Diagrama de barras verticales
b) Diagramas de barras horizontales
c) Diagrama de barras compuestas
a.) Diagramas de barras verticales
Consiste en un conjunto de rectángulos que están ubicados en el primer cuadrante de un sistema de coordenadas. En el eje de las abscisas se ubican las variables y en el eje de las ordenadas se ubica la frecuencia.
Ejemplo:
Representar en diagramas de barras verticales el número de ovinos de Granjas Experimentales de la Provincia de Loja.
GRANJAS | FRECUENCIA | |
Granja La Argelia Granja Punzara Granja El Padmi Granja El Ceibo Granja Nueva Esperanza Granja Zapotillo Granja Zapotepamba
| 780 580 250 120 300 240 340 | |
TOTAL | 2610 |
b.) Diagrama de barras horizontales
En este tipo de diagrama, en el eje de las abscisas se ubican las frecuencias y en el de las ordenadas se ubican las variables.
Ejemplo:
Con los datos de la tabla anterior, representada la gráfica en barras horizontales tenemos así:
c.) Diagrama de barras compuestas
Se lo utiliza para representar dos series de datos y así poder efectuar comparaciones.
Para representar mediante este diagrama seguimos los siguientes pasos:
1. Sumamos las frecuencias de las dos series
2. Utilizamos el primer cuadrante del sistema de coordenadas para representar las variables en el eje de las abscisas y las frecuencias en el eje de las ordenadas.
3. Representamos en cada una de las barras el total de las frecuencias de las dos series
4. Ubicamos en cada una de las barras las frecuencias de cada una de las variables.
5. Si se trata de una serie estadística de intervalos, ubicamos los puntos medios de cada intervalo en el eje de las abscisas.
Ejemplo:
Representar en barras compuestas las calificaciones del Módulo III, del centro de apoyo de Loja y de Ambato, de la Carrera en Administración y Producción Agropecuaria:
CALIFICACIONES | LOJA | AMBATO | TOTAL | ||
20 19 18 17 16 15 14 13 12 | 3 5 6 5 7 10 4 2 1 | 6 3 5 8 9 3 6 1 2 | 9 8 11 13 16 13 10 3 3 | ||
TOTAL | 43 | 43 | 86 |
d.) Diagrama de Puntos
Sirven para presentar gráficamente tablas en las cuales se consideran únicamente una variable y una cantidad asociada a cada valor de la misma.
A continuación presentamos dos tipos de diagramas de puntos. Los dos muestran esencialmente la misma información, sólo que en diferente forma y con diferente propósito. La construcción de estos diagramas se describe enseguida:
a) El primer tipo de diagrama de puntos se construye colocando en el eje horizontal los valores de la variable (los cuales en muchos casos son arbitrarios) y en el eje vertical las cantidades asociadas a éstos. Finalmente, para cada valor de la variable y cada cantidad asociada se dibujan puntos cuya altura corresponde a la magnitud de dicha cantidad.
b) Para construir el segundo tipo de diagramas de puntos se colocan en el eje horizontal los valores de la variable y sobre cada valor se dibujan tantos puntos como veces aparezcan éstos.
Ejemplo:
Para ilustrar la construcción del primer tipo de diagrama de puntos consideremos los datos, Número de estudiantes de la Carrera en Administración y Producción Agropecuaria en los centros de apoyo:
Con objeto de simplificar la presentación, primero identificaremos a cada Centro de apoyo con un número; así, por ejemplo, Loja, se identificará con el número 1, Quito con el número 2, y así sucesivamente. Hecho lo anterior, tendremos que la variable en cuestión corresponde a los diferentes Centros de Apoyo (X) y los valores numéricos que pueden tomar son 1, 2, … las cantidades asociadas a estos números son los totales de estudiantes. A continuación se presenta la gráfica resultante:
Con los datos del siguiente cuadro estadístico, los mismos que representan el número de alumnos de la Carrera en Administración y Producción Agropecuaria en los centros de apoyo:
Número de estudiantes de la Carrera en Administración y Producción Agropecuaria en los centros de apoyo:
CENTROS DE APOYO |
| TOTAL ESTUDIANTES | ||||||
Loja Quito Ambato Santo Domingo Zapotillo
| (1) (2) (3) (4) (5) | 136 120 90 42 62 | ||||||
TOTAL |
| 450 |
CENTROS DE APOYO
Diagrama de puntos que corresponde a los totales de la Carrera en Administración y Producción Agropecuaria en los centros de apoyo:
e.) Histograma
Llamaremos Histograma a la gráfica de barras verticales sin espaciamiento entre ellas, construida colocando en el eje vertical a las frecuencias absolutas o relativas y en el eje horizontal a los límites de clase de una tabla de frecuencias. Lo anterior implica que si los intervalos de clase son iguales, sobre cada clase se erigen rectángulos cuyas áreas son proporcionales a las frecuencias de clase. Las etapas que se deben cubrir en la construcción de un histograma son las siguientes:
1. Colocar en el eje horizontal a los límites de clase.
2. En el eje vertical las frecuencias
3. Dibujar rectángulos cuya base son las clases y su altura las frecuencias que corresponden a cada clase.
Clase | F |
(30 – 40) (40 – 50) (50 – 60) (60 – 70) (70 – 80) (80 – 90) (90 – 100)
| 01 04 09 05 27 32 07 |
TOTAL | 85 |
30 40 50 60 70 80 90 100
Límites de clase (calificaciones)
f.) Polígono de Frecuencias
Un Polígono de Frecuencia, es una gráfica de líneas rectas que unen los puntos obtenidos al colocar en el eje horizontal a los valores medios de clase y en el vertical a las frecuencias relativas o absolutas. Debe hacerse notar que el procedimiento equivale a unir los puntos medios de la cara superior de los rectángulos de un histograma por medio de líneas rectas.
En la figura, se muestra el polígono de frecuencias para los datos del ejemplo anterior
30 35 45 55 65 75 85 95 100
Valor medio de clase del número de estudiantes de la Carrera en Administración y Producción Agropecuaria en los centros de apoyo:
Una Ojiva o Polígono de Frecuencias Acumuladas (PFA), es una gráfica construida con segmentos de líneas rectas que unen los puntos obtenidos al colocar en el eje horizontal a los límites superiores de clase y en el vertical a las frecuencia acumuladas absolutas o relativas. En la figura se presenta la ojiva que corresponde a las frecuencias de la Carrera en Administración y Producción Agropecuaria en los centros de apoyo:
30 40 50 60 70 80 90 100
Límites superiores de Clase (calificaciones)
Nótese que se ha considerado también al límite inferior de la primera clase y que se ha asignado una frecuencia acumulada de cero. Asimismo, obsérvese que, por su naturaleza una ojiva es no decreciente.
e.) Gráfico Circular (pastel)
Nos permite distribuir los 360° de un círculo en forma proporcional a las frecuencias que integran a cada una de las variables.
Ejemplo:
Número de ovinos de las Granjas Experimentales de la Provincia de Loja.
GRANJAS | FRECUENCIA | |
Granja La Argelia Granja Punzara Granja El Padmi Granja El Ceibo Granja Nueva Esperanza Granja Zapotillo Granja Zapote pamba
| 780 580 250 120 300 240 340 | |
TOTAL | 2610 |
1. Se distribuye los 360° para los 7 Colegios utilizando la fórmula:
2. Obtener el porcentaje con la siguiente fórmula:
3. Construimos el Diagrama de sectores haciendo que el Radio de la Circunferencia tenga una longitud cualquiera y la localización de las partes la iniciamos del semieje positivo de las X y siguiendo un sentido contrario a la rotación de las manecillas del reloj. Para lo cual utilizamos un graduador.
4.3.3. Medidas de tendencia central
GRANJAS | FRECUENCIA | A° | % | |||
Granja La Argelia Granja Punzara Granja El Padmi Granja El Ceibo Granja Nueva Esperanza Granja Zapotillo Granja Zapote pamba | 780 580 250 120 300 340 240 | 108° 80° 35° 16° 41° 47° 33° | 30.0 22.0 9.6 4.6 11.5 13.0 9.2 | |||
TOTAL | 2610 | 360° | 100% |
Al igual que los promedios, las medidas de tendencia central nos indican el punto medio o típico de datos que cabe esperar; también reciben el nombre de medidas de localización. Las medidas de tendencia central que estudiaremos son tres: Media aritmética, Mediana y Moda (o).
? La Media Aritmética
La media aritmética, comúnmente llamada media o promedio se calcula sumando todas las observaciones individuales de una muestra y dividiendo esta suma por el número de observaciones en la muestra. La media de una muestra representa el centro de las observaciones en la muestra.
Sabemos que una observación individual se simboliza por Xi, que representa la i-ésima observación de la muestra. Cuatro observaciones las escribiremos simbólicamente como sigue:
Definiremos el tamaño de la muestra, n, como el número de la misma. Así, en una gran muestra podemos escribir la sucesión de datos desde el primero hasta el enésimo en la forma.
Si deseamos escribir la suma de todas las observaciones, utilizaríamos la notación siguiente:
La igualdad i = 1 significa que los valores (datos) deben de ser sumados empezando por el primero y terminando por el enésimo, como nos indica la igualdad i = n escrita encima del signo X. Los sub.-índices y superíndices son necesarios para indicar cuantos valores se van a sumar.
La letra ? nos indica que es lo que debemos hacer con las variables que lo siguen. Los signos de sumatoria con subíndices y superíndices dan una formulación explicita de la operación. Sin embargo, es mejor omitir los subíndices y superíndices, especialmente para los lectores no matemáticos. Se puede hacer una simplificación del signo de sumatoria conforme se demuestra a continuación
Con lo cual la fórmula de la media aritmética sería:
? Media Geométrica
Algunas variables pueden ser transformadas en otras que son sus logarítmicas o reciprocas. Si calculamos las medias de las nuevas variables transformadas y encontramos los valores de estas medias en la escala original, nos daremos cuenta que no son los mismos que si hubiésemos calculado las medias aritméticas de las variables originales. Las medias resultantes han recibido nombres especiales en estadística. La media re transformada de la variable logarítmica se denomina media geométrica. Su expresión matemática viene dada por:
Fórmula que indica que la media geométrica G.M.x es el antilogaritmo de la media de los logaritmos de la variable X. Dado que la suma de logaritmos es equivalente al producto de sus antilogaritmos, otra manera de representar la media geométrica será:
? Media Armónica
La inversa de la media aritmética de los recíprocos de los valores primitivos de la variable X se denomina media armónica. Si la simbolizamos por Hx, la fórmula de la media armónica puede expresarse como:
? Mediana
La mediana M es un estadístico central utilizado ocasionalmente en la investigación biológica. Se define como aquel valor de la variable que posee igual número de valores al uno y otro de sus lados. De esta manera, la mediana divide a la distribución de frecuencias en dos mitades. En la siguiente muestra de cinco medidas,
14, 15, 16, 19, 23
M = 16, dado que la tercera observación presenta igual número de observaciones a cada uno de sus lados. Este estadístico se evalúa fácilmente cuando se trata de una muestra ordenada con un número de observaciones impar. Cuando el número de observaciones de la muestra es par la mediana se calcula hallando el punto medio. Así, para la muestra de cuatro medidas
14, 15, 16, 19
La mediana sería el punto medio entre las observaciones segunda y tercera, esto es, 15,5.
? Moda
La moda es el valor de la variable cuya frecuencia es la máxima o lo que es lo mismo el valor representado por el número máximo de individuos.
Sobre un gráfico que represente a una distribución de frecuencias, la moda es el valor de la variable en el cual posee un máximo pico. En distribuciones de frecuencias agrupadas, la moda no tiene mucho significado. Generalmente sirve para identificar la clase modal; y en Biología tampoco tiene muchas aplicaciones.
4.3.4. Medidas de Dispersión
? Rango
Es la diferencia entre los valores más grande y más pequeño de la muestra. Dado que el rango es una medida de la extensión de los valores de la variable, se medirá en las mismas unidades que las medidas originales. El rango puede verse alterado incluso por un solo valor exterior, por lo cual no es más que una indicación aproximada de la dispersión de los datos de la muestra.
? Desviación Standard
La desviación estándar mide la variabilidad de los datos de una población o muestra y se define como la raíz cuadrada de la suma de las dispersiones existentes entre cada observación y la media.
Existen tres pasos para el cálculo de este estadístico: (1), encontrar la suma de los cuadrados (SC); (2) dividir por n – 1 para encontrar la varianza, y (3) extraer la raíz cuadrada de la varianza.
La suma de cuadrado se la calcula con la siguiente formula:
El primer término ?X2 es la suma de todas las X elevadas al cuadrado, es decir:
El segundo término es la suma de todas las X elevado al cuadrado y dividido para el número de datos.
La fórmula de la varianza sería:
? Coeficiente de Variación
El coeficiente e variación es la desviación típica expresada como un porcentaje de la media. Se usa cuando se desea comparar la variación de dos poblaciones independientemente de la magnitud de sus medias. Su fórmula es:
Ejemplo: Con los siguientes datos del peso al mercado de 24 toretes, realizar los siguientes cálculos:
165 | 210 | 185 | 185 | 180 | 190 | |
205 | 200 | 160 | 193 | 175 | 165 | |
195 | 220 | 145 | 250 | 160 | 190 | |
215 | 122 | 180 | 225 | 137 | 137 | |
|
|
|
|
|
|
a. Media aritmética
b. Varianza
c. Desviación estándar
d. Coeficiente de variabilidad
Autor:
Raúl Verdezoto
Docente: Ing. Lolita Hualpa Lima
| UNIVERSIDAD NACIONAL DE LOJA ÁREA AGROPECUARIA Y DE RECURSOS NATURALES RENOVABLES CARRERA INGENIERÍA EN ADMINISTRACIÓN Y PRODUCCIÓN AGROPECUARIA MODALIDAD DE ESTUDIOS A DISTANCIA |
Página anterior | Volver al principio del trabajo | Página siguiente |