Variable | Dato | Observaciones o características |
……….. | ………… | ………………… |
…………. | …………. | ……………….. |
………. | ………. | …………… |
Ej. Las calificaciones obtenidas por los alumnos indicados, son las siguientes:
José Aldunate 5,6 ; María Jonquera 3,8 ; Roberto Melo 2,4 ; Mario Suazo 6,5, ……..
Según estos datos la tabulación sería:
Nombre | Calificación |
Aldunate, José | 5,6 |
Jorquera, María | 3,8 |
Melo, Roberto | 2,4 |
Suazo, Mario | 6,5 |
……………………. |
Obs. Si los resultados, como datos agrupados, fuesen los siguientes: 15 alumnos aprobaron el curso
de Estadística; la reprobaron 2 y se retiraron 3, entonces una tabulación sería:
Variable | conteo | frecuencia | porcentaje |
Alumnos aprobados | /////////////// | 15 | 75% |
Alumnos reprobados | /// | 3 | 15% |
Alumnos retirados | // | 2 | 10% |
Total. | 20 | 100% |
Los GRÁFICOS ESTADÍSTICOS son representaciones gráficas de la tabulación. Existen gráficos de distintos tipos, como barras, circulares, de puntos, líneas, de dispersión, etc..
Gráfico de barras. Gráfico circular o de torta.
Ej. En la consulta ¿Cuántos estudiantes del Primer Nivel de la Carrera X del Santo Tomás en Talca
aprobaron la asignatura de Estadística en el año 2007? se tiene que:
Población = Estudiantes del Primer Nivel de la Carrera X del Santo Tomás de 2007.
Muestra = Si la población considerada es "Estudiantes del Santo Tomás en Talca", la población
anterior sería una muestra.
Variable = aprobar asignatura de Estadística.
Dato individual = María Jorquera, José Aldunate, ……, etc.
Número total de datos = 20 alumnos.
Ejercicios.
1. Supongamos que P es una población de 50 personas. La tabla siguiente es un resumen de las
alturas de las personas medidas en centímetros.
125 | 136 | 154 | 128 | 187 | 169 | 144 | 155 | 185 | 187 |
135 | 158 | 129 | 135 | 156 | 179 | 188 | 176 | 195 | 130 |
158 | 169 | 163 | 147 | 139 | 153 | 166 | 186 | 177 | 140 |
148 | 147 | 159 | 129 | 146 | 157 | 180 | 190 | 158 | 155 |
167 | 156 | 147 | 132 | 178 | 179 | 139 | 140 | 147 | 166 |
- Determine:
- La persona de mayor altura
1.1.2 La persona de menor altura
1.1.3 El valor de la altura que más aparece
- cuantas personas miden menos de 160 cms.
- cuantas personas miden entre 145 cms. y 178 cms.
- cuantas personas miden mas de 190 cms.
- Determine:
- Hallar el número de personas que tienen una altura:
- entre 120 cms. y 135 cms. (inclusive los extremos)
- mayor de 156 cms y menor de 185 cms.
- mayor de 106 cms. y menor de 155 cms
- mayor de 126 cms. y menor de 195 cms.
- Determine el porcentaje que es cada intervalo de item 1.3 del total de personas de la población.
- Aplique distintos tipos de gráficos para los item 1.2; 1.3 y 1.4.
Encuestas
Una ENCUESTA es la formulación ordenada de preguntas que se hacen en una población, ó muestra estadística, para conseguir los datos necesarios para un estudio especifico. Estas preguntas dependerán, en cuanto a la cantidad, de la o las variables que se deseen analizar.
Ej. En el análisis anterior puede haber una sola pregunta:
¿aprobó la asignatura de Estadística? Si ƒ No ƒ
Ej. También se pudo haber construido la siguiente encuesta:
¿ aprobó la asignatura de Estadística ? Si ƒ No ƒ
¿ reprobó otra asignatura ? Si ƒ No ƒ
¿ reprobó otra asignatura, además de la asignatura de Estadística ? Si ƒ No ƒ
¿ se retiró antes de finalizar el semestre académico? Si ƒ No ƒ
¿ el retiro se debió : a) condición económica Si ƒ No ƒ
b) resultado académico Si ƒ No ƒ
Escalas
Los gráficos utilizan diferentes tipos de escalas. Una ESCALA es la razón con la que se refleja en un gráfico la realidad de los datos conseguidos. Generalmente al construir un mapa geográfico se utiliza una escala, es así, que al ver en un mapa la expresión 1:100 debemos interpretar esta notación como por cada 1 cm2 de área de la superficie del mapa existen 100 cm2 en el terreno real.
También se utiliza las escalas o proporciones en el ámbito de la salud, es el caso de tener un resultado referente a que de cada 100 mujeres 80 sufren problemas de osteoporosis.
Ej. Si los datos son: hombres casados 100.000; mujeres casadas 150.000; divorciados 55.000 entonces la escala que se puede utilizar es: por cada espacio del gráfico corresponden 50.000 hombres o mujeres casados, es decir, es una escala de 1: 50000. Así el gráfico quedaría:
III. Medidas estadísticas
Las medidas estadísticas tienen la importancia de dar a conocer algunos aspectos de la población, en cuanto a la cantidad y calidad de los valores de los elementos de ella.
Las medidas estadísticas se clasifican en:
- MEDIDAS ESTADÍSTICAS DE POSICIÓN.
(ubicadas entre los valores extremos de la variable analizada).
- MEDIDAS ESTADÍSTICAS DE DISPERSIÓN.
(denominadas también de abarcamiento, generalmente alrededor de la media aritmética )
Fórmulas para las medidas estadísticas de Posición ( D.N.C.).
Def. Sean x1 , x2 , x3 ,…………., xn-1 , xn, n valores obtenidos por una variable X en una población P.
Se definen las medidas estadísticas de posición como sigue:
1. Media Aritmética
2. Media Geométrica.
3. Media Armónica.
4. Mediana.
Es el valor de la variable que deja la mitad (50%) a la derecha y la otra mitad (50%) a la izquierda.
Para calcular el valor de la mediana primeramente deben ordenarse de menor a mayor, o viceversa, todos los n elementos de la población. Una vez ordenados se aplica uno de los siguientes criterios:
– si el número de datos de la población es un número par, la Mediana es la media aritmética de los términos centrales.
– si el número de datos de la población es un número impar, la Mediana es el término central.
5. Moda.
La Moda es el valor de los n datos de una población que más veces aparece, comparativamente con los otros datos.
Al número de veces que un elemento aparece en la población le llamaremos frecuencia. (fi)
En caso que ninguno de los n datos tenga mayor frecuencia que los otros, se dice que no existe moda para la población o que la población es Amodal.
Si dos o más datos tienen mayor frecuencia que otros, se dirá que la población es Multimodal.
Ej. La población P = {2, 3, 6, 9, 8} no tiene moda, es AMODAL.
Ej. La población P = {2, 3, 6, 9, 8, 2, 3, 1} tiene dos modas, es BIMODAL.
6. Fractiles.
Estas medidas de posición, que son llamados los T – iles o Fractiles, están basados en los diferentes porcentajes ( % ) en que puede dividirse el número total de datos de la población.
– Los CUARTILES representan la división en cuartos de la población, luego cada una de esas partes contiene al 25% del total de datos de la población. Existen 3 cuartiles que se denotan C1 , C2 , C3
– Los QUINTILES dividen a la población en cinco partes iguales, cada una de ellas contiene al 20% de los datos de la población. Existen 4 quintiles que se denotan por Q1, Q2, Q3, Q4
– Los DECILES dividen a la población en diez partes iguales, cada una de ellas contiene al 10% de los datos de la población. Existen 9 deciles que se denotan por D1, D2,……,D7, D8, D9.
– Los PERCENTILES son 99 y contienen al 1% de la población y se denominan P1, P2,.., P98, P99.
Obs. Nótese que C1 = P25; C2 = mediana = P50 = D5; D3 = P30 Q1 = D2 = P20
Ej. Sea P = { 2, 4, 6, 8, 3, 7} algunos fractiles son:
Cuartil 1 = 2 (25% de 6) Quintil 4 = 6.5 (80% de 6)
Decil 7 = 6 (70% de 6 ) Percentil 95 = 7.5 ( 95% de 6 )
Ejercicios.
- En la población P, se han obtenido los datos de la Variable : sueldo de empleados, medidos en miles de $,que están indicados en la tabla siguiente,
102 | 412 | 698 | 125 | 365 | 254 | 458 | 668 | 378 | 402 |
204 | 236 | 279 | 235 | 269 | 754 | 418 | 387 | 565 | 142 |
369 | 549 | 348 | 547 | 267 | 658 | 700 | 501 | 440 | 264 |
587 | 537 | 264 | 358 | 158 | 468 | 301 | 408 | 600 | 540 |
658 | 369 | 549 | 348 | 269 | 754 | 267 | 658 | 700 | 987 |
387 | 565 | 142 | 204 | 236 | 279 | 235 | 358 | 158 | 468 |
458 | 635 | 789 | 200 | 195 | 321 | 487 | 265 | 125 | 145 |
458 | 258 | 149 | 378 | 892 | 957 | 678 | 695 | 712 | 845 |
- Hacer una tabulación.
- Determinar la media aritmética, geométrica y armónica.
- Determinar la mediana y la moda.
- Determinar las medidas de posición C3 , Q2 , D8 , P95
- Considerando los datos del ejercicio 1, determine las frecuencias de los siguientes rangos
conteo frecuencia
Empleados que ganan un sueldo menor de $100.000 | ||
Empleados que ganan un sueldo entre $100.001 y $200.000 | ||
Empleados que ganan un sueldo entre $200.001 y $350.000 | ||
Empleados que ganan un sueldo entre $350.001 y $500.000 | ||
Empleados que ganan un sueldo mayor de $500.001 |
3.
- Construya un gráfico de barras de los resultados del ejercicio 2.
- Calcule que % es la frecuencia de cada rango del total de las frecuencias y construya un gráfico de torta.
4. En una encuesta sobre la preferencia de 400 personas por los candidatos X, Y, Z se obtuvo el
siguiente resultado: a) 198 personas por el candidato X ; b) 234 por el candidato y c) el resto por
el candidato Z.
- Determine que porcentaje de preferencia, del total de personas, obtienen los candidatos X, Y, Z.
- Construya un gráfico de torta de los resultados del item 4.1. Considere 1% » 3,6º.
5. La tabla siguiente contiene la información de las unidades de automóviles vendidos en los años
indicados.
Año. | 2004 | 2005 | 2006 | 2007 |
Nº de autos vendidos. | 1257 | 957 | 1365 | 1587 |
5.1 Construya un gráfico lineal que represente dichos datos.
5.2 Construya un gráfico de torta que represente el % de vehículos vendidos por año con respecto a
la venta total del período 2004 – 2007
Obs. En el caso que los datos x1, x2, x3, .. , xp de una población P, tengan frecuencias f1, f2, f3 ,… , fp , respectivamente, siendo n = S fi = f1 + f2 + f3 +…..+ fp y p el número de elementos distintos, las medidas estadísticas asumen la siguiente forma:
- Media Aritmética.
2. Media Geométrica.
3. Media Armónica.
4. Mediana.
Primeramente se deben ordenar todos los elementos, incluso aquellos que aparecen mas de una vez, enseguida se aplica uno de los criterios ya vistos.
5. Moda.
El dato (o los datos) xi que tenga(n) la frecuencia fi de mayor valor numérico, comparativamente
con otros datos, es la moda.
Obs. Las demás medidas estadísticas de posición, se calculan utilizando las mismas fórmulas ya
establecidas.
Ej. Sea la población P = {2, 4, 4, 6, 8, 6, 3, 7, 6 }. Su tabulación es
Valor | Conteo | Frecuencia |
2 | / | 1 |
3 | / | 1 |
4 | // | 2 |
6 | /// | 3 |
7 | / | 1 |
8 | / | 1 |
Sus medidas estadísticas de posición son:
Media Aritmética = ( 2× 1 + 4 + 6 + 8× 1 + 3× 1 + 7× 1 ) / 9 = 46 / 9 = 5.11
Mediana = ( 6 + 6 ) / 2 = 6 orden: 2 – 3 – 4 – 4 – § 6 § – 6 – 6 – 7 – 8 ( el número es impar)
Moda = 6 (aparece 3 veces )
Cuartil 3 = C3 = 6 (75% de 9)
Quintil 1 = Q1 = 3 (20% de 9)
Decil 4 = D4 = 4 (40% de 9)
Percentil 60 = P60 = 6 (60% de 9)
Obs. Una forma de obtener los valores de las diferentes medidas estadísticas de posición es construir el siguiente cuadro de cálculo:
Valor de la variable xi | Frec. fi | Frec. acum..fa | xi × fi | xi fi | fi log(xi) | fi / xi |
32 | 4 | 4 | 32 × 4 | 324 | 4 × log32 | 4/32 |
40 | 5 | 9 | …… | …… | …… | …… |
…… | …… | …… | …… | …… | …… | …… |
…… | …… | n | …… | …… | …… | …… |
Totales | n = S fi | S (xi × fi) | P | S | S |
Ejercicios.
- Determine las medidas de posición de los valores dados en la tabla siguiente:
Valor | 134 | 235 | 214 | 346 | 98 | 135 | 345 | 408 | 240 | 208 |
frecuencia | 23 | 45 | 65 | 8 | 21 | 13 | 56 | 76 | 34 | 20 |
2. Construya un gráfico: a) lineal b) de barras c) de torta, considerando los datos del
ejercicio 1.
3. La tabla contiene los sueldos, en miles de pesos, de 270 personas:
sueldo | 101 | 125 | 186 | 265 | 295 | 340 | 456 | 589 | 604 | 780 |
Nº de personas | 14 | 25 | 34 | 56 | 45 | 36 | 28 | 15 | 12 | 5 |
3.1 ¿cuántas personas ganan un sueldo menor que el primer cuartil?
3.2 ¿cuántas personas ganan un sueldo mayor al decil 4?.
3.3 ¿cuántas personas ganan un sueldo entre el percentil 22 y el percentil 95?
3.4 ¿cuántas personas ganan un sueldo entre los 125 mil y los 456?
3.5 ¿cuál es el % de personas que ganan un sueldo entre los 186 mil y los 589?
3.6 ¿cuántas personas ganan un sueldo entre el quintil 1 y el quintil 4?
IV. Fórmulas de las medidas estadísticas de Dispersión (D. N. C.)
Def. Sean x1 , x2 , x3 ,……., xn-1 , xn , los n valores obtenidos de una variable X en una población P.
Se definen las medidas estadísticas de dispersión como sigue:
Varianza
Desviación típica.
Desviación Absoluta
Momento de orden r
Momento de orden r con respecto a la media aritmética.
Ej. Ej. Sea P = {2, 4, 6, 8, 3, 7}. Su media Aritmética = 5
Obs. Si los valores xi tienen frecuencia fi, respectivamente, entonces las expresiones que calculan el
valor de las medidas de dispersión toman la forma siguiente:
Ej. Ej. Sea P = {2, 4, 6, 8, 3, 7, 4, 6}. Su media aritmética = 5
Varianza = [ (2 – 5)2 + 2× (4 – 5)2 + 2× (6 – 5)2 + (8 – 5)2 + (3 – 5)2 + (7 – 5)2 ] / 8 = 3.62
Desviación Típica = = 1.9
m3 = [23 + 2× 43 + 2× 63 + 83 + 33 + 73 ]/ 8 = 181.25
= [ (2 – 5)4 + 2× (4 – 5)4 + 2× (6 – 5)4 + (8 – 5)4 + (3 – 5)4 + (7 – 5)4 ] / 8 = 24.75
Ejercicios.
1. Sean las poblaciones
P = {2, 4, 3, 6, 7, 8, 9}; R = { ½ , 3/4, 5/6, 4/3, 6/7, 2/5, 3/7, 9/11 };
Q = { 2,5; 4,3; 5,6; 8,3; 9,2; 10,5; 12,3; 4,7; 3,9; 5,8}; S = {1234; 3245; 4356; 2341; 9876; 5678}
1.1 encuentre las medidas de posición de las poblaciones P y Q.
- encuentre las medidas de dispersión de las poblaciones R y S.
- determine si la media aritmética de la población PÈ Q es igual a la suma de la media aritmética de P con la media aritmética de Q.
- compare la media aritmética, geométrica y armónica de las poblaciones P, Q, R y S.
- El cuadro dado es el resultado de las edades años de los alumnos del III nivel de la carrera de
Asistente Judicial. ( M = mujer ; H = hombre )
M – 21 | H – 22 | M – 19 | H – 20 | H – 23 | M -19 | M – 23 | M – 21 | M – 22 | H – 23 |
H – 21 | H – 21 | H – 23 | H – 19 | H – 19 | M – 22 | H – 24 | M – 24 | M – 25 | H – 22 |
H – 22 | H – 26 | M – 25 | M – 24 | M – 23 | H – 23 | H – 23 | H – 24 | H – 19 | M – 18 |
M – 18 | H – 18 | H – 19 | M – 18 | M – 18 | H – 19 | H – 22 | H – 23 | M – 21 | M – 21 |
2.1 ¿cuál es el promedio de edad de los hombres?
2.2 ¿cuál es el promedio de edad de las mujeres?
2.3 construya un gráfico que represente el % que corresponde a las mujeres y a los hombres del
total de elementos de la población.
2.4 hallar el nº de alumnos que pertenecen al intervalo (m. aritmética – s; m. aritmética + s)
2.5 determine el % de alumnos que pertenecen al intervalo (mediana -2s, mediana + 2s )
Clasificación de datos ( D.C.)
Sea P una población de n datos. En ocasiones los datos de la población requieren ser clasificados en p – clases ( grupos, intervalos) de manera cualitativa o cuantitativa.
En las clasificaciones cuantitativas, cada clase tiene un valor menor llamado LÍMITE INFERIOR (L.I.) y un valor mayor llamado LÍMITE SUPERIOR (L.S.).
La media aritmética de esos límites, (LI + LS) / 2, es llamada MARCA de la clase y se denota por xi.
El número total de datos de una variable X que pertenecen a una clase es llamada FRECUENCIA de la clase y se denota por fi .
La diferencia entre el límite inferior y el límite superior, | LI – LS |, de cada clase es el TAMAÑO de la clase y se denota por ti
Obs.
1. la clasificación de una población puede ceñirse a un criterio personal o por criterios de
importancias.
2. el número de clases de una distribución de frecuencias puede ser sugerido por la expresión:
k = 1 + 3,3 × log n
donde n es el número de datos de la población.
Una vez que se haya determinado el número de clases k de una distribución, para conseguir que las clases tengan el mismo tamaño, el rango total (diferencia entre el menor valor y el mayor valor de los datos de la variable de la población) se divide por k.
rango total = V. Menor – V. Mayor Þ . Tamaño clase = (V. Menor – V. Mayor ) / k
Ej. Si n = 100 Þ K = 1 + 3,3*log100 = 1 + 3,3*2 = 7,6 » 8. Luego, la expresión sugiere que la
distribución de las frecuencias tenga 8 clases.
Ej. Considerando la sugerencia anterior, 8 clases, y si el mínimo valor de los datos de la población es 34 y el mayor es 234, entonces el rango de cada clase es (234 – 34 ) / 8 = 25 y una clasificación sería:
34 – 59 | 60 – 85 | 86 – 111 | 112 – 137 | 138 – 163 | 164 – 189 | 190 – 215 | 216 – 241 |
Otra puede ser:
30 – 55 | 56 – 81 | 82 – 107 | 108 – 133 | 134 – 159 | 160 – 185 | 186 – 211 | 212 – 237 |
Obs. Lo importante al hacer una clasificación, es asegurar que todos los datos de la población pertenezcan a alguna de las clases.
Ej. Determine los números de clases sugeridas por la fórmula para una población de a) 200; b) 300;
c) 500; d) 1000; e) 2000; f) 10000 datos.
Solución.
- número de clases sugeridos = 1 + 3,3 log200 = 1 + 3,3 × 2,301 = 1 + 7,59 = 8,59 » 9
- número de clases sugeridos = 1 + 3,3 log300 = 1 + 3,3 × 2,477 = 1 + 8,17 = 9,17 » 9
- número de clases sugeridos = 1 + 3,3 log500 = 1 + 3,3 × 2,699 = 1 + 8,9 = 9,9 » 10
- número de clases sugeridos = 1 + 3,3 log1000 = 1 + 3,3 × 3 = 1 + 9,9 = 10,9 » 11
- número de clases sugeridos = 1 + 3,3 log2000 = 1 + 3,3 × 3,301 = 1 + 10,89 = 11,89 » 12
- número de clases sugeridos = 1 + 3,3 log10000 = 1 + 3,3 × 4 = 1 + 13,2 = 14,2 » 15
Medidas de posición ( D.C.)
Media aritmética.
Media Geométrica.
Media Armónica.
Mediana.
Moda.
Fractiles.
Simbología
fi = frecuencia de la clase i – ésima
xi = marca de la clase i – ésima =
N = número total de elementos de la distribución = S fi
L Me = límite inferior de la clase mediana. La clase mediana es aquella clase donde se produce la
mitad del total de las frecuencias
L Mo = límite inferior de la clase modal. La(s) clase(s) modal(es) es (son) aquella(s) clase(s) que
tiene(n) la mayor de las frecuencias.
D 1 = exceso de frecuencias de la clase modal con respecto a la clase inmediatamente anterior.
D 2 = exceso de frecuencias de la clase modal con respecto a la clase inmediatamente posterior.
L q = límite inferior de la clase q – tila. La clase q- tila es aquella clase donde se produce la cantidad
de frecuencias correspondiente al q% de N.
fa/me = frecuencia acumulada desde la primera clase hasta la clase mediana.
fa /q = frecuencia acumulada desde la primera clase hasta la q – tila clase.
fme = frecuencia de la clase mediana.
fq = frecuencia de la clase q – tila.
t me = tamaño de la clase mediana.
t mo = tamaño de la clase modal.
t q = tamaño de la clase q – tila.
Ej. Sea la población P cuyos datos están dados en la siguiente tabla de datos clasificados. La
variable de las clases es sueldo en miles $. Los datos correspondientes a 50 empleados de alguna
empresa E están dados en la tabla siguiente:
Lím. Inf. | Lím. Sup. | fi | xi | f i xi | fa |
0 | 100 | 12 | 50 | 600 | 12 |
ª 101 | 200 | 15 | 150.5 | 2257.5 | 27 |
201 | 300 | 13 | 250.5 | 3256.5 | 40 |
301 | 400 | 10 | 350.5 | 3505 | 50 |
N = 50 | S = 9619 |
Las medidas estadísticas de posición se calculan aplicando las fórmulas correspondientes a datos clasificados. Así se tiene que:
Media aritmética = 9619 / 50 = $192.380
Mediana = 101 + 99 (25 – 12)/15 = $186.800 ª clase mediana: 101 – 200
Moda = 101 + 99 3/(3+2) = $160.400 ª clase modal: 101 – 200
Cuartil 1 C1 = T25 = 101 + 99 (12.5 – 12)/15 = $104.300
Quintil 3 Q1 = T60 = 201 + 99 (30 – 27)/13 = $223.846
Decil 4 D4 = T40 = 101 + 99 (20 – 12)/15 = $153.800
Percentil 82 = P82 = T82 = 301 + 99 (41 – 40)/13 = $308.615
Obs. Según las medidas obtenidas en el ejemplo anterior se puede concluir que el 25% (C1 ) de los
empleados de la empresa E gana un sueldo menor que $104.300; mientras que el 82% (P82)
gana un sueldo menor que $308.615.
Medidas estadísticas de dispersión ( D.C.)
Varianza.
Desviación típica o estándar.
Desviación Absoluta.
Momento de orden r.
Momento de orden r con respecto a la media aritmética.
Ej. Determinar las medidas de dispersión varianza, desviación típica, momento de orden 2 y
momento de orden 3 con respecto a la media aritmética, de la distribución en clases siguiente:
varianza = v = 9,2736
desviación típica = s = 3,04
momento de orden 2 = m2 = 57,16
momento de orden 3 con respecto a la media aritmética = m = -4,33.
Aplicaciones.
Las diversas medidas estadísticas, tanto de posición como de dispersión, pueden ser útiles en las siguientes instrumentos:
- Coeficiente de variación.
Def. Se define el COEFICIENTE de VARIACIÓN como el valor dado por la expresión:
donde = media aritmética y s = desviación típica de la población.
Ej. Si de una población es 35 y s = 7 entonces: CV = 7/35 = 1/5 = 0,2.
Página anterior | Volver al principio del trabajo | Página siguiente |