Ej.
Obs.
- el valor del coeficiente de variación es independiente de las unidades de los datos.
- el coeficiente de variación CV > 0, luego
Ejercicios.
- Determine el coeficiente de variación de la población P = {12, 34, 56, 32, 67, 86, 54}
- Compare los coeficientes de variación de las siguientes poblaciones y dé una conclusión en base a los resultados obtenidos.
P1 (Kg.) = {21, 87, 104, 204, 12} P2 (años) = {10, 20, 30, 40, 50, 60, 70}
P3 (mts.) = {7, 12, 456, 598, 978, 2} P4 ($) = {101, 220, 130, 440, 550, 760, 708}
- Determinación del número de elementos de un rango.
Ej. Si consideramos la media aritmética = 35,5 y la desviación típica s = 14,4 de la distribución de frecuencias indicada en la tabla siguiente:
li | ls | fi | xi | xi*fi | fi*(xi-x')^2 |
0 | 10 | 2 | 5 | 10,00 | 1863,55 |
11 | 21 | 5 | 16 | 80,00 | 1906,13 |
22 | 32 | 9 | 27 | 243,00 | 654,08 |
33 | 43 | 12 | 38 | 456,00 | 73,51 |
44 | 54 | 8 | 49 | 392,00 | 1452,61 |
55 | 65 | 4 | 60 | 240,00 | 2396,10 |
40 | 1421,00 | 8345,98 | |||
35,53 | 208,65 | ||||
14,44 |
Determine el número de datos del rango (– s; + s).
Solución. El rango (– s; + s) = (35,5 – 14,4 ; 35,5 + 14,4) = (21,1 ; 49,9).
El número de elementos de este rango es = nº (22 ; 32) + nº (33 ; 43) + nº (44 ; 49,9)
= 9 + 12 + x
el valor de x se calcula mediante la regla proporcional
x = (5,9 * 8) / 10 = 4,72
Luego el total de elementos que contiene el rango es:
9 + 12 + 4,72 = 25,72.
- Determinación del porcentaje de elementos pertenecientes a un rango.
Ej. Calcular además el % del total de datos que pertenecen a ese rango, si se consideran los datos
del ejemplo anterior.
Solución. El total de elementos pertenecientes al rango es 25,72, que representa el:
25,72*100/40 = 64,3 % del total de frecuencias de la población.
- Cálculo del número y porcentaje de datos pertenecientes a un rango interfractilítico.
- Si el rango es del tipo (Q1, D7) el porcentaje entre las dos medidas es 70% – 20% = 50%.
Ej. En una población de 40 datos, al rango anterior contiene a 50% de 40 = 20 elementos.
- Otros rangos interfractilíticos a los cuales se les puede obtener sus frecuencias y % son:
- Rango intercuartilítico.
- Rango interpercentilítico.
- Rango interquintilítico.
- Rango interpercentilítico – cuartilíticos.
Ejercicios.
1. Considerando los datos entregados por la tabla siguiente, determine número y % de personas que contienen los siguientes rangos:
1.1 (Q1, P78) 1.2 (C1, D8) 1.3 (D3, D7)
1.4 (Q1, Q6) 1.5 (C3, P90) 1.6 (P10, P90)
sueldo | 101 | 125 | 186 | 265 | 295 | 340 | 456 | 589 | 604 | 780 |
Nº de personas | 14 | 25 | 34 | 56 | 45 | 36 | 28 | 15 | 12 | 5 |
- Análisis del Sesgo.
Def. El coeficiente de SESGO determina el grado de asimetría (alargamiento de la distribución
hacia la izquierda o hacia la derecha). Para determinar el sesgo de una distribución de frecuencias se utiliza el :
- Si el coeficiente de sesgo tiene un valor positivo se dice que la distribución es SESGADA a DERECHA o que tiene SESGO POSITIVO.
- Si el coeficiente de sesgo tiene un valor negativo se dice que la distribución es SESGADA a IZQUIERDA o que tiene SESGO NEGATIVO.
- Si el coeficiente de sesgo tiene un valor 0 se dice que la distribución es INSESGADA o que tiene SESGO 0.
sesgo negativo sesgo positivo insesgada
Obs. Otras expresiones que se utilizan para el sesgo son:
- Análisis de la Curtosis
El coeficiente de CURTOSIS determina el grado de alargamiento de la distribución hacia arriba o
hacia abajo. Para determinar la curtosis de una distribución de frecuencias se utiliza el:
– Si el coeficiente de curtosis es mayor que 3 se dice que la distribución es LEPTOCÚRTICA.
– Si el coeficiente de curtosis es menor a 3 se dice que la distribución es PLATICÚRTICA
– Si el coeficiente de curtosis es igual a 3 se dice que la distribución es MESOCÚRTICA.
Mesocúrtica Leptocúrtica Platicúrtica.
Ej. Sea la población P cuyos elementos (40) están distribuidos de la manera que indica la tabla siguiente:
Lim.Inf. | Lim.Sup. | fi | xi | fi xi | xi – x | (xi -x )2 fi | (xi – x )3 fi | (xi – x )4 fi |
0 | 10 | 2 | 5 | 10 | -30.5 | 1860.5 | -56745.25 | 1730730.1 |
11 | 21 | 5 | 16 | 80 | -19.5 | 1901.25 | -37074.375 | 722950.31 |
22 | 32 | 9 | 27 | 243 | -8.5 | 650.25 | -5527.125 | 46980 |
33 | 43 | 12 | 38 | 456 | 2.5 | 75 | 187.5 | 468.7 |
44 | 54 | 8 | 49 | 392 | 13.5 | 1458 | 19683 | 267520.5 |
55 | 65 | 4 | 60 | 240 | 24.5 | 2401 | 58824.5 | 1441200.2 |
Totales | 40 | 1421 | 8348 | -20648.75 | 4208054.422 |
Entonces, para analizar sesgo y curtosis se necesitan los siguientes datos:
- = 1421 / 40 = 35,5
- v = 8346 / 40 = 208,7
- s = 14,44
- = -20648,75 / 40 = -516,21
- = 4208054,422 / 40 = 105201,36
- coef. sesgo = -516,21 / 3010,93 = – 0,171 < 0
- coef. curtosis = 105201,36 / 43477,92 = 2,41 < 3
Conclusión. La población P es sesgada a la izquierda y platicúrtica.
Obs. Otra expresión que se utiliza para medir la curtosis de una población es:
Obs. Este coeficiente para una distribución normal es 0,263
Ejercicios.
1. La tabla dada representa los años de servicio de 52 personas de una empresa textil:
Años de servicio | 0 – 3 | 4 – 7 | 8 – 11 | 12 – 15 | 16 – 19 | 20 – 25 |
frecuencia | 8 | 10 | 15 | 9 | 6 | 4 |
1.1 Construya un gráfico lineal para dicha población.
1.2 Determine sesgo y curtosis de la población.
1.3 Dé una interpretación a los resultados obtenidos.
1.4 Encuentre el número de personas que pertenecen al intervalo (mediana – d: moda + s)
1.5 Encuentre el número de personas que pertenecen al rango (Q1, P83)
1.6 Determine el porcentaje de personas que pertenecen al intervalo
2. Obtenga una muestra de 10 datos de la población dada en el cuadro siguiente aplicando el azar.
123 213 345 234 65 365 45 214 78 465
324 210 567 23 76 241 45 1287 598 587
456 43 765 34 88 854 365 65 236 685
432 54 234 65 976 458 1258 258 2541 954
2.1 Compare las medidas estadísticas de posición de la muestra con las respectivas de la población.
2.2 Compare las medidas de dispersión de la muestra con las respectivas de la población.
2.3 Encuentre el número de personas que pertenecen al intervalo (mediana – s: moda + s) de la población.
2.4 Encuentre el número de personas que pertenecen al rango (Q1, P93) de la población.
2.5 Determine el porcentaje de personas que pertenecen al intervalo:
3.
3.1 Clasifique los datos dados en el item 2 en a lo menos cinco clases.
3.2 Compare las medidas estadísticas de dispersión de la muestra con las respectivas de la población y las de su clasificación.
3.3 Compare las medidas estadísticas de posición de la muestra con las respectivas de la población y las de su clasificación.
4. En la tabla contiene los datos de un estudio realizado sobre las edades de un grupo de personas.
0 a 10 años | 23 | |||||||||
10 a 20 años | 34 | |||||||||
20 a 30 años | 47 | |||||||||
30 a 40 años | 53 | |||||||||
40 a 50 años | 45 | |||||||||
50 a 60 años | 15 | |||||||||
60 a 70 años | 18 | |||||||||
70 a 80 años | 4 |
4.1 Determine las medidas de posición de dicho estudio
4.2 Determine las medidas de dispersión de dicho estudio
4.3 Analice sesgo y curtosis.
4.4 ¿Cree Ud. que la villa, según los datos que obtuvo, se puede considerar "vieja"?
4.5 Encuentre el número de personas que pertenecen al intervalo (media aritmética – s: moda + s)
4.6 Encuentre el número de personas que pertenecen al rango (Q1, D8)
4.7 Determine el porcentaje de personas que pertenecen al intervalo:
5. En una empresa que fabrica tubos de cemento se analiza la producción mensual, en unidades de producción, obteniéndose los siguientes datos:
Enero | Febrero | Marzo | Abril | Mayo | Junio | Julio | Agosto | Sept. | Oct. | Nov. | Dic. |
1450 | 1234 | 2345 | 1678 | 3245 | 1897 | 2087 | 1980 | 2313 | 1008 | 2056 | 1235 |
5.1 ¿Cuál es el promedio anual?
5.2 Si ese promedio anual se considera como la producción normal de la empresa ¿en cuántos meses se produjo menos de lo normal y en cuántos mas de lo normal?
5.3 Construya un gráfico circular de los datos dados en la tabla indicando el % que representa cada mes con respecto a la producción anual.
6. Indique el % que corresponde a cada clase según los datos y el gráfico dados.
Distribuciones Bidimensionales
Def. Una DISTRIBUCION BIDIMENSIONAL es una tabla de doble entrada en la cual participan dos variables simultáneamente. Cada dato obtenido verifica las dos variables.
Ej. Si se analiza una población de reos que sean monreros y que tengan una edad entre los 20 y 30 años, entonces, todos aquellos reos que cumplan ambas condiciones, pertenecen a dicho grupo o clase.
Gráfico de una distribución bidimensional.
Tabulación de una distribución bidimensional.
Los datos de una distribución bidimensional en las variables X y Y se tabulan en una tabla de doble entrada.
donde Xi son los valores (o marcas de las clases) de la variable X; Yi son los valores (o marcas de las clases) de la variable Y y Fij son las frecuencias relativas a las dos variables.
Ej. La tabla siguiente entrega los datos de un estudio con respecto de la edad de mujeres y de hombres en matrimonios constituidos legalmente:
La frecuencia F23 = 18 representa el número de matrimonios donde la edad de la mujer está entre los 19 a 22 años y la edad de los hombres entre los 26 a 30 años.
Obs. Para determinar algunas medidas estadísticas para distribuciones bidimensionales, con datos clasificados, se utiliza la siguiente: Tabla de las marcas de las clases de la distribución bidimensional.
Según los datos dados de la distribución bidimensional del ejemplo anterior, el gráfico correspondiente es:
Distribuciones Marginales
Def. La distribución que contiene sólo las frecuencias de la variable X, se le llama distribución
MARGINAL de X con respecto a Y. Análogamente, si se consideran sólo las frecuencias de la
variable Y se le llama distribución MARGINAL de Y con respecto a X..
Ej. Tabla marginal de las edades de las mujeres. Tabla marginal de las edades de los hombres
Total 200
Distribuciones Condicionales
A la distribución de las frecuencias de la variable X ( ó Y) con algún intervalo de la distribución de las frecuencias de la variable Y ( ó X ) se le llama DISTRIBUCION CONDICIONAL.
Ej. Los datos ennegrecidos del gráfico, corresponden al total de matrimonios cuyas mujeres tienen una edad entre los 19 años y los 32 años y cuyos hombres tienen una edad entre los 21años y los 30 años. En total serían 14 + 18 + 8 + 20 + 5 + 9 = 74.
Medidas en una distribución bidimensional.
Covarianza.
Correlación.
Def. La CORRELACIÓN de una relación entre dos variables, nos indica el grado de relación existente entre ellas. Uno de los instrumentos que se utilizan para determinar la correlación es el Coeficiente de Correlación, cuyo valor se determina mediante la expresión:
Ej. Consideremos la distribución bidimensional de los 200 matrimonios dados en la tabla anterior.
Determine la correlación entre las edades de las mujeres y la de los hombres.
Marcas | hombresè | |||
Marcas mujeres ê | 17,5 años | 23 años | 28 años | 33 años |
16,5 años | 13 | 12 | 15 | 4 |
20,5 años | 6 | 14 | 18 | 10 |
24,5 años | 3 | 8 | 20 | 14 |
29,5 años | 2 | 5 | 9 | 23 |
34 años | 1 | 2 | 3 | 18 |
17,5 | 23 | 28 | 33 | |||||||
16,5 | 3754 | 4554 | 6930 | 2178 | ||||||
20,5 | 2153 | 6601 | 10332 | 6765 | ||||||
24,5 | 1286 | 4508 | 13720 | 11319 | ||||||
29,5 | 1033 | 3393 | 7434 | 22391 | ||||||
34 | 595 | 1564 | 2856 | 20196 | ||||||
XI | YI | FI | GI | Xi*Fi | Yi*Gi | (xi-x)^2*fi | (yi-y)^2*gi | |||
17,5 | 16,5 | 25 | 44 | 437,5 | 726 | 2444,066406 | 2406,1851 | |||
23 | 20,5 | 41 | 48 | 943 | 984 | 789,2564063 | 553,2492 | |||
28 | 24,5 | 65 | 45 | 1820 | 1102,5 | 24,38515625 | 16,471125 | |||
33 | 29,5 | 69 | 39 | 2277 | 1150,5 | 2173,510781 | 1225,224975 | |||
0 | 34 | 0 | 24 | 0 | 816 | 0 | 2450,6646 | |||
5477,5 | 4779 | 5431,21875 | 6651,795 | |||||||
x | y | |||||||||
media aritmética | 27,39 | 23,90 | ||||||||
varianza desviación típica | 27,1560 5,21 | 33,2589 5,77 | ||||||||
covarianza | 13,376 | |||||||||
correlación | 0,4451 |
Conclusión: como el coeficiente de correlación es positivo (0,4451) se concluye que cuando la edad de la mujer aumenta la edad del hombre también aumenta.
Ejercicios.
Determine la correlación de la tabla bidimensional que relaciona los años de servicio con los sueldos, en miles de $, de una institución fiscal.
Años de servicioê | Sueldos è 70 a 99 | 100 a 129,99 | 130 a 159,99 | 160 a 189,99 | 190 a 220 |
0 a 2,99 | 12 | 4 | 5 | 3 | 2 |
3 a 5,99 | 10 | 8 | 9 | 6 | 3 |
6 a 8,99 | 6 | 5 | 12 | 8 | 6 |
9 a 11,99 | 3 | 4 | 9 | 12 | 12 |
12 a 14,99 | 2 | 2 | 4 | 8 | 7 |
15 a 18 | 2 | 1 | 3 | 4 | 3 |
1.1 Determine sesgo y curtosis de las dos distribuciones marginales de item 1.
1.2 Determine sesgo y curtosis de las distribuciones condicionales siguientes:
1.2.1 Años de servicio con los sueldos desde 130 a 190 mil pesos
1.2.2 Sueldos con los años de servicio desde los 6 a 15 años
1.3 Determine la correlación entre las variables.
2. El gráfico siguiente representa un estudio entre los años de edad de los fallecidos en los cuatro trimestres de un año cualesquiera.
2.1 Construya una tabla bidimensional de dicho gráfico
2.2 Construya la tabla marginal de los trimestres con respecto a los años de los fallecidos
2.3 Determine cuantos fallecidos hubo entre el segundo y tercer trimestre de personas que tenían entre 20 y 40 años
- El siguiente cuadro contiene los datos de la relación peso (en Kgs.) y altura (en mts.) de personas pertenecientes a una población X.
- Determine la correlación de las variables peso – altura.
- Analice su resultado.
- El siguiente cuadro representa los datos de la relación de la variable años de trabajo (en años) y de la variable sueldo (en miles de $) de empleados de una empresa X.
- Determine la correlación de las variables años de servicio – sueldo.
- Analice su resultado.
- ¿ Cuántas personas tienen entre 11 y 20 años de servicio y ganan un sueldo mayor de 200 y menor 801 mil pesos?.
Curvas de ajuste
En la relación entre dos variables X y Y, por ejemplo, entre costo y venta de una determinada empresa, muchas veces no se advierte una tendencia clara de dicha relación. En algunos períodos esta venta es creciente, en otras decrecientes, o bien, es estable.
Para determinar alguna tendencia que pueda proyectarse en el tiempo, la estadística hace uso de funciones matemáticas, como la línea recta, la parábola, y en general, funciones polinomiales, logarítmicas, exponenciales, trigonométricas reales. A estas funciones se les denominan
CURVAS DE AJUSTE.
Curva de Ajuste Lineal.
Sean los n datos o puntos (x1 , y1 ), (x2 , y2 ),….., (xn , yn ), de la relación entre las variables X y Y, que se muestran en la tabla siguiente:
Variable X | x1 | x2 | x3 | …. | …… | xn |
Variable Y | y1 | y2 | y3 | … | …… | yn |
Método libre.
Para determinar la ecuación de una línea recta de ajuste, por el método libre, se seleccionan dos puntos cualesquiera de los n datos. Reemplazando los datos elegidos, A(x1, y1) y B(x2, y2), en la ecuación:
se obtiene la ecuación de la Curva de ajuste lineal.
Ej. La producción quincenal de cobre se presenta en la siguiente tabla:
Quincena | 1ª | 2ª | 3ª | 4ª | 5ª | 6ª |
Producción en ton. | 2 | 6 | 4 | 8 | 5 | 9 |
Consideremos los puntos A(1, 2) y B(6, 9). La curva de ajuste lineal libre tiene por ecuación la expresión:
Según la curva de ajuste resultante, según cuadro y gráfico, se puede apreciar que la tendencia de producción sería creciente en las próximas quincenas.
Quincena | 7ª | 8ª | 9ª | 10ª | 11ª | 12ª |
Producción en ton. | 10,4 | 11,8 | 13,2 | 14,6 | 16 | 17,4 |
Página anterior | Volver al principio del trabajo | Página siguiente |