¯ DM = DM = DM = ¯ MEDIDAS DE DISPERSIÓN CON EXCEL
DESVIACIÓN MEDIA O DESVIACIÓN PROMEDIO La desviación media o desviación promedio es la media aritmética de los valores absolutos de las desviaciones respecto a la media aritmética.
a) Para Datos No Agrupados Se emplea la fórmula: ?|x – x| DM = n Ejemplo ilustrativo: Calcular la desviación media de la distribución: 3, 8, 8, 8, 9, 9, 9, 18
Solución: Se calcula la media aritmética. ??¯ = ? ???? 3 + 8 + 8 + 8 + 9 + 9 + 9 + 18 = ?? 8 =9 Se calcula la desviación media.
?|x – x| n |3 – 9| + |8 – 9| + |8 – 9| + |8 – 9| + |9 – 9| + |9 – 9| + |9 – 9| + |18 – 9| 8 6 + 1 + 1 + 1 + 0 + 0 + 0 + 9 18 = = 2,25 8 8
Empleando Excel:
b) Para Datos Agrupados en Tablas de Frecuencia Se emplea la fórmula: ???? = ? ??|?? – ??¯ | ??
?? Ejemplo ilustrativo: Calcular la desviación media en base a la siguiente tabla sobre las calificaciones de un estudiante en 12 asignaturas evaluadas sobre 10.
Calificación Cantidad de asignaturas Solución: Se calcula la media aritmética. 6 7 8 9 10 Total 4 2 3 2 1 12 ??¯ = ? ???? 4 · 6 + 2 · 7 + 3 · 8 + 2 · 9 + 1 · 10 24 + 14 + 24 + 18 + 10 90 = = = ?? 12 12 12 = 7,5 Se llena la siguiente tabla: ?? |?? – ??¯ | ??|?? – ??¯ | 6 7 8 9 10 4 2 3 2 1 1,5 0,5 0,5 1,5 2,5 6 1 1,5 3 2,5 Total 12
Se emplea la ecuación de la desviación media. 14 ???? = ? ??|?? – ??¯ | 14 = ?? 12 = 1,167 c) Para Datos Agrupados en Intervalos Se emplea la fórmula: Donde ???? es la marca de clase. ???? = ? ??|???? – ??¯ | ?? Ejemplo ilustrativo: Calcular la desviación media de un curso de 40 estudiantes en la asignatura de Estadística en base a la siguiente tabla: Calificación Cantidad de estudiantes 2-4 4-6 6-8 8-10 Total 6 8 16 10 40 Solución: Para calcular la media aritmética se llena la siguiente tabla: Intervalo ?? ???? ?? · ???? 2-4 4-6 6 8 3 5 18 40 6-8 8-10 Total 16 7 10 9 40 112 90 260
?? 1- 2 =1- = 2 2 ¯ ¯ ¯ Calculando la media aritmética se obtiene: ??¯ = ? ?? · ?? ?? 260 = ?? 40 = 6,5 Para calcular la desviación media se llena la siguiente tabla: Intervalo ?? ???? |???? – ??¯ | ??|???? – ??¯ | ???? = 66 40 = 1,65 2-4 4-6 6-8 8-10 Total 6 3 8 5 16 7 10 9 40 3,5 2,5 0,5 2,5 21 12 8 25 66 VARIANZA Y DESVIACIÓN ESTÁNDAR El teorema de Chebyshev, de autoría del matemático ruso Pafnuty Lvovich Chebyshev, establece que para todo conjunto de datos, por lo menos 1 – 1/??2 de las observaciones están dentro de k desviaciones estándar de la media, en donde k es cualquier número mayor que 1. Este teorema se expresa de la siguiente manera: 1 1- 2 Así por ejemplo, si se forma una distribución de datos con k =3 desviaciones estándar por debajo de la media hasta 3 desviaciones estándar por encima de la media, entonces por lo menos 1 1 9-1 8 = = 0,8889 = 88,89% 3 9 9 9
Interpretación: El 88,89% de todas las observaciones estarán dentro ± 3 desviaciones de la media.
a) Para Datos No Agrupados La varianza para una población se calcula con: s = ?(xi – µ)2 N Donde: ???? = ?????????????????????????? ???????????????????????? ???? ???? ??????????????ó?? µ = media aritmética poblacional ?? = ??ú???????? ???? ?????????????????????????? ???? ???? ??????????????ó??
La desviación estándar poblacional se calcula con: ?? = v?? 2 = v
La varianza de la muestra se calcula con: ?(xi – µ)2 N Donde: s = ?(xi – x)2 n-1 ???? = ?????????????????????????? ???????????????????????? ???? ???? ?????????????? x = ?????????? ??????????é???????? ???? ???? ?????????????? ?? = ??ú???????? ???? ???????????????????????? ???? ???? ??????????????
La desviación estándar de una muestra se calculó con: ?? = v??2 = v ?(xi – x)2 n-1
s2 = s2 = s = 2 = = 0,75 = 75% ?? 2 4 4 4 Ejemplo ilustrativo: Considere que los siguientes datos corresponden al sueldo de una población: $350, $400, $500, $700 y $1000 1) Calcular la desviación estándar. 2) ¿Cuál es el intervalo que está dentro de k = 2 desviaciones estándar de la media?. ¿Qué porcentaje de las observaciones se encuentran dentro de ese intervalo?
Solución: 1) Para la calcular la desviación estándar se sigue los siguientes pasos: a) Se calcula la media aritmética. µ= ? xi 350 + 400 + 500 + 700 + 1000 2950 = = N 5 5 = $ 590 b) Se aplica la respectiva fórmula para calcular la varianza
?(xi – µ)2 N (350 – 590)2 + (400 – 590)2 + (500 – 590)2 + (700 – 590)2 + (1000 – 590)2 5 57600 + 36100 + 8100 + 12100 + 168100 282000 = = $2 56400 5 5
c) Se calcula la desviación estándar.
?? = v?? 2 = v$2 56400 = $237,4868
En Excel:
2) Cálculo del intervalo de k = 2 desviaciones estándar de la media.
Se transportan 2 desviaciones estándar (2 x $ 237,4868) = $ 474,97 por encima y por debajo de la media ?? = $590
Por lo tanto se tiene un intervalo desde $ 590 – $474,97 = $ 115,03 hasta $ 590 + $474,97 = $ 1064,97
Aplicando el Teorema de Chebyshev 1 1 1 4-1 3 1- 2 =1- 2 =1- =
Interpretación: Se puede afirmar de que por lo menos el 75% los sueldos están entre $ 115,03 y $ 1064,97
2 ? ??(???? – ??¯ )2 ?? b) Para Datos Agrupados en Tablas de Frecuencia La varianza para una población se calcula con: Donde: ?? = ? ??(???? – ??)2 ?? f = frecuencia absoluta. La desviación estándar poblacional se calcula con: ?? = v?? 2 = v
La varianza de la muestra se calcula con: ? ??(???? – ??)2 ?? ??2 = ? ??(???? – ??¯ )2 ?? – 1 La desviación estándar de una muestra se calcula con:
?? = v??2 = v ?? – 1
Ejemplo ilustrativo: Calcular la desviación estándar de los siguientes datos correspondientes a una muestra. Calificaciones ?? Solución: Se llena la siguiente tabla: 4 5 6 7 8 10 Total 3 6 4 13 7 6 39 Se calcula la media aritmética. Calificaciones 4 5 6 7 8 10 Total ?? 3 6 4 13 7 6 39 ???? 12 30 24 91 56 60 273 ??¯ = ? ?? · ???? 273 = ?? 39 =7 Se llena la siguiente tabla: Calificaciones ?????? ???? – ??¯ (???? – ??¯ )2 ??(???? – ??¯ )2 4 5 6 7 8 10 Total 3 6 4 13 7 6 39 12 30 24 91 56 60 273 -3 -2 -1 0 1 3 9 4 1 0 1 9 27 24 4 0 7 54 116
v?? 2 = v 2 Se calcula la desviación estándar 116 ?? = v 39 – 1 =v 116 38 = v3,0526 = 1,747 c) Para Datos Agrupados en Intervalos La varianza para una población se calcula con: ?? 2 = ? ??(?????? – ??)2 ?? Donde: ?? = ???????????????????? ???????????????? ; ???? = ?????????? ???? ?????????? La desviación estándar poblacional se calcula con: ?? =
La varianza de la muestra se calcula con: ? ??(?????? – ??)2 ?? ?? = ? ??(?????? – ??¯ )2 ?? – 1 La desviación estándar de una muestra se calcula con: ?? = v??2 = v ? ??(?????? – ??¯ )2 ?? – 1 Ejemplo ilustrativo: Calcular la desviación estándar de los siguientes datos correspondientes a una muestra. Intervalo ?? 60-65 65-70 70-75 80-85 85-90 5 20 40 27 8 Total 100 Solución:Se llena la siguiente tabla: Intervalo 60-65 65-70 70-75 80-85 85-90 Total ?? 5 20 40 27 8 100 ???? 62,5 67,5 72,5 82,5 87,5 ?? · ???? 312,5 1350 2900 2227,5 700 7490 Se calcula la media aritmética. ??¯ = ? ?? · ???? 7490 = ?? 100 = 74,9 Se llena la siguiente tabla: Intervalo ?? ???? ?? · ???? ?????? – ??¯ (?????? – ??¯ )2 f(?????? – ??¯ )2 60-65 65-70 70-75 80-85 85-90 5 20 40 27 8 62,5 67,5 72,5 82,5 87,5 312,5 1350 2900 2227,5 700 -12,4 -7,4 -2,4 7,6 12,6 153,76 54,76 5,76 57,76 158,76 768,8 1095,2 230,4 1559,52 1270,08 Total 100 7490 4924
Se calcula la desviación estándar. 4924 ?? = v 100 – 1 4924 =v 99 = v49,737 = 7,052 OTRAS MEDIDAS DE DISPERSIÓN
a) RANGO, AMPLITUD TOTAL O RECORRIDO
Dada una serie de valores ??1 , ??2 , . ???? , su recorrido es la diferencia aritmética entre el máximo y el mínimo de estos valores. ???? = ????á?? – ????í?? Ejemplo ilustrativo: Calcula el rango de las siguientes distribuciones: 1) 4, 6, 8, 10, 12, 14, 16 2) 5, 10, 13, 13, 14, 15, 17
Solución: ????1 = 16 – 4 = 12 ; ????2 = 17 – 5 = 12
En Excel:
Ambas series tienen rango 12, pero están desigualmente distribuidas, pues mientras la primera se distribuye uniformemente a lo largo de todo el recorrido, la segunda tiene una mayor concentración en el centro.
La amplitud es una medida de dispersión cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas:
– En su cálculo sólo intervienen dos elementos del conjunto.
– Al aumentar el número de observaciones, puede esperarse que aumente la variabilidad. Puesto que la amplitud no tiene en cuenta el tamaño del conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que éstos sean del mismo tamaño.
Nota: Cuando los datos están agrupados en intervalos se calcula la amplitud sacando la diferencia entre la marca de clase mayor y la marca de clase menor.
b) AMPLITUD INTERCUARTÍLICA
La amplitud intercuartílica es la distancia entre el tercer cuartil ??3 y el primer cuartil ??1. Amplitud intercuartílica = tercer cuartil – primer cuartil = ??3 – ??1
c) RANGO SEMI-INTERCUARTIL O DESVIACIÓN CUARTÍLICA La desviación cuartílica es la mitad de la distancia entre el tercer cuartil y el primero ??3 – ??1 ???? = 2 Ejemplo ilustrativo: Si el tercer cuartil = 24 y el primer cuartil = 10. ¿Cuál es la desviación cuartílica?
Solución: La amplitud intercuartílica es 24 – 10 = 14. Por lo tanto, la desviación cuartílica es: ???? = 14 2 d) RANGO PERCENTIL O AMPLITUD CUARTÍLICA
Cada conjunto de datos tiene 99 percentiles, que dividen el conjunto en 100 partes iguales. La amplitud cuartílica es la distancia entre dos percentiles establecidos. ?????????? ?????????????????? = ??90 – ??10
DISPERSIÓN RELATIVA O COEFICIENTE DE VARIACIÓN El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos, que se obtiene dividiendo la desviación estándar del conjunto entre su media aritmética y se expresa generalmente en términos porcentuales. Para una población se emplea la siguiente fórmula: ?? ???? = · 100% ?? Donde: ???? = ?????????????????????? ???? ??????????????ó??; ?? = ????????????????ó?? ??????á???????? ???? ???? ??????????????ó?? ?? = ?????????? ??????????é???????? ???? ???? ??????????????ó?? Para una muestra se emplea la siguiente fórmula: ?? ???? = · 100% ??¯ Donde: ???? = ?????????????????????? ???? ??????????????ó??; ?? = ????????????????ó?? ??????á???????? ???? ???? ?????????????? ??¯ = ?????????? ??????????é???????? ???? ???? ??????????????
Ejemplo ilustrativo: Mathías, un estudiante universitario, tiene las siguientes calificaciones en las 10 asignaturas que recibe en su carrera: 8, 7, 10, 9, 8, 7, 8, 10, 9 y 10. Emily, una compañero de Mathías, tiene las siguientes calificaciones: 8, 9, 8, 7, 8, 9, 10, 7, 8 y 10. ¿Cuál estudiante tiene menor variabilidad en sus calificaciones?
Solución: Como se está tomando en cuenta todas las asignaturas, se debe calcular el coeficiente de variación poblacional. En Excel:
Agrupando los datos en tablas de frecuencias: Para Mathías se obtiene: En Excel: Para Emily se obtiene: En Excel: Interpretación: Por lo tanto, Emily tiene menor variabilidad en sus calificaciones Fuente: Suárez, Mario. & Tapia, Fausto. (2014). Interaprendizaje de Estadística Básica. Ibarra, Ecuador: Universidad Técnica de Norte Suárez, Mario. (2014). Probabilidades y Estadística empleando las TIC. Ibarra, Ecuador: Imprenta GRAFICOLOR Libros y artículos del Mgs. Mario Suárez sobre Aritmética, Álgebra, Geometría, Trigonometría, Lógica Matemática, Probabilidades, Estadística Descriptiva, Estadística Inferencial, Cálculo Diferencial, Cálculo Integral, y Planificaciones Didácticas se encuentran publicados en: http://es.scribd.com/mariosuarezibujes http://repositorio.utn.edu.ec/handle/123456789/760 http://www.docentesinnovadores.net/Usuarios/Ver/29591