Descargar

Cuartiles, diagrama de caja y bigotes, deciles y percentiles con Excel y con Geogebra


    edu.red

    4 2 4 [ ] 4 4 4 CUARTILES, DIAGRAMA DE CAJA Y BIGOTES, DECILES Y PERCENTILES CON EXCEL Y CON GEOGEBRA

    Son similares a la mediana en que también subdividen una distribución de mediciones de acuerdo con la proporción de frecuencias observadas. Mientas que la mediana divide a una distribución en mitades, los cuartiles (Q) la dividen en cuartos, los deciles (D) la dividen en décimos y los puntos percentiles (P) la dividen en centésimos. Colectivamente, cuartiles, deciles y percentiles se denominan cuantiles. Puesto que sirven para ubicar datos particulares dentro de ciertas porciones de una distribución de datos, toman el nombre de medidas de posición.

    1) CUARTILES.- Son cada uno de los 3 valores ??1 , ??2 , ??3 que dividen a la distribución de los datos en 4 partes iguales.

    i) Propiedades Los cuartiles son un caso particular de los percentiles. Hay 3 cuartiles: Primer cuartil: ??1 = ??25 , segundo cuartil: ??2 = ??5 = ??50 = Mediana, tercer cuartil: ??3 = ??75

    ii) Métodos de Cálculo

    a) Para Datos No Agrupados

    La posición o ubicación de los cuartiles se encuentra aplicando la siguiente ecuación:

    ???? = ??[??·?? +1] = ??[??·??+2] Donde: n = número total de datos k = número del cuartil

    Ejemplo ilustrativo:

    Encuentre los cuartiles dada la siguiente distribución: 6, 9, 9, 12, 12, 12, 15 y 17

    Solución: Para calcular los cuartiles se ordena los datos de menor a mayor

    6 9 9 12 12 12 15 17 ??1 ??2 ??3 ??4 ??5 ??6 ??7 ??8

    Aplicando la ecuación para el cuartil uno se obtiene:

    ???? = ?? ??·??+2 4

    ??1 = ??[??+2] = ??[8+2]= ??[10]= ??2,5

    Como la posición del cuartil 1 es 2,5, su valor es el promedio de los datos segundo y tercero ??1 = ??2,5= ??2 + ??3 9 + 9 = 2 2 =9

    edu.red

    O también la posición 2,5 dice que el cuartil 1 está ubicado al 50% del trayecto comprendido entre el segundo dato, que es 9 y el tercer dato que es 9, es decir, Q1= 9+0,5(9-9) = 9 Interpretación: Este resultado indica que el 25% de los datos es inferior a 9 En Excel se calcula de la siguiente manera: a) Se inserta la función CUARTIL.INC. b) Pulse en Aceptar para visualizar la ventana Argumentos de Función. En la casilla Matriz seleccione los datos (Rango A1:A8)

    edu.red

    c) Escribir 1 en la opción Cuartil en la ventana de los argumentos la función. d) Pulsar en Aceptar. En GeoGebra se calcula de la siguiente manera: a) Ingresar a GeoGebra. En Entrada escribir Q1

    edu.red

    b) Seleccionar Q1[] c) Escribir los datos: Q1[6,9,9,12,12,12,15,17] d) Enter

    edu.red

    4 4 4 4 4 4 4 4 4 4 Aplicando la ecuación para el cuartil dos se obtiene: ???? = ??[??·??+2]

    ??2 = ??[??·2+2] = ??[2??+2]= ??[2·8+2]= ??[16+2]= ??4,5= ??4 + ??5 12 + 12 = 2 2 = 12 O también la posición 4,5 dice que el cuartil 2 está ubicado al 50% del trayecto comprendido entre el cuarto dato, que es 12 y el quinto dato que también es 12, es decir,

    ??2 = 12 + 0,5(12 – 12) = 12

    Interpretación: Este resultado indica que el 50% de los datos es inferior a 12

    En Excel se calcula de la siguiente manera:

    Repetir los pasos para el cuartil 1, y en la opción de cuartil, escribir 2

    En GeoGebra se calcula de la siguiente manera: Para calcular el cuartil 2 se repite los pasos para calcular la Mediana:

    Aplicando la ecuación para el cuartil tres se obtiene: ???? = ??[??·??+2] ??3 = ??[3??+2]= ??[3·8+2]= ??[24+2]=??26 = ??6,5= ??6 + ??7 12 + 15 = 2 2 = 13,5 O también la posición 6,5 dice que el cuartil 2 está ubicado al 50% del trayecto comprendido entre el doceavo dato, que es 12 y el quinceavo dato que es 15, es decir, ??3 = 12+0,5(15-12)

    ??3 = 12+0,5(3)=12+1,5=13,5

    edu.red

    Interpretación: Este resultado indica que el 75% de los datos es inferior a 13,5 En GeoGebra se calcula de la siguiente manera: En Excel se calcula de la siguiente manera: Repetir los pasos para el cuartil 1, y en la opción de cuartil escribir 3. Notas importantes: -Los cálculos en Excel para un número impar de datos coinciden con los cálculos realizados con las ecuaciones. -Para un número par de datos, aunque en ciertas ocasiones coinciden, suele existir diferencias en los cálculos del Q1 y Q3 realizados con Excel. Este error de cálculo es: e = 0,25d, en donde d es la distancia de separación de los datos -Para el Q1 se resta el error al valor obtenido con Excel -Para el Q3 se suma el error al valor obtenido con Excel En nuestro ejemplo ?? = 0,25(??7 – ??6 ) = 0,25(15 – 12) = 0,25(3) = 0,75. Al sumar el error al valor ??3 inicialmente calculado con Excel se obtiene el valor correcto como se muestra en la siguiente figura:

    edu.red

    4 4 2 2 2 4 b) Para Datos Agrupados en Tablas de Frecuencias

    Se aplica la misma ecuación empleada para el cálculo en los datos no agrupados

    Ejemplo ilustrativo: Dada la siguiente tabla: ?? 6 9 12 15 17 ?? 1 2 3 1 1 1) Calcular el cuartil 2

    2) Representar los cuartiles en un histograma para la fra(%) (Frecuencia relativa acumulada medida en porcentajes). Determinar gráficamente el valor de los cuartiles

    Solución: 1) Cálculo del cuartil 2 Aplicando la primera ecuación para el cuartil dos se obtiene:

    ???? = ??[??·??+2] ??2 = ??[??·2+2] = ??[2(??+1)]= ??[??+1]= ??[8+1]= ??[9]= ??4,5

    Como la posición del cuartil 2 es 4,5, su valor es el promedio de los datos cuarto y quinto

    Para observar con claridad cuáles son los datos cuarto y quinto se aconseja calcular la frecuencia acumulada ?? ?? ???? 6 1 1 9 2 3 12 3 6 15 1 7 17 1 8

    Se observa que el cuarto dato es 12 y el quinto dato es 12, por lo tanto ??2 = ??4,5= ??4 + ??5 12 + 12 = 2 2 = 12 2) Representando los cuartiles en un histograma para la fra(%) Calculando la fra(%) se obtiene: ?? 6 9 ?? 1 2 ???? 1 3 ???? 0,125 0,25 ?????? ?????? (%) 0,125 12,5 0,375 37,5 12 3 6 0,375 0,75 75 15 1 7 0,125 0,875 87,5 17 1 8 0,125 1 100 n 8

    edu.red

    A continuación se presenta el gráfico solicitado elaborado en Excel y Paint:

    Histograma para la fra(%)

    Observando en el gráfico anterior se observa que ??1 = 9, ??2 = 12 ?? ??3 = (12 + 5)/2 = 13,

    c) Para Datos Agrupados en Intervalos

    Se emplea la siguiente ecuación: nk Qk = LiQ + ( 4 – Fa fQ ) · ?? Donde: ?????? = Límite inferior del intervalo de clase del cuartil ?? = Número total de datos ???? = Frecuencia acumulada del intervalo de clase que antecede al intervalo de clase del cuartil ???? = Frecuencia absoluta del intervalo de clase del cuartil ?? = Ancho del intervalo de clase del cuartil

    Ejemplo ilustrativo: Dado los siguientes datos sobre pesos de un grupo de 50 personas: Intervalos 45 – 55 55 – 65 65 – 75 75 – 85 85 – 95 ?? 6 10 19 11 4 1) Calcular los cuartiles empleando la ecuación

    2) Calcular los cuartiles empleando un histograma para fra(%) (Frecuencia relativa acumulada mediada en porcentajes)

    edu.red

    Solución: 1) Cálculo de los cuartiles empleando la ecuación

    1.1) Cálculo del primer cuartil

    Primero se calcula nk/4 y después se averigua el intervalo en el que está el cuartil, este intervalo recibe el nombre de intervalo o clase del primer cuartil. Para averiguar el intervalo en el que están los cuartiles se aconseja calcular la frecuencia acumulada ?? · ?? 50 · 1 = 4 4 = 12,5 Intervalos 45- 55 55- 65 65- 75 75- 85 85- 95 n ?? 6 10 19 11 4 50 ???? 6 16 35 46 50 Por lo tanto en este ejemplo: El intervalo del segundo cuartil es 55-65. El número total de datos es n=10 Se observa que 6 valores están por debajo del valor 55, es decir Fa=6. La frecuencia absoluta ???? del intervalo del cuartil es 10 El ancho del intervalo del cuartil es c=65-55=10.

    Al aplicar la ecuación se obtiene: nk Qk = LiQ + ( 4 – Fa fQ )·c 50 · 1 50 Q1 = 55 + ( 4 – 6) · 10 = 55 + ( 4 – 6) · 10 = 55 + (13) · 10 = 55 + 6,5 10 10 20

    Q1 = 61,5

    1.2) Cálculo del segundo cuartil

    Primero se calcula nk/4 y después se averigua el intervalo en el que está el cuartil, este intervalo recibe el nombre de intervalo o clase del cuartil. ?? · 2 50 · 2 = 4 4 = 25 Por lo tanto para el segundo cuartil se tiene: Intervalo: 65-75 n=10 Fa=16 fQ =19 c =75-65 =10

    edu.red

    Al aplicar la ecuación se obtiene: nk Qk = LiQ + ( 4 – Fa fQ )·c 50 · 2 100 Q2 = 65 + ( 4 – 16) · 10 = 65 + ( 4 – 16) · 10 = 65 + ( 9 ) · 10 = 65 + 4,737 19 19 19

    Q2 = 69,737

    1.3) Cálculo del tercer cuartil

    Primero se calcula nk/4 y después se averigua el intervalo en el que está el cuartil, este intervalo recibe el nombre de intervalo o clase del cuartil. ?? · 3 50 · 3 = 4 4 = 37,5 Por lo tanto para el segundo cuartil se tiene: Intervalo: 75-85

    ?? = 10 ???? = 35 ???? = 11 ?? = 85 – 75 = 10

    Al aplicar la ecuación se obtiene: nk Qk = LiQ + ( 4 – Fa fQ )·c 50 · 3 150 Q3 = 75 + ( 4 – 35) · 10 = 75 + ( 4 – 35) · 10 = 75 + ( 5 ) · 10 = 75 + 2,273 11 11 22

    Q3 = 77,273

    2) Cálculo de los cuartiles empleando un histograma para fra(%)

    2.1) Calculando la fra(%) se obtiene: Intervalos 45 – 55 55 – 65 65 – 75 75 – 85 85 – 95 ?? 6 10 19 11 4 ???? 6 16 35 46 50 ???? 0, 12 0, 20 0, 38 0, 22 0, 08 ?????? (%) 12 32 70 92 100 n 50

    edu.red

    2.2) Elaborando el histograma en Excel y en Paint se obtiene la siguiente figura:

    Histograma para la fra(%)

    2.3) Cálculo del primer cuartil

    Observando en gráfico tenemos que el Q1 = 55 + AE

    Los triángulos ABC y AED son semejantes, por lo que se cumple: ???? ???? = ???? ???? 65 – 55 ???? = 32 – 12 25 – 12 ? 10 ???? = 20 13 Despejando AE se obtiene: 10 20 · 13 = ???? ? ???? = 6,5 Entonces, Q1 = 55 + 6,5 = 61,5

    2.3) Cálculo del segundo cuartil

    Observando en gráfico tenemos que el Q2 = 65 + CI

    Los triángulos CFG y CIH son semejantes, por lo que se cumple: ???? ???? = ???? ???? 75 – 65 ???? = 70 – 32 50 – 32 ? 10 ???? = 38 18

    edu.red

    10 38 Despejando CI se obtiene: · 18 = ???? ? ???? = 4,737 Entonces, Q2 = 65 + 4,737 = 69,737

    2.3) Cálculo del tercer cuartil Observando en gráfico tenemos que el Q3 = 75 + GM

    Los triángulos GJK y GML son semejantes, por lo que se cumple: ???? ???? = ???? ???? 85 – 75 ???? = 92 – 70 75 – 70 ? 10 ???? = 22 5 Despejando CI se obtiene: 10 · 5 = ???? ? ???? = 2,273 22 Entonces, ??3 = 75 + 2,273 = 77,273

    iii) Diagrama de caja y bigotes

    Un diagrama de caja y bigotes es una representación gráfica que ayuda a visualizar una distribución de datos: caja desde ??1 a ??3 (50% de los datos), y bigotes el recorrido (distancia desde valor mínimo hasta el valor máximo).

    Para elaborar un diagrama de caja se procede de la siguiente manera:

    a) Se marca los valores de la serie de datos sobre el eje horizontal o vertical.

    b) Se ubica sobre el eje el valor mínimo, primer cuartil, mediana o segundo cuartil, tercer cuartil y el valor máximo.

    c) Se construye un rectángulo (caja) paralelo al eje, de longitud desde Q1 a Q3 y anchura arbitraria.

    De acuerdo al ejemplo ilustrativo del cálculo de cuartiles para datos sin agrupar de la distribución de datos 6, 9, 9, 12, 12, 12, 15 y 17 se obtiene: Valor mínimo = 6 ??1 = 9 ??2 = 12 ??3 = 13,5 Valor máximo = 17 Por lo tanto el diagrama de caja y bigotes es:

    edu.red

    El diagrama de caja y bigotes en GeoGebra se elabora de la siguiente manera: a) Ingrese al programa b) En la casilla Entrada escriba las primeras letras de DiagramaCaja

    edu.red

    c) Seleccione DiagramaCaja[ , , ] y dicha opción escriba DiagramaCaja[ 2,1,{6,9,9,12,12,12,15,17}]. Para escribir las llaves, en Vista seleccione Teclado. En el teclado virtual seleccione

    edu.red

    d) Enter e) Editando el diagrama se obtiene: 2) DECILES i) Definición Son cada uno de los 9 valores ??1 , ??2 , ??3 , ??4 , ??5 , ??6 , ??7 , ??9 que dividen a la distribución de los datos en 10 partes iguales. El primer decil es igual al décimo percentil (??1 = ??1 ), el segundo decil es igual al veinteavo percentil (??2 = ??20 ), y así sucesivamente.

    edu.red

    10 2 10 10 10 10 10 10 ii) Métodos de Cálculo

    a) Para Datos No Agrupados La posición o ubicación de los deciles se encuentra aplicando la siguiente ecuación: ???? = ??[??·??+1] = ??[??·??+5] Donde: n = número total de datos. k = número del decil.

    Ejemplo ilustrativo: Calcular el quinto decil de la siguiente distribución: 6, 9, 9, 12, 12, 12, 15 y 17

    Solución: Para calcular los deciles se ordena los datos de menor a mayor. 6 9 9 12 12 12 15 17 ??1 ??2 ??3 ??4 ??5 ??6 ??7 ??8

    Aplicando la ecuación para el quinto decil se obtiene: ???? = ??[??·??+5]

    ??5 = ??[??·5+5] = ??[5??+5]= ??[5·8+10]= ??[40+5]= ??4,5= ??4 + ??5 12 + 12 = 2 2 = 12 O también la posición 4,5 dice que el decil 5 está ubicado al 50% del trayecto comprendido entre el cuarto dato, que es 12 y el quinto dato que también es 12, es decir, D5= 12+0,5(12-12) = 12

    En Excel se calcula de la siguiente manera:

    Como D5 es igual a P50 se introduce la función PERCENTIL.INC(A1:A8;0,5) como se muestra en la siguiente figura:

    b) Para Datos Agrupados en Tablas de Frecuencia Se emplea la misma ecuación utilizada en el cálculo de los deciles para datos sin agrupar.

    c) Para Datos Agrupados en Intervalos Se emplea la siguiente ecuación: nk Dk = LiD + (10 – Fa fD ) · ??

    edu.red

    [ + ] [ ] 100 100 100 100 Donde: ?????? = Límite inferior del intervalo de clase del decil. ?? = número total de datos. ???? = Frecuencia acumulada del intervalo de clase que antecede al intervalo de clase del decil. ???? = Frecuencia absoluta del intervalo de clase del decil. ?? = Ancho del intervalo de clase del decil.

    3) PERCENTILES O CENTILES

    i) Definición Son cada uno de los 99 valores P1, P2, P3,……..P99 que dividen atribución de los datos en 100 partes iguales.

    ii) Métodos de Cálculo

    a) Para Datos No Agrupados La posición o ubicación de los percentiles se encuentra aplicando la siguiente ecuación: ???? = ?? ??·?? 1 = ?? ??·??+50 100 2 100 Donde: n = número total de datos k = número del percentil Ejemplo ilustrativo: Calcular los percentiles de orden 20 y 33 del peso de diez personas que pesan (en kg)

    80, 78, 65, 73, 65, 67, 72, 68, 70 y 72 Solución: Se ordena los datos de menor a mayor se tiene: 65 65 67 68 70 72 72 73 78 80 ??1 ??2 ??3 ??4 ??5 ??6 ??7 ??8 ??9 ??10

    1) Cálculo del percentil de orden 20 se obtiene: ???? = ??[??·??+50 ]

    ??20 = ??[??·20+50]= ??[10·20+50]=??[250]= ??2,5= ??2 + ??3 65 + 67 = 2 2 = 66 En Excel se obtiene un valor aproximado insertando la función PERCENTIL.INC(A1:A10:0,2) como se muestra en la siguiente figura:

    edu.red

    100 100 100 100 2) Cálculo del percentil de orden 33 se obtiene:

    ???? = ??[??·??+50 ] ??33 = ??[??·33+50]= ??[10·33+50]=??[380]= ??3,8= ??3 + ??4 67 + 68 = 2 2 = 67,5 = 68 En Excel se obtiene un valor aproximado insertando la función PERCENTIL.INC(A1:A10:0,33) como se muestra en la siguiente figura:

    b) Para Datos Agrupados en Tablas de Frecuencia Se emplea la misma ecuación utilizada en el cálculo de los percentiles para datos sin agrupar.

    c) Para Datos Agrupados en Intervalos Se emplea la ecuación:

    nk Pk = LiP + (100 – Fa) · c fP Donde: ?????? =Límite inferior del intervalo de clase del percentil. ?? = número total de datos. ???? = Frecuencia acumulada del intervalo de clase que antecede al intervalo de clase del percentil. ???? = Frecuencia absoluta del intervalo de clase del percentil. ?? = Ancho del intervalo de clase del percentil.

    TAREA DE INTERAPRENDIZAJE

    1) ¿El valor de la mediana con qué valor del cuartil, decil y del percentil coincide?. Plantee y resuelva un ejercicio para ilustrar su respuesta.

    2) ¿Por qué a los cuartiles, deciles y percentiles se les considera como medidas de posición?

    3) Realice un organizador gráfico sobre las medidas de posición.

    edu.red

    4) Calcule los 3 cuartiles de las siguientes distribuciones de datos de manera manual, empleando Excel y GeoGebra. Realice los diagramas de caja y bigotes de manera manual y empleando GeoGebra. 4.1) 5, 2, 6, 4, 1 y 3 ??1 = 2; ??2 = 3; ??3 = 5 4.2) 5, 2, 8, 4, 1, 6, 7 y 3 ??1 = 2,5; ??2 = 4,5; ??3 = 6,5 4.3) 9, 2, 8, 4, 5, 6, 7, 3 y 1 ??1 = 3; ??2 = 5; ??3 = 7 4.4) 36, 8, 12, 32, 24, 28, 16 y 4 ??1 = 10; ??2 = 20; ??3 = 30 4.5) 80, 70, 40, 60, 50, 30, 20 y 10 ??1 = 25; ??2 = 45; ??3 = 65 5) Dada la siguiente tabla: ?? 6 9 12 15 17 ?? 1 2 3 1 1 5.1) Calcule el primero y tercer cuartil. Q1=9; Q3=13,5 5.2) Calcule el segundo cuartil empleando un histograma para la frecuencia absoluta acumulada. Q2=12 6) Cree y resuelva un ejercicio similar al presentado en el cálculo de los cuartiles para datos agrupados en intervalos. 7) Emplee los datos del ejercicio anterior y calcular los cuartiles empleando un histograma para la frecuencia absoluta acumulada. 8) Calcule el quinto decil de 1, 3, 6, 9, 12, 15, 18 y 21 de manera manual y empleando Excel. D5=10,5 9) Cree y resuelva un ejercicio sobre el cálculo del decil 3 y del decil 7 para datos agrupados en tablas de frecuencias. 10) Cree y resuelva un ejercicio sobre el cálculo de los deciles de orden 4 y 8 para datos agrupados en intervalos empleando las ecuaciones y a través de un histograma para la fra(%). 11) Calcule el percentil de orden 25 de 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 y 22 de manera manual y empleando Excel. P25=6 12) Calcule el percentil de orden 75 de 10, 20, 40, 50, 60, 70, 80, 90, 100, 120 y 140. P75=95 13) Plantee y resuelva un ejercicio sobre el cálculo de los percentiles 35 y 60 para datos agrupados en intervalos empleando la fórmula y a través de un histograma para la fra(%). 14) Consulte en la biblioteca o en el internet sobre las aplicaciones de las medidas de posición en la vida diaria. Presente la consulta a través de un organizador gráfico.