Descargar

Estadística desde cero (página 2)


Partes: 1, 2
edu.red

NúmerodeI.E. NºdeTuristas 9 SEMANA 3 – PRESENTACIÓN DE DATOS Las tablas de frecuencias de los datos estadísticos muestran una información ordenada del hecho que se analiza y estudia. Además de esta forma de presentación es útil conocer la forma de presentarlos gráficamente para obtener una apreciación global, rápida y visual de la información señalada. Gráfico de Bastones Se utiliza para describir datos cuando la variable es discreta. Su construcción se hace levantando segmentos perpendiculares al eje de la variable y con una altura proporcional a su frecuencia absoluta o relativa porcentual. Número de Docentes Histograma de Frecuencias Se utiliza para describir datos cuando la variable es continua. Su construcción se hace levantando sobre el eje de la variable rectángulos que tengan por base la amplitud del intervalo de clase y una altura proporcional a su frecuencia absoluta o relativa porcentual. Gastos en Dólares Albert Maguiña R.

edu.red

NºdeTuristas NºdePersonas Polígono de Frecuencias

Se utiliza también para describir datos cuando la variable es continua. Su construcción se hace uniendo los puntos medios superiores de los rectángulos en el histograma.

Gastos en Dólares

Gráfico de Barras

Se utiliza para describir datos cuando la variable es cualitativa. Su construcción se hace levantando barras proporcionales a su frecuencia absoluta o relativa porcentual.

Estado Civil

Gráfico de Sectores Circulares

Se utiliza también para describir datos cuando la variable es cualitativa. Se usa frecuentemente cuando se desea comparar cada categoría de la variable con respecto al total. Para su elaboración se utiliza una circunferencia, siendo Albert Maguiña R. 10

edu.red

I. II. necesario que los valores absolutos y/o porcentuales sean traducidos en grados sexagesimales.

TRABAJO PRA CTICO 3

Los siguientes datos corresponden a una muestra de pequeñas empresas según su número de trabajadores afiliados al sistema privado de pensiones. 1 3 3 3 2 2 4 3 3 2 5 4 4 4 3 4 4 5 3 3 1 3 4 5 3 3 5 4 3 2 Construir un Gráfico y Comentar

Los siguientes datos corresponden a una muestra aleatoria de los gastos semanales en dólares de 20 turistas que se alojaran en el hotel “El Delfín” de la ciudad de Lima. 400 680 640 750 1000 500 750 650 800 890 550 780 700 850 850 600 630 740 750 950 Construir un Gráfico y Comentar Albert Maguiña R. 11

edu.red

AustraliaEstadosUnidos GreciaDinamarcaSuecia CoreadelSur Luxemburgo ReinoUnido EspañaSuiza Alemania Japón Bélgica HolandaFrancia III. IV. V. Los siguientes datos corresponden a una muestra aleatoria de 30 docentes de la Universidad Católica los Ángeles según su estado civil del semestre 2010 – I

S C S C C D V C D C C D C C C S V C S S C C S S C C C C C C

a) Construir un Gráfico y Comentar

En un estudio sobre deudas incobrables entre los trabajadores estatales de cierta urbanización de Chimbote, se determinó que a través de los años, la dinámica de dicho fenómeno fue la siguiente: 1985: 10 hombres y 5 mujeres. 1990: 20 hombres y 16 mujeres. 1995: 45 hombres y 32 mujeres, 2000: 80 hombres y 45 mujeres. Se pide: Presentar la información en una tabla de frecuencias e indicar la escala de medición de la variable utilizada.

En el siguiente estudio se analizan los sueldos que ganan las mujeres en la industria en diversos países del mundo, en porcentaje sobre lo que gana los hombres: 60 64 54 43 65 67 68 68 73 74 77 79 79 84 89 mujer en Suiza gana 1300 ¿cuánto gana un hombre mismo puesto y con la categoría profesional? en promedio, gana en un sueldo mensual de euros netos. ¿Cuánto si fuese mujer? Albert Maguiña R. 12

edu.red

fi SEMANA 4 – MEDIDAS DE TENDENCIA CENTRAL

A veces, de los datos recolectados ya organizados en alguna de las formas vistas en capítulos anteriores, se desea encontrar una especie de punto central en función de sus frecuencias. En Estadística se conocen tres diferentes, llamadas Medidas de Tendencia Central, cuya utilización varía de acuerdo con lo que se desee del conjunto de datos recolectados. Esas tres medidas de tendencia central son la media, la mediana y la moda.

Cada una de ellas se estudiará en dos partes: primero, cuando los datos están organizados en tablas de distribución de frecuencias simples y, segundo, cuando están organizados en intervalos. Además, a veces difieren las fórmulas para calcular alguna de ellas si se trata de poblaciones o de muestras. En caso de que no se diga nada, deberá entenderse que la fórmula es la misma para ambas.

La Media

La media, llamada también media aritmética, es la medida de tendencia central conocida popularmente como “promedio”.

La media para frecuencias simples

Cuando los datos recolectados han sido organizados en una tabla de distribución de frecuencias simples, la media, para poblaciones como para muestras, se puede calcular por medio de la fórmula f x ? Ejemplo Calificaciones x i n i

Calificaciones fi 1 2 3 4 5 3 3 6 8 9 6 7 8 9 10 17 22 10 6 5 Albert Maguiña R. 13

edu.red

fi i Calificaciones fi . xi 1 2 3 3 3 6 Tenemos: 3 6 18 n fi 89 4 8 32 5 6 9 17 45 102 f i xi 544

f x 7 8 22 10 154 80 x n i i 9 6 54 x 544 x 6,11 10 Total 5 89 50 544 89 La media para frecuencias por intervalos

Cuando los datos recolectados han sido organizados en una tabla de frecuencias por intervalos, la media para poblaciones como para muestras se puede calcular por medio de la fórmula f y x i n i ? Ejemplo Tenemos: Intervalos [0 – 2] [3 – 5] [6 – 8] fi 12 13 23 Intervalos [0 – 2] [3 – 5] [6 – 8] fi 12 13 23 yi 1 4 7 fi . yi 12 52 161 n fi

f i yi 82

619 [ 9 – 11 ] 16 [ 9 – 11 ] 16 10 160 f y [ 12 – 14 ] Total 18 82 [ 12 – 14 ] Total 18 82 13 – 234 619 x i n x 619 x 7,55 82 Albert Maguiña R. 14

edu.red

– La Mediana

La mediana es la medida de tendencia central que se define como aquel valor nominal que tiene, dentro de un conjunto de datos ordenados, arriba y abajo de él, el mismo número de datos nominales. En otras palabras, es el dato que está a la mitad, es el dato que divide en dos partes iguales a un conjunto de datos.

La Mediana para frecuencias simples

Cuando los datos recolectados han sido organizados en una tabla de distribución de frecuencias simples, la mediana, para poblaciones como para muestras, se puede calcular por medio de la fórmula Fi n 2 xi Fi xi Me ? Ejemplo X

0 1 i f i 1 1 F i 1 2 2 3 3 5 5 10 Fi 117 2 Fi 58,5 Fi 74 4 5 6 6 7 11 16 23 34 7 15 49 xi F74 xi 8 Me 8 8 9 10 Total 25 20 23 117 74 94 117 La Mediana para frecuencias por intervalos

Cuando los datos recolectados han sido organizados en una tabla de frecuencias por intervalos, la mediana para poblaciones como para muestras se puede calcular por medio de la fórmula Albert Maguiña R. 15

edu.red

Me Linf n 2 F

f i i 1 C Fi n 2 [ Linf Lsup ] Fi Me [ Linf Lsup ] ? Ejemplo Linf – Lsup

[ 1 – 30 ] fi 1 Fi 1 [ 31 – 60 ] 1 2 Fi 49 Fi 24,5 Fi 34 Me 181 24,5 23 29 [ 61 – 90 ] 3 5 2 11 [ 91 – 120 ] 5 10 [ 121 – 150 ] 6 16 [181 210] Fi 34 [ 151 – 180 ] 7 23 Me [181 210] Me 184,95 [ 181 – 210 ] 11 34 [ 211 – 240 ] 15 49 Total 49 – La Moda

La moda es la medida de tendencia central que se define como aquel valor nominal que tiene la frecuencia mayor. Por lo tanto, una distribución de frecuencias puede tener más de una moda o, inclusive, no tener moda cuando todos los datos tienen frecuencia 1.

La Moda para frecuencias simples

Cuando los datos recolectados han sido organizados en una tabla de distribución de frecuencias simples, la moda, para poblaciones como para muestras, se puede calcular por medio de la fórmula f i f x xi f i Md xi Albert Maguiña R. 16

edu.red

5 2 ? Ejemplo X i fi 1 8 xi fi 2 3 4 5 6 5 13 17 10 7 17 f x f i fx

fi 17 xi

Me 17

xi xi

Me 4

4 Total 60 La Moda para frecuencias por intervalos

Cuando los datos recolectados han sido organizados en una tabla de frecuencias por intervalos, la moda para poblaciones como para muestras se puede calcular por medio de la fórmula

d Md Linf 1 d1 d2 C f i f x [ L inf Lsup ] f i Md [ Linf Lsup ] Donde : d1 f i f i 1 d 2 f i fi 1 ? Ejemplo Linf – Lsup

[ 10 – 20 > fi 8 17 fx [40 50 17 Md 40 4 4 7 10 [ 20 – 30 > Md [40 50 [ 30 – 40 > 13 Md 40 40 [ 40 – 50 > 17 d1 17 13 d1 4 11 [ 50 – 60 > [ 60 – 70 > 10 7 d 17 10 d2 7 Md 40 3,6 Total 60 Albert Maguiña R. 17

edu.red

I. II. III. IV. V. TRABAJO PRA CTICO 4

Halle la Media, la Mediana y la Moda de los siguientes datos: X i

0 1 2 3 4 Total fi

1 4 7 6 2 20 Halle la Media, la Mediana y la Moda de los siguientes datos: Linf – Lsup

[ 26 – 34 > [ 34 – 42 > [ 42 – 50 > [ 50 – 58 > [ 58 – 66 > [ 66 – 74 > [ 74 – 82 > [ 82 – 90 > Total fi 1 2 4 10 16 8 3 7 51 De las edades de cuatro personas, se sabe que la media es igual a 24 años, la mediana es 23 y la moda es 22. Encuentre las edades de las cuatro personas.

Al calcular la media de 125 datos, resultó 42. Un chequeo posterior mostró que en lugar del valor 12,4 se introdujo 124. Corregir la media.

De una central telefónica salieron 70 llamadas de menos de 3 minutos, promediando 2,3 minutos; 40 llamadas de menos de 10 minutos pero no menos de 3 minutos, promediando 6,4 minutos y 10 llamadas de al menos 10 minutos, promediando 15 minutos. Calcular la duración promedio de todas las llamadas. Albert Maguiña R. 18

edu.red

SEMANA 5 – MEDIDAS DE DISPERSIÓN

La media es un buen indicador de la tendencia central de un conjunto de valores, pero no da la información completa de los datos. Para ver por qué, compare la distribución A con la distribución B en la tabla que se muestra a continuación: A 5 6 7 8 9 B 1 2 7 12 13 Media Mediana 7 7 7 7 Ambas distribuciones de números tienen la misma media (y también la misma mediana), pero fuera de esto, son completamente diferentes. En la primera, el 7 es un valor característico aceptable, pero en la segunda, la mayor parte de los valores difieren bastante de 7. Lo que se necesita aquí es alguna medida de dispersión¸ de los datos.

Una de las medidas más útiles de dispersión es la desviación estándar, la cual se basa en las desviaciones de la media que presentan los datos. Para calcular la desviación estándar se aplica la siguiente fórmula:

x ? ? Ejemplo ? s n i x 1 2 Encuentre la desviación estándar muestral para la siguiente distribución de ? frecuencias. Albert Maguiña R. 19

edu.red

s s i X i 2 3 4 5 fi 5 8 10 2 X i fi x xi x x i x 2 2 5 2 5 3 8 4 10 5 2 2 3,36 1,36 1,8496 3

4 8

10 x 25 3 3,36

4 3,36 0,36

0,64 0,1296

0,4096 5 Total 2 25 x 3,36 5 3,36 1,64 – 2,6896 – Pero como los datos no son únicos, es decir, hay repeticiones por cada dato (frecuencias), se tendrá que multiplicar cada valor obtenido por su frecuencia respectiva. Esto es: x i x 2 . fi 1,8496 (5) = 9,2480 2 x x f i i 2 x x f i i n 1 0,1296 (8) = 1,0368

0,4096 (10) = 4, 0960 9,2480 1,0368 4,0960 5,3792 19, 76 25 1 2,6896 (2) = 5, 3792 x x 2 fi 19,76 s 0,91 –

En el caso de que los datos sean agrupados (con intervalos) se utilizará la marca de clase como el valor que representará a cada dato. Albert Maguiña R. 20

edu.red

I. II. III. ? de TRABAJO PRA CTICO 5

Hallar la desviación estándar para cada una de las siguientes distribuciones. X i

0 1 2 3 4 5 6 fi

2 4 21 15 6 1 1 X i [ 61 – 65 > [ 65 – 69 > [ 69 – 73 > [ 73 – 77 > [ 77 – 81 > [ 81 – 85 > [ 85 – 89 ] fi 5 5 6 7 9 14 4 Calcular la desviación típica (estándar) del dinero que gastan mensualmente 30 alumnos de 4° cuyos datos se han recogido en la siguiente distribución:

Intervalo 5 – 9 9 – 13 13 – 17 17 – 21 21 – 25 Frecuencia 10 8 5 4 3 Una aplicación a nuestro mundo real: Marketing

La empresa Gloria comercializa mucho tres de sus productos a nivel nacional. Uno de los objetivos fundamentales de la publicidad de cada producto consiste en lograr que los consumidores reconozcan que Gloria es la que elabora el producto. Para medir qué tan bien cada anuncio publicitario logra tal reconocimiento, se le pidió a un grupo de consumidores que identificara lo más rápido posible a la compañía responsable de una larga lista de productos. El primer producto de Gloria obtuvo un tiempo promedio, antes de ser reconocido, de 2,5 segundos, con una desviación estándar de 0,004 segundos. El segundo producto obtuvo un tiempo promedio, antes de ser reconocido, de 2,8 segundos, con una desviación estándar de 0,006 segundos. El tercer producto obtuvo un tiempo promedio, antes de ser reconocido, de 3,7 segundos, con una desviación estándar de 0,09 segundos. ¿Para cuál ? los productos estuvo el consumidor más alejado del desempeño promedio? Albert Maguiña R. 21

edu.red

1 6 ó 0,5 SEMANA 6 – PROBABILIDADES

En general, la probabilidad es la posibilidad de que algo pase. Las probabilidades se expresa como fracciones , 12 , 98 o como decimales 0,167 ; 0,500 ; 0,889 que están entre cero y uno. Tener una probabilidad de cero significa que algo nunca va a suceder; una probabilidad de uno indica que algo va a suceder siempre.

En la teoría de probabilidad, un evento es uno o más de los posibles resultados de hacer algo. Al lanzar una moneda al aire, si cae cruz es un evento, y si cae cara es otro. De manera análoga si sacamos una carta de un mazo de naipes, el tomar el as de espadas es un evento. Un ejemplo de evento que quizás esté más cercano a su quehacer diario es ser elegido de entre 40 estudiantes para que responda una pregunta. Cuando escuchamos las pocas gratas predicciones del índice de mortalidad en accidentes de tránsito, esperamos no ser uno de tales eventos.

En la teoría de probabilidad, la actividad que origine uno de dichos eventos se llama experimento. Utilizando un lenguaje formal, podríamos hacer la siguiente pregunta: ¿En un experimento de lanzar una moneda, cuál es la probabilidad del evento cara? Y desde luego, si la moneda no está cargada y tiene la misma probabilidad de caer en cualquiera

de sus dos lados (sin posibilidades de que caiga parada), podríamos responder, 12

Al conjunto de todos los resultados posibles de un experimento se llama espacio muestral del experimento. En el de lanzar una moneda, el espacio muestral es: S cara , cruz Teorema de Laplace

Este teorema debe usarse sólo para eventos equiprobables (cada evento tiene la misma posibilidad de que suceda). Laplace menciona que la probabilidad de un evento está dada por la siguiente fórmula: Albert Maguiña R. 22

edu.red

3 6 1 2 ? ? Casos Favorables P xi Casos Posibles ? ? Ejemplo ? Imaginemos que deseamos obtener un número impar al lanzar un dado. ¿Cuáles serían los casos favorables y cuáles los casos posibles? Naturalmente, tendríamos: ? Casos favorables: 1,3,5 Casos posibles: 1, 2,3, 4,5,6 Entonces, la probabilidad de obtener un número impar al lanzar un dado es: P xi : impar P xi : impar Formalizando: Experimento: Lanzar un dado. Espacio muestral: {1, 2, 3, 4, 5, 6} Evento: obtener un # impar, {1, 3, 5} ? ? ? Ejercitándose Resuelva los siguientes problemas, justificando su razonamiento.

a) La probabilidad de extraer una bola roja de una caja es 1/3 ¿Cuál es la probabilidad de sacar una bola que no sea roja? b) Se lanzan dos dados. ¿Cuál es la probabilidad de que sumen 3 ó 4?

c) Una rueda está dividida en 8 sectores iguales, numeradas del 1 al 8. ¿Cuál es la probabilidad de obtener un número impar y mayor que 3?

d) Se tienen 10 fichas con los números 44, 44, 45, 46, 46, 46, 47, 48, 48, 49. ¿Cuál es la probabilidad de sacar una ficha con un número mayor que 46?

e) En una caja hay 50 fichas de igual peso y tamaño. 12 son rojas, 20 son cafés y 18 son amarillas. ¿Cuál es la probabilidad de sacar una roja, una café, una amarilla y nuevamente una roja, en ese orden y sin reposición?

f) Se depositan en una caja tarjetas del mismo tipo con las letras de la palabra HERMANITOS, luego se saca de la caja una tarjeta al azar, la probabilidad de que en ésta esté escrita una vocal es: Albert Maguiña R. 23

edu.red

I. ? II. un TRABAJO PRA CTICO 6

Resuelva cada uno de los problemas que se le propone. No olvide que debe justificar cada uno de sus razonamientos. ?

?

? ?

? ? ?

?

?

? Una máquina produce 100 tornillos de los que 3 son defectuosos. Si se cogen? dos tornillos, halla la probabilidad de que al coger el segundo sea defectuoso, ? con la condición de que el primero también haya sido defectuoso. ? Una familia tiene tres hijos. Hallar la probabilidad de que los tres sean varones.

Se extrae una bola de una urna que contiene 6 bolas rojas y 4 verdes, se? observa si ha sido roja y se vuelve a introducir; luego se extrae otra bola. ¿Cuál ? es la probabilidad de que las dos sean rojas?

Se extraen de una vez dos bolas de una urna que contiene 6 bolas rojas y 4 verdes. ¿Cuál es la probabilidad de que las dos sean rojas? Una aplicación a nuestro mundo real: El dilema del prisionero ? ? En una cárcel hay 3 prisioneros (A; B; C) con historiales similares. En ? momento dado, los tres solicitan el indulto a un tribunal, y sin conocerse más

detalles llega la información al prisionero A de que han concedido el indulto a 2 de los 3 prisioneros. El prisionero A conoce a uno de los miembros del tribunal y puede intentar hacerle una pregunta para obtener algo de información. Sabe que no puede preguntar si él es uno de los dos indultados, pero si puede pedir que le den el nombre de uno de los otros dos (nunca él) que esté indultado. Pensando un poco concluye que si no hace tal pregunta, entonces la probabilidad de ser uno de los dos indultados es 2/3, mientras que si la hace obtendrá respuesta y entonces la probabilidad de ser el otro indultado es 1/2. Por ello, concluye que es mejor no hacer tal pregunta, porque sea cual sea la respuesta, sólo le servirá para disminuir la probabilidad de ser uno de los dos ? indultados. ¿Dónde está el error de su razonamiento?

Albert Maguiña R. 24

edu.red

k ? 2 2 SEMANA 7 – PROBABILIDAD BINOMIAL

Se denomina prueba o ensayo de Bernoulli a todo experimento aleatorio que consiste de solo dos resultados posibles mutuamente excluyentes, generalmente llamados: éxito (E) y fracaso (F). Por ejemplo, son ensayos de Bernoulli, lanzar una moneda al aire con los resultados: cara o sello. Elegir al azar un objeto fabricado, con los resultados: defectuoso o no defectuoso. Se denomina Experimento Binomial a un número fijo “n”, de repeticiones independientes de un experimento aleatorio de Bernoulli. Este se caracteriza por:

1. Las n pruebas son estadísticamente independientes.

2. Los resultados de cada prueba son dos, mutuamente excluyentes: éxito y fracaso.

3. La probabilidad p de éxito es invariante en cada una de las pruebas.

Para calcular la probabilidad Binomial, se usa la siguiente fórmula: n P X k k p k qn ? ? Ejemplo ? La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los lectores ya la han leído. Un grupo de 4 amigos son aficionados a la lectura.

a) ¿Cuál es la probabilidad de que el grupo hayan leído la novela 2 personas? Tenemos los siguientes datos: n 4 k 2 p 0,8 q 0, 2 P X 2 4 2 0,8 0, 2 P X 2 0,1536 b) ¿Cuál es la probabilidad de que el grupo hayan leído la novela a lo más 2 personas? P X 2 P X 0 P X 1 P X 2 Albert Maguiña R. 25

edu.red

4 2 0,8 2 0, 2 2 4 3 0,8 3 0, 2 1 4 4 0,8 4 0, 2 0 0,9728 ? ? Ejercitándose ? a) Se afirma que el 30% de la producción de ciertos instrumentos se realiza con material nacional y los demás con material importado. Si se toma una muestra aleatoria con reemplazo de 25 de estos instrumentos, calcular:

– ¿Cuál es la probabilidad de que 3 de ellos sean de material nacional?

– ¿Cuál es la probabilidad de que no más de 3 de ellos sean de material nacional? – ¿Cuál es la probabilidad de que al menos 3 sean de material nacional?

– ¿Cuántos instrumentos fabricados con material nacional se espera encontrar en la muestra?

b) Un examen consta de 6 preguntas con 4 posibles respuestas cada una, de las que sólo una de ellas es correcta. Un estudiante que no se había preparado la materia responde completamente al azar marcando una respuesta aleatoria. Calcular la probabilidad de que acierte 4 o más preguntas.

c) La probabilidad de que un cazador novato cobre una pieza es 0,4. Si lo intenta 5 veces, calcula la probabilidad de que cobre una pieza al menos 3 veces.

d) El 53% de los trabajadores de una determinada empresa son mujeres. Si elegimos 8 personas de esa empresa al azar, calcula la probabilidad de que:

– Haya más de 6 mujeres – Hallar la media y la desviación estándar.

e) Un examen tipo test consta de 100 preguntas, cada una de las cuales se acompaña de cuatro respuestas, una de ellas correcta y erróneas las otras tres. Si un estudiante contesta al azar, ¿cuál es la probabilidad de que acierte más de 30 preguntas? ¿y menos de 15? Albert Maguiña R. 26

edu.red

I. II. III. IV. TRABAJO PRA CTICO 7

Una urna contiene 6 bolas con números pares y 9 bolas con números impares. Si hacemos diez extracciones con reemplazamiento, calcula la probabilidad de obtener número impar:

– Alguna vez – Más de 8 veces

La probabilidad de que un determinado juguete salga defectuoso es de 0,03. Calcular la probabilidad de que en un lote de 60 de estos juguetes haya:

– Alguno defectuoso – Menos de dos defectuosos

La probabilidad de que un cierto experimento tenga éxito es 0,4. Si repetimos el experimento 15 veces, calcular la probabilidad de que tenga éxito:

– Alguna vez – Menos de dos veces

Lourdes Flores es la alcaldesa de una ciudad grande. Últimamente, se ha estado preocupando acerca de la posibilidad de que grandes cantidades de personas que cobran el seguro de desempleo en realidad tengan un trabajo en secreto. Sus asistentes estiman que el 40% de los beneficiarios del seguro de desempleo entran en esta categoría. Pero la señora Flores no está convencida. Le pide a uno de sus ayudantes que haga una investigación de 10 beneficiarios del seguro tomados al azar, a partir de esta información determine:

– Si los asistentes de la alcaldesa tienen razón, ¿cuál es la probabilidad de que los individuos investigados tengan un empleo? ¿Cuál es la probabilidad de que sólo tres de los individuos investigados tengan trabajo? Albert Maguiña R. 27

edu.red

2 2 c r SEMANA 8 – PRUEBA CHI CUADRADO – X

La Prueba Chi Cuadrado es un instrumento que se utiliza para determinar el grado de dependencia que existe entre dos variables cualitativas.

Esta prueba está dada por la siguiente fórmula: 2 f o f fe Donde: f o Una frecuencia observada e f e Una frecuencia esperada Proceso estadístico Para aplicar la Prueba Chi Cuadrado se debe tomar en cuenta los siguientes pasos:

1. Formulación de la hipótesis

Ho = Hipótesis nula (no existe dependencia) H1

= Hipótesis alternativa (existe dependencia) 2. Nivel de significancia x N.C = x % 3. Grados de libertad 1 100 v r 1 c 1 donde: número de filas número de columnas 4. Estadístico de prueba 2 Tabla con v 5. Establecimiento de los criterios de decisión Albert Maguiña R. 28

edu.red

fo ? ? 6. Cálculos

= frecuencia absoluta de cada celda de la tabla fe = ri . c j donde ri es el total de filas para la fila que contiene dicha celda n de la tabla y c j es el total de columnas para la columna que contiene dicha celda de la tabla. 7. Decisión 2 2 Tabla Se acepta H o Si : 2 2 Tabla Se rechaza H o 8. Coeficiente de contingencia C 2 2 n además C 0, k 1 k Donde k min i , j el mínimo de entre la cantidad de formas posibles de la característica en las variables estudiadas. ? ? Ejemplo ? El señor Althomaro, presidente de la Compañía Nacional General Aseguradora de Salud, se opone al seguro de salubridad nacional. Argumenta que sería muy costoso de implantar, en particular debido a que la existencia de este sistema, entre otras cosas, tendería a fomentar en la gente permanecer más tiempo en los hospitales. Althomaro tiene la creencia de que las hospitalizaciones dependen del tipo de seguro de salud que tengan las personas. Le pide a Raúl Mendoza, el especialista en estadística de la empresa, que verifique el asunto. Mendoza recogió datos de una muestra aleatoria de 660 hospitalizaciones y la información la ? resumió en la tabla 01. Mendoza desea probar las hipótesis:

H0 = tiempo de estancia y tipo de seguro son independientes. ? H1 = el tiempo de estancia depende del tipo de seguro. = 0,01 (nivel de significancia para la prueba de estas hipótesis) Albert Maguiña R. 29

edu.red

Tabla Tabla Tabla 01 Datos de hospitalizaciones clasificados según el tipo de cobertura del seguro y el tiempo de estancia % de costos Días en el hospital cubiertos por el seguro < 25 % 25 – 50 % > 50 % Total < 5 40 30 40 110 5 – 10 75 45 100 220 > 10 65 75 190 330 Total

180 150 330 660 Solución

Paso 1 – formulación de la hipótesis

H0 = tiempo de estancia y tipo de seguro son independientes. H1 = el tiempo de estancia depende del tipo de seguro. Paso 2 – nivel de significancia N.C = 99%, lo cual implica

Paso 3 – grados de libertad = 0,01 v 3 1 3 1 v 4 Paso 4 – Estadístico de prueba 2 2 con 0,01 v 4 13, 28 Paso 5 – Establecimiento de los criterios de decisión Albert Maguiña R. 30

edu.red

c 9 2 Paso 6 – Cálculos

Calculando las frecuencias esperadas de cada celda de la tabla: 180 110 180 220 180 330 f e c 40 1 660 30 f e c 2 75 660 60 fe c 3 65 660 90 150 110 150 220 150 330 f e c 4 30 660 25 f e c 5 45 660 50 fe c 75 6 660 75 f e c 7 40 330 110 660 55 f e c 100 8 330 220 660 110 f e 190 330 330 660 165 Agregando estos valores en la tabla, tenemos: % de costos Días en el hospital cubiertos por el seguro < 5 5 – 10 > 10 Total < 25 %

25 – 50 %

> 50 % 40

30

40 30

25

55 75

45

100 60

50

110 65

75

190 90

75

165 180

150

330 Total 110 220 330 660 40 30 2 75 60 2 65 90 2 30 25 2 45 50 2 2 30 60 90 25 50 2 24,32 75 75 2 40 55 2 100 110 2 190 165 2 75 55 110 165 Paso 7 – Decisión Como 24,32 13, 28 rechazamos H0. En este sentido, Mendoza debe rechazar la hipótesis nula e informar al señor Althomaro que la evidencia refuerza su creencia de que la duración de las hospitalizaciones y la cobertura de los seguros son dependientes entre sí. Albert Maguiña R. 31

edu.red

Total Paso 8 – Coeficiente de contingencia C 24,32 24,32 660 C 0,19 , además el valor máximo que puede tomar C es: C máx 3 1 3 C máx 0,82 , gráficamente podemos observar: 0 C = 0, 19 0, 41 0, 82 Dado que el valor obtenido está muy lejos del valor deseado (0,6) se concluye que la dependencia entre la variables es baja (débil) ? ? Ejercitándose ? a) Estamos interesados en estudiar la fiabilidad de cierto componente informático con relación al distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100 componentes de cada uno de los 3 distribuidores que nos sirven el producto comprobando el número de defectuosos en cada lote. La siguiente tabla muestra el número de defectuosos en para cada uno de los distribuidores. Componentes defectuosos Componentes correctos Total Distribuidor 1 Distribuidor 2 Distribuidor 3 Total 16 24 9 49 94 76 81 251 100 100 100 300 b) Estamos interesados en estudiar la relación entre cierta enfermedad y la adicción al tabaco. Para realizar esto seleccionamos una muestra de 150 individuos, 100 individuos no fumadores y 50 fumadores. La siguiente tabla muestra las frecuencias de enfermedad en cada grupo. Padecen la Enfermedad No Padecen la enfermedad Fumadores No Fumadores Total 12 25 37 88 25 113 100 50 150

Albert Maguiña R. 32

edu.red

I. II. licenciatura III. TRABAJO PRA CTICO 8

Lan Perú desea determinar si existe alguna relación entre el número de vuelos que las personas toman y su ingreso. ¿A qué conclusión llega al nivel del 1% con base en los datos para 100 viajeros en la tabla de contingencia? Ingreso Menos de $ 30 000 30 000 – 50 000 50 000 – 70 000 Más de $ 70 000 Nunca 20 8 7 2 Frecuencia de vuelos Rara vez 15 5 8 5 Con frecuencia 2 1 12 15 Un editor de periódicos, que trata de determinar con precisión las características de mercado de su periódico, se pregunta si la costumbre de la gente de la comunidad de leer diarios está relacionada con el nivel educativo de los lectores. Se aplica una encuesta a los adultos del área referente a su nivel educativo y la frecuencia con que leen el periódico. Los resultados se muestran a continuación: Frecuencia con la que leen Profesional o posgrado NIVEL EDUCATIVO Pasante de Preparatoria No terminó la preparatoria Total Nunca Algunas veces Mañana o tarde Ambas ediciones Total 10 12 35 28 85 17 23 38 19 97 11 8 16 6 41 21 5 7 13 46 59 48 96 66 269 Un educador tiene la opinión de que las calificaciones que obtienen los alumnos de preparatoria dependen de la cantidad de tiempo que ellos pasan escuchando música. Será cierta su opinión. Horas consumidas PROMEDIO DE CALIFICACIONES Total escuchando música A B C D E < 5 5 – 10 11 – 20 > 20 Total 13 20 9 8 50 10 27 27 11 75 11 27 71 41 150 16 19 16 24 75 5 2 32 11 50 55 95 155 95 400 Albert Maguiña R. 33

edu.red

RESPUESTAS DE LOS TRABAJOS PRÁCTICOS

TRABAJO PRÁCTICO 1 – Nociones Básicas de Estadística

1.

a) Población: los jóvenes de la ciudad de Chimbote, entre 18 y 22 años de edad. Muestra: 1000 jóvenes (50 de cada barrio) de la ciudad de Chimbote, entre 18 y 22 años de edad. Recuerde que la muestra es una parte representativa de la población, por ello, debe mantenerse la misma característica. En este caso la característica es tener entre 18 y 22 años de edad.

b) Población: los jóvenes de la ciudad de Chimbote. Muestra: 500 jóvenes de la ciudad de Chimbote, elegidos de manera aleatoria.

2.

a) El ingreso mensual (sueldo) es por excelencia una variable cuantitativa (continua)

b) Lo que aquí importa es el grado que cursan. Por ejemplo, en primer grado hay 25 alumnos, en segundo grado hay 37 alumnos, etc. Por lo tanto, la variable es cualitativa (nominal)

c) El código de identificación es como el DNI (34003247, 76293045, etc.). En consecuencia, la variable es cuantitativa (discreta), dado que, el número de DNI no puede tomar decimales.

d) Los números de las camisetas pueden ser 1, 2, 3, etc. Por lo tanto, la variable es cuantitativa (discreta),

e) Dado que se refiere a la posición, por ejemplo, el 1 significa primer puesto, el 2 significa segundo puesto y 3 el tercer puesto, es decir, posee un orden invariable. por lo tanto, la variable es cualitativa (ordinal) Albert Maguiña R. 34

edu.red

TRABAJO PRÁCTICO 2 – Organización de Datos

1. Edades [ 20 – 25 > [ 25 – 30 > [ 30 – 35 > [ 35 – 40 > [ 40 – 45 > Total fi 12 15 23 11 9 70 Fi 12 27 50 61 70 – hi 0,17 0,21 0,33 0,16 0,13 1 Hi 0,17 0,38 0,71 0,87 1 – hi % 17 21 33 16 13 100 Hi % 17 38 71 87 100 – Yi 22,5 27,5 32,5 37,5 42,5 – A = 30 años o más, es decir, [ 30 – 35 > + [ 35 – 40 > + [ 40 – 45 > = 33+16+13 = 62% B: menos de 40 años, es decir, [ 20 – 25 > + [ 25 – 30 > + [ 30 – 35 > + [ 35 – 40 >, lo cual es igual a 17 + 21 + 33 + 16 = 87%. Luego, A + B = 149%

2. Puntaje [ 10 – 15 > [ 15 – 20 > [ 20 – 25 > [ 25 – 30 > [ 30 – 35 > Total fi 10 15 28 20 17 90 Fi 10 25 53 73 90 – hi 0,11 0,17 0,31 0,22 0,19 1 Hi 0,11 0,28 0,59 0,81 1 – hi % 11 17 31 22 19 100 Hi % 11 28 59 81 100 – Yi 12,5 17,5 22,5 27,5 32,5 – A = [ 20 – 35 > = 31+22+19 = 72% y B = [ 10 – 15 > = 11%, por lo tanto, A – B = 61%

3. Tabla 1 a) 70,11

b) 257, 14 c) 2, 83 d) 27 Tabla 2 a) 90, 12

b) 294, 12 c) 3, 38 d) 25 Albert Maguiña R. 35

edu.red

2 3 8 4 3 TRABAJO PRÁCTICO 3 – Presentación de Datos

1. La variable: número de trabajadores es discreta, por lo tanto, el gráfico que le corresponde es el gráfico de bastones. xi 1 2 3 4 5 fi 2 4 12 8 4 Recuerde que el eje x debe ser mayor al eje y

2. La variable: gastos semanales es continua, por lo tanto, el gráfico que le corresponde es el histograma o en su defecto el polígono de frecuencias.

Teniendo en cuenta que R = 1000 – 400 = 600 m = 1+3,3log 20 = 5 C = 600/5 = 120 LI – LS fi [ 400 – 520 > [ 520 – 640 > [ 640 – 760 > [ 760 – 880 > [ 880 – 1000 >

3. La variable: estado civil es ordinal, por lo tanto, el gráfico que le corresponde es el gráfico circular o en su defecto el gráfico de barras. Albert Maguiña R. 36

edu.red

Estado civil Soltero Casado Divorciado Viudo Total

Cuando la variable es frecuencia 7 18 3 2 30

cualitativa, evite usar Soltero Divorciado Casado Viudo abreviaturas (iniciales). Se recomienda escribir el nombre completo de la categoría.

4. Dado que el problema trata, por un lado, de fechas las cuales tienen un orden invariable y, por otro lado, del género o sexo; podemos afirmar lo siguiente: la fecha corresponde a una variable cualitativa ordinal y el sexo a una variable cualitativa nominal. En consecuencia, el gráfico que le corresponde es el gráfico de barras compuestas, dado que están presentes dos variables.

5. Este problema trata sobre el sueldo que ganan las mujeres respecto a lo que ganan los hombres. Por ejemplo, en Japón, una mujer gana el 43% de lo que gana un hombre (ver gráfico). En este sentido si una mujer, en Suiza, tiene un sueldo de 1300, este valor equivale al 68% del sueldo de un hombre, es decir, un suizo ganaría 1911,76 (ítem 1). De manera análoga, en España una mujer ganaría el 67% de 1102, esto es 738,34 (ítem 2) Albert Maguiña R. 37

edu.red

x a d TRABAJO PRÁCTICO 4 – Medidas de Tendencia Central

1. X i fi Fi Media Mediana Moda 0 1 1 1 2 3 4 Total 4 7 6 2 20 5 12 18 20 – x 0 1

x 20

2, 2 4 5 Fi

Fi

Me 20 2 12

xi Fi

xi

Me 10

2

2 La mayor fi en este caso es f3 7 , en consecuencia, Md = 2 2. Li – Ls [ 26 – 34 > fi 1 Fi 1 Yi 30 Media Mediana [ 34 – 42 > [ 42 – 50 > [ 50 – 58 > 2 4 10 3 7 17 38 46 54 x 30 1 51 86 7 Fi

F i 51 2

33 Fi

[58 26,5

66 [ 58 – 66 > 16 33 62 [ 66 – 74 > [ 74 – 82 > [ 82 – 90 > Total 8 3 7 51 41 44 51 – 70 78 86 – 63,10 Me 58 8 26,5 17 16

Me 62,75 Moda La mayor fi en este caso es f5 16 , en consecuencia Md [58 66 Md 58 8 6 Md 61, 41 6 8 3. Sean las edades: a, b c y d. Entonces, x a b c d 4 24 a b c d 96 y Me b c 2 23 b c 46 a d 50 , en este caso a y d no podrían ser las modas ya que por dato la moda es 22, en consecuencia sumarian 44.

Por este motivo, a y c son las modas o en su defecto b y d. Asumamos que a y c son las modas, es decir: a = c = 22. Reemplazando estos valores en las ecuaciones anteriores ( b c 46 50 ), tendríamos: b = 24 y d = 28. Albert Maguiña R. 38

edu.red

125 x x i 2 i x 2 6 s 4 a 4. Sean los datos: a1 , a2 , a3 , , a125 a1 a2 a3 125 42 Pero se introdujo 124 en lugar de 12, 4 es decir, hay un exceso de: E = 124 – 12,4 = 111,6 pero, este exceso se ha promediado, de acuerdo al dato del problema. En consecuencia: 111,6 125 0,8928 exceso promedial 42 0,8928 41,11 corregido 5. En este caso, nos solicitan el promedio ponderado, esto es: 70 2,3 70 40 6, 4

40 10 10 15 4,7525 TRABAJO PRÁCTICO 5 – Medidas de Dispersión

1. xi fi x i x x i x 2 x i x 2 fi 0 1 2 4 0 – 2,52 1 – 2,52 6,35 2,31 12,70 9,24 x x f i 62, 46 n 50 2 21 2 – 2,52 0,27 5,67 3 4 5 15 6 1 3 – 2,52 4 – 2,52 5 – 2,52 0,23 2,19 6,15 3,45 13,14 6,15 62, 46 50 1 s 1,13 6 1 6 – 2,52 12,11 12,11 Li – Ls f i Yi x i x x i x 2 x i x 2 fi [ 61 – 65 > [ 65 – 69 > 5 5 63 67 63 – 76,44 67 – 76,44 180,63 89,11 903,15 445,55 x fi 2648,14 [ 69 – 73 > 71 71 – 76,44 29,59 177,54 [ 73 – 77 > [ 77 – 81 > [ 81 – 85 > 7 9 14 75 79 83 75 – 76,44 79 – 76,44 83 – 76,44 2,07 6,55 43,03 14,49 58,95 602,42 2648,14 50 1 7,35 [ 85 – 89 ] 87 87 – 76,44 111,51 446,04 2. Por comodidad escribiremos la siguiente tabla de manera vertical

Intervalo 5 – 9 9 – 13 13 – 17 17 – 21 21 – 25 Frecuencia 10 8 5 4 3 Albert Maguiña R. 39

edu.red

i i 2 s 2 Li – Ls

5 – 9 fi 10 Yi 7 x i x 7 – 12,6 x x 31,36 2 x 2 x 313,6 fi x i x f i 851, 2 n 30 9 – 13 8 11 11 – 12,6 2,56 20,48 13 – 17 17 – 21 21 – 25 5 4 3 15 19 23 15 – 12,6 19 – 12,6 23 – 12,6 5,76 40,96 108,16 28,80 163,84 324,48 851, 2 30 1 5, 42 3. er 1 producto do producto er 3 producto x 2,5 s 0,004 x 2,8 s 0,006 x 3,7 s 0,09 Si los promedios fueran iguales en los tres productos, se compararían de manera directa sus desviaciones estándar. Pero en este caso, las medias son distintas. En tal sentido, es necesario hallar el coeficiente de variación, el cual relaciona las medias con sus desviaciones estándar. El coeficiente de variación se define como: CV s x er 1 producto 0,0016 < > 0,16% do 2 producto 0,002 < > 0,2% er 3 producto 0,024 < > 2,4% er 1 producto posee el menor coeficiente de variación. En consecuencia, es el más estable. Por er otro lado, el 3 producto es el que está más alejado del desempeño promedio.

TRABAJO PRÁCTICO 6 – Probabilidades

1. Veamos cada caso:

a) Hay 100 tornillos, de los cuales 3 son defectuosos. Por ende, hay 97 tornillos sin defecto. Es decir, la probabilidad de que sea defectuoso es 3/100 y la probabilidad de que no tenga defecto es 97/100. Pero, al elegir el 2 do tornillo quedarían 99 tornillos, de los cuales solo dos son defectuosos, dado que ya se escogió uno de ellos. En consecuencia, la probabilidad de que el segundo tornillo resulte defectuoso es 2/99 Albert Maguiña R. 40

edu.red

ra da ra 2 da b) Los casos posibles del evento son: { HHH, HHM, HMH, HMM, MHH, MHM, MMH, MMM }. Entonces, la probabilidad de que sus tres hijos sean varones es { HHH } = 1/8

c) En total hay 10 bolas (entre rojas y verdes). En este sentido, la probabilidad de que resulte roja es 6/10, tanto para 1 como para la 2 extracción. Esto ocurre porque la bola se vuelve a introducir. Entonces, la probabilidad de que las dos bolas sean rojas es ( 6/10 )( 6/10 ) = 36/100

d) En este caso es sin reposición (no se vuelve a introducir). Entonces, la probabilidad de que en la 1 sea roja es 6/10 pero la probabilidad de que la sea roja es 5/9 (en total quedan 9 bolas, de las cuales 5 son rojas, dado que ya elegimos una roja previamente). Es decir, la probabilidad de que ambas sean rojas es ( 6/10 )( 5/9 ) = 30/90

2. La probabilidad de que un prisionero sea indultado es 1/3, inicialmente. Como son dos los que adquirirán el indulto, se puede dar los siguientes casos: { AB, AC, BC }, es decir, si el prisionero A no preguntara la probabilidad de que él sea uno de los que adquieran el indulto seria { AB o AC } = 2/3. Ahora bien, si preguntara (naturalmente no le dirán que es uno de los elegidos) el miembro del tribunal le diría es B, pero este puede estar acompañado por A o por C. En su defecto, si el miembro del tribunal diría que es C, este puede estar acompañado por A o por B, en consecuencia habrían 4 casos { BA, BC, CA, CB } sin embargo, BC = CB. Entonces, solo tenemos tres casos posibles { BA, BC, CA}. Nótese que A participa en dos de ellas, en consecuencia, la probabilidad de que él sea uno de los indultados, en caso de preguntar, es 2/3. De ello, se concluye que da lo mismo que le haga o no la pregunta al miembro del tribunal. Albert Maguiña R. 41

edu.red

9 1 0 1 0 0 1 0 TRABAJO PRÁCTICO 7 – Probabilidad Binomial

1.

Alguna vez (n = 10, p = 9/15 < > 0,6; q = 6/15 < > 0,4; k = 0 P X 0 10 0 0,6 0 0, 4 10 0,00010 P x 1 P X 0 0,99999 Más de 8 veces (n = 10, p = 0,6, q = 0,4, k = 9 y 10) P X 9 P X 10 = 10 9 0,6 0, 4 10 10 10 0,6 0, 4 0 = 0,04031 + 0,00605 = 0,04636 2.

Alguno defectuoso (n = 60, p = 0,03; q = 0,97; k = 0 P X 0 60 0 0,03 0,97 60 0,16080 P x 1 P X 0 0,83920 Menos de dos defectuosos (n = 60, p = 0,03, q = 0,97, k = 1 y 0) P X 1 P X 0 = 60 0,03 0,97 59 60 0,03 0,97 60 = 0,2984 + 0,1608 = 0,4592 1 0 3.

Alguna vez (n = 15, p = 0,4; q = 0,6; k = 0 P X 0 15 0 0, 4 0,6 15 0,00047 P x 1 P X 0 0,99953 Menos de dos veces (n = 15, p = 0,4, q = 0,6, k = 1 y 0) P X 1 P X 0 = 15 0, 4 0,6 14 15 0, 4 0,6 15 = 0,00047 + 0,00047 = 0,0094 1 0 4. De manera análoga: P X 3 10 3 0, 4 3 0,6 7 0, 2150 Albert Maguiña R. 42

edu.red

2 2 2 2 2 2 2 2 2 2 2 2 licenciatura TRABAJO PRÁCTICO 8 – Prueba Chi Cuadrado

1. Ingreso

Menos de $ 30 000

30 000 – 50 000

50 000 – 70 000 Nunca

20

8

7 13,69

5,18

9,99

8,14 Frecuencia de vuelos Rara vez 12,21 15

4,62 5

8,91 8

7,26 Con frecuencia 11,10 2

4,20 1

8,10 12

6,60 Más de $ 70 000

20 13, 69

13, 69 2

15 12, 21

12, 21 2 11,10

11,10 5 8 5,18

5,18 15 5 4, 62 1 4, 20 7 9,99 8 8,91 2 2 33,90 4, 62

12 8,10 8,10 4, 20

2 8,14 8,14 9,99

5 7, 26 7, 26 8,91

15 6, 60 6, 60 Se sabe que: X 2 0,01 v 6 16,81 pero 33,90 > 16,81 entonces se rechaza H0 2. Frecuencia con la que leen Profesional o posgrado NIVEL EDUCATIVO Pasante de Preparatoria No terminó la Total preparatoria 18,64 21,28 8,99 10,09 Nunca

Algunas veces

Mañana o tarde

Ambas ediciones

Total 10

12

35

28

85 15,17

30,33

20,86 17

17,31 23

34,62 38

23,80 19

97 11

8

16

6

41 7,32

14,63

10,06 21

5

7

13

46 8,21

16,42

11,29 59

48

96

66

269 Albert Maguiña R. 43

edu.red

2 2 2 2 2 2 2 2 2 2 2 2 2 v 9 2 2 2 10 18, 64 17 21, 28 2 11 8,99 21 10, 09 18, 64 21, 28 8,99 10, 09 12 15,17 2

15,17 23 17,31

17,31 8 7,32

7,32 5 8, 21 2

8, 21 2 2 32,86 35 30,33

30,33

28 20,86

20,86 38

19 34, 62

34, 62

23,80

23,80 16 14, 63

14, 63

6 10, 06

10, 06 7 16, 42

16, 42

13 11, 29

11, 29 3. Se sabe que: X 2 0,05 16,92 pero 32,86 > 16,92 entonces se rechaza H 0 Horas consumidas PROMEDIO DE CALIFICACIONES Total escuchando A B C D E música 6,88 10,31 20,63 10,31 6,88 < 5

5 – 10 13

20 11,88

19,38 10

27 17,81

29,06 11

27 35,63

58,13 16

19 17,81

29,06 5

2 11,88

19,38 55

95 11 – 20

> 20

Total 9

8

50 6,88 27

11

75 10,31 71

41

150 20,63 16

24

75 10,31 32

11

50 6,88 155

95

400 De manera análoga (ver problema 1 y 2), tenemos: 13 6,88 6,88 11 6,88 6,88 2 97,91 Se sabe que: X 2 0,01 v 12 26, 22 pero 97,91 > 26,22 entonces se rechaza H0 Fin Albert Maguiña R. 44

edu.red

PREGUNTAS SOBRE CONCEPTO Y TEORIA 1. En comparación con un arreglo de datos, la distribución de frecuencias tiene la ventaja de representar los datos de una manera comprimida.

2. Un histograma es una serie de rectángulos, cada uno proporcional en ancho al número de elementos que caen dentro de una clase especifica

de datos.

3. Cuando una muestra contiene las características importantes de cierta población en las mismas proporciones como se encuentran en ésta, se

dice que se trata de una muestra representativa.

4. Si uniéramos los puntos medios de las barras consecutivas de un histograma de frecuencias con una serie de rectas, estaríamos

graficando un polígono de frecuencias.

5. Una desventaja del ordenamiento de datos es que no nos permite

hallar fácilmente los valores mayores y menores del conjunto de datos.

6. El valor de cada observación del conjunto de datos se toma en cuenta

cuando calculamos su mediana.

7. Cuando la población está sesgada positiva o negativamente, a menudo es preferible utilizar la mediana como mejor medida de posición, debido a que siempre está entre la media y la moda.

8. Las medidas de tendencia central de un conjunto de datos se refieren al

grado en que las observaciones están dispersas.

9. El valor que más se repite en un conjunto de datos se conoce como media aritmética. V

V

V

V

V

V

V

V

V F

F

F

F

F

F

F

F

F Albert Maguiña R. 45

edu.red

10. Si organizamos las observaciones de un conjunto de datos en orden V F descendente, el punto de datos que se encuentra en medio es la mediana del conjunto de datos.

11. ¿Cuál de los siguientes no es un ejemplo de datos comprimidos? a) Distribución de frecuencias c) Histograma b) Arreglo de datos d) Ojiva 12. ¿Cuál de las afirmaciones acerca de los rectángulos de un histograma es correcta?

a) Los rectángulos tienen una altura proporcional al número de elementos que entra en cada una de las clases. b) Por lo general existen 5 rectángulos en cada histograma c) El área de un rectángulo depende solo del número de elementos de la clase

13. ¿Cuál de los siguientes no es una prueba acerca de la utilidad de los datos?

a) La fuente de datos b) La contradicción con respecto a otra evidencia

c) La falta de evidencia d) El número de observaciones e) N.A.

14. Las gráficas de distribuciones de frecuencias se utiliza debido a que:

a) Tiene una larga historia en aplicaciones prácticas b) Atraen la atención sobre los patrones que siguen los datos c) Toman en cuenta los datos parciales o incompletos

d) Permiten una fácil estimación de los datos e) Incisos b y d

15. Los datos continuos se diferencian de los datos discretos en que:

a) Las clases de datos discretos están representadas por fracciones Albert Maguiña R. 46

edu.red

b) Las clases de datos continuos pueden representarse por fracciones c) Los datos continuos solo toman valores enteros d) Los datos discretos pueden tomar cualquier valor real

16. ¿Cuál de las afirmaciones siguientes no es correcta? a) Algunos conjuntos de datos no poseen media

b) El cálculo de una media se ve afectado por los valores extremos del conjunto de datos

c) Una media pesada se debe utilizar cuando es necesario tomar en consideración la importancia de cada valor d) T.A.

17. Cuando una distribución es simétrica y posee solamente una moda, el punto más alto de la curva de distribución se conoce como: a) La moda

c) La mediana b) La media

d) T.A. 18. Cuando nos referimos a que una curva está cargada hacia el extremo izquierdo, podemos decir que es: a) Simétrica

c) Positivamente sesgada b) Sesgada hacia la derecha

d) N. A. 19. Si un evento no se ve afectado por el resultado de otro evento, se dice que ambos eventos son: a) Dependientes

c) Mutuamente excluyentes b) Independientes

d) Tanto b como c 20. Suponga que se lanza un dado dos veces consecutivas y que usted tiene que trazar el árbol de probabilidades que muestra todos los resultados posibles de los dos lanzamientos ¿Cuántas ramas tendrá el árbol? a) 6 b) 12 c) 36 d) 42 e) 48 Albert Maguiña R. 47

edu.red

i. ii. iii. i. ii. iii. iv. v. i. ii. iii. MISCELÁNEA – PROBLEMAS SELECTOS

1. La tabla adjunta muestra las edades de 220 alumnos de un colegio. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?

La moda es 17 años La mediana es mayor que la media La mitad de los alumnos tiene 17 o 18 años

2. Las fichas del peso de 10 niños, marcan en promedio 20 kg. En la oficina de control se pierde una ficha y se sabe que el promedio del resto es 19 kg. ¿Cuál es el peso del niño al que le perdieron la ficha?

3. Si se tabularan las frecuencias de las estaturas y color de ojos de los alumnos de un curso, ¿Cuál de las opciones siguientes es siempre verdadera?

Con la moda de las estaturas se determina la estatura promedio del curso

Con la mediana del color de ojos se determina el color de ojos que predomina Con el promedio de las estaturas se determina la estatura más frecuente

Con la mediana de las estaturas se determina la estatura más frecuente

Con la moda del color de ojos se determina el color de ojos que predomina

4. Se pregunta a los alumnos acerca de lo que más les gusta hacer en vacaciones y sus respuestas están en el gráfico de la figura. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?

Al 30% de los alumnos, lo que más les gusta es chatear A la mitad de los alumnos, lo que más les gusta es ver TV o jugar Al 30% de los alumnos, lo que más les gusta es leer o jugar Albert Maguiña R. 48

edu.red

i. ii. iii. 5. La tabla adjunta muestra la distribución de los puntajes obtenidos por los alumnos de un curso en una prueba de matemática. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?

El total de alumnos que rindió la prueba es 40 La mediana se encuentra en el intervalo: 20 – 29

El intervalo modal es el intervalo: 30 – 39

CRÉDITOS

El presente documento denominado ESTADÍSTICA DESDE CERO, es un material hibrido en cuanto a su contenido. Algunos conceptos y problemas se extrajeron de los materiales elaborados por DANNY PERICH CAMPANA – PSU Matemática y RICHARD LEVIN & DAVID RUBIN – Estadística para Administradores. Albert Maguiña R. 49

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente