? ? ? 1 SEMANA 1 NOCIONES BÁSICAS DE ESTADÍSTICA Definición La ciencia que se ocupa de la recopilación, tabulación, análisis, interpretación y presentación de datos. Población y muestra Población es el conjunto de individuos, con alguna característica común, sobre el que se hace un estudio estadístico. En la práctica es frecuente tener que recurrir a una muestra para inferir datos de la población. La muestra es un subconjunto de la población, seleccionada de modo que ponga de manifiesto las características de la misma, de ahí que la propiedad más importante de las muestras es su representatividad. El proceso seguido en la extracción de la muestra se llama muestreo. ? ? ? Ejemplo Identificar la población y la muestra en la siguiente situación: En una institución educativa se quiere saber la ocupación de los egresados de la última década. Para esto se convoca a una reunión de egresados y de los asistentes, se encuesta a diez egresados de cada año. Determina la población y la ? muestra. ? ? ? Solución ? Población. Todos los egresados de la última década. ? Muestra. Los 100 estudiantes seleccionados, 10 de cada promoción. Albert Maguiña R.
2 Luego de establecer la población y la muestra, es importante determinar las características a estudiar en la población: temperatura, peso, asistencia, gusto por algo, ocupación, etc. Estas características se denominan variables y se clasifican en cualitativas y cuantitativas.
Variables estadísticas
Las variables estadísticas pueden ser esencialmente de dos tipos cualitativas y cuantitativas.
Las variables cualitativas son las que no aparecen en forma numérica sino como una categoría o atributo.
Las variables cuantitativas son las que pueden expresarse numéricamente
Tipos de variables Cuantitativas Cualitativas ? Ejemplo Discretas Continuas Nominales Ordinales Tipo de variable
Nominal
Ordinal
Discreta
Continua Definición
Está asociada a nombres.
Tiene asociado un orden.
Sólo puede tomar un número finito (o contable) de posible valores. Puede tomar cualquier valor en un intervalo(s). Ejemplo
Marca de auto, Sexo, Religión. Nivel educacional, Estado nutricional, Nivel Socioeconómico. El número de respuestas correctas en una prueba de 5 preguntas de V o F. Cantidad de agua en un vaso de 50 ml.
Albert Maguiña R.
? ? I. 3 ? ? Ejercitándose ? Determine qué tipo son las siguientes variables. Si son variables cualitativas (nominal u ordinal) o cuantitativas (discretas o continuas).
a) Marca de automóvil. b) Duración de una canción. c) Número de temas de un CD o DVD. d) Estado civil (soltero, casado, divorciado). 3 e) Cantidad de lluvia en un año en Tacna (mm ). f) Nivel educacional (básica, media, universitaria). g) Temperatura al mediodía en Tumbes (grados Celsius).
TRABAJO PRA CTICO 1
Determina la población y sugiere la muestra para cada una de las siguientes situaciones.
a. Una empresa de telefonía celular quiere realizar en la ciudad de Chimbote un estudio sobre el celular que prefieren los jóvenes entre 18 y 22 años de edad.
b. Una empresa de software quiere determinar cuál es el tiempo promedio que los jóvenes de la ciudad de Chimbote emplean en internet para diseñar un nuevo juego que se desarrolle en ese tiempo.
II. Clasifica las siguientes variables en cualitativas o en cuantitativas.
a. El ingreso mensual de un trabajador. b. El número de estudiantes clasificados por el grado que cursan. c. El código de identificación de una persona en un centro médico.
d. Los números que llevan en sus camisetas los jugadores de un equipo. e. Los números que indican las posiciones de llegada de los caballos en una carrera.
Albert Maguiña R.
i i 4 SEMANA 2 ORGANIZACIÓN DE DATOS
Existen muchas formas de organizar los datos. Podemos sólo colectarlos y mantenerlos en orden; o si las observaciones están hechas con números, entonces podemos hacer una lista de los puntos de los datos, de menor a mayor según su valor numérico. Pero si los datos son trabajadores especializados (como carpinteros, albañiles o soldadores) de una construcción; o los distintos tipos de automóviles que ensamblan todos los fabricantes; o los diferentes colores de suéteres fabricados por una empresa dada, debemos de organizarlos de manera distinta. Necesitaremos presentar los puntos de datos en orden alfabético o mediante algún principio de organización. Una forma común de organizar los datos consiste en dividirlos en categorías o clases parecidas y luego contar el número de observaciones que quedan dentro de cada categoría. Este método produce una
Distribución de frecuencias.
Distribución de frecuencias X i Variable f i F h i H hi % Hi % f1 x1 f1 f1 n f 2 h1 h1 100 I D x2 x f2 f f f1 f f2 f n f3 h h1 h h2 h h2 100 h E 3 3 1 2 3 n 1 23 3 100 M x n f n f1 f 2 f 3 fn f n h1 h2 h3 hn h n 100 Hi n n = Total f i n hi 1 hi % 100 Albert Maguiña R.
5 ? Ejemplo Los siguientes datos representan el número de hijos por familia encuestada.
0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 6
A partir de estos datos, construya una tabla de frecuencias. Solución:
Para construir la tabla de frecuencias hay que tener en cuenta que la variable en estudio es el número de hijos (discreta), que toma los valores existentes entre 0 y 6 hijos y las frecuencias son el conjunto de familias, de esta forma tenemos: X i
0 1 2 3 4 5 6 fi
2 4 21 15 6 1 1 Fi
2 6 27 42 48 49 50 hi
0,04 0,08 0,42 0,30 0,12 0,02 0,02 Hi
0,04 0,12 0,54 0,84 0,96 0,98 1 hi %
4 8 42 30 12 2 2 Hi %
4 12 54 84 96 98 100 n = 50 fi 50 hi 1 hi % 100 ? ? Ejercitándose ? Se realizó un sondeo entre 25 miembros de una clase de psicología acerca del número de hermanos que tenían en sus familias. A partir de estos datos, elabore ? una tabla de distribuciones de frecuencias. 2 5 1 5 1 3 2 4 4 6 1 3 2 3 2 3 3 4 6 2 3 1 2 5 2 Albert Maguiña R.
3 4 ? 6 A menudo, los conjuntos de datos que contienen una gran cantidad de elementos se organizan en grupos o clases. Todos los datos son asignados a la clase que les corresponde; luego, se elabora una Distribución de frecuencias para datos agrupados. Estos intervalos (grupos o clases) tienen un punto medio que recibe el nombre de marca de clase. La marca de clase se obtiene calculando el promedio entre los límites inferior y superior de cada intervalo. ? Ejemplo X i Variable Yi marca de clase fi Fi hi Hi hi % Hi % y1 xi 2 x2 [xi x2 [x2 x3 y2 x2 2 x3 I
D I
D I
D I
D I
D I
D [x x y3 x3 2 x4 E E E E E E [xn 1 xn y x n 1 x n M M M M M M n 2 n = Total f i n hi 1 hi % 100 ? ? ? Ejercitándose En una prueba tomada a 50 alumnos, se registraron los siguientes puntajes: 83
68
83
77
77 82
85
72
74
72 87
66
70
67
89 64
61
84
80
80 63
83
71
84
87 75
76
77
75
77 83
83
82
73
63 62
67
79
75
72 67
78
83
83
84 83
76
72
84
78 Albert Maguiña R.
máx mín ? 7 ? Antes de construir la tabla de frecuencias debemos construir los intervalos. Para ello, debemos tener en cuenta las siguientes indicaciones. ? ?
? Determinar la número?de intervalos, para ello utilizaremos la Regla de Sturges: m 1 3,3log n
Determinar la amplitud de los intervalos, para ello utilizaremos la siguiente x x regla: C m ? En nuestro ejemplo, n 50 xmáx 89 x mín 61 En consecuencia: m 1 3,3log 50 m 6,6 m 7 C 89 61 7 C 4 X i
[ 61 65 > [ 65 69 > [ 69 73 > [ 73 77 > [ 77 81 > [ 81 85 > [ 85 89 ] Yi
63 67 71 75 79 83 87 fi
5 5 6 7 9 14 4 Fi
5 10 16 23 32 46 50 hi
0,10 0,10 0,12 0,14 0,18 0,28 0,08 Hi
0,10 0,20 0,32 0,46 0,64 0,92 1 hi %
10 10 12 14 18 28 8 Hi %
10 20 32 46 64 92 100 f h Total i 50 i 1 hi % 100 Ejercicio: los siguientes datos representan las calificaciones de 50 estudiantes de la facultad de derecho en el curso de estadística.
A partir de esta información construya una tabla de distribuciones.
Albert Maguiña R.
I. II. III. 8 TRABAJO PRA CTICO 2
En una empresa, se hizo el estudio sobre las edades de los empleados y se obtuvo la siguiente tabla:
Edades N° de empleados [ 20 25 > [ 25 30 > [ 30 35 > [ 35 40 > [ 40 45 > 12 15 23 11 9 Donde A es el porcentaje de empleados con 30 años o más; B es el porcentaje de empleados con menos de 40 años. Calcular el valor de A + B
La siguiente tabla muestra el número de jóvenes que obtuvieron los puntajes señalados en una prueba de ingreso. Puntaje [ 10 15 > [ 15 20 > [ 20 25 > [ 25 30 > [ 30 35 > N° de jóvenes 10 15 28 20 17 Donde A es el porcentaje de jóvenes con puntajes mayores a 20; B es el porcentaje de jóvenes con puntajes menores a 15. Halle el valor de A B
Para cada una de las tablas, calcular lo siguiente: a)
c) f 4 F3 H4
H 3 % h2 % Y3 b)
d) H 2 % h4 % h2
f 2 F1 H5 Albert Maguiña R.
Página siguiente |