- Introducción
- Desviación Estándar
- Varianza
- Escala
- Probabilidades
- Normalidad de los datos
- Bibliografía
Introducción
La estadística es una disciplina que proporciona principios y herramientas para emitir juicios sobre colectivos basados en datos obtenidos para propósitos específicos. Es decir, brinda el soporte para saber que datos obtener, como, cuando, como obtenerlos, y una vez obtenidos proporciona métodos y y procedimientos para organizarlos con diferentes propósitos.
La correspondencia entre los análisis aplicados y datos recabados permite construir juicios concluyentes sobre el colectivo en estudio.
Los datos que precisamos deben ser generados, de alguna forma, la cual siempre esta asociada a la definición de variables, que constituyen los conceptos de referencia mas importante en los inicios de una investigación.
Desviación Estándar
La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es una medida (cuadrática) de lo que se apartan los datos de su media, y por tanto, se mide en las mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en su distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones.
Desviación estándar o Típica
Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería:
EJEMPLO
1.-El gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.
Por lo que su media es:
Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta información le permite al gerente determinar cuanto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado.
2.-Ejemplo: Desviación estándar para datos no agrupados
Calcular la desviación estándar al siguiente conjunto de datos muéstrales.
220 | 215 | 218 | 210 | 210 |
219 | 208 | 207 | 213 | 225 |
213 | 204 | 225 | 211 | 221 |
218 | 200 | 205 | 220 | 215 |
217 | 209 | 207 | 211 | 218 |
PASO 1: Calcular la media aritmética.
PASO 2: Calcular la varianza
En este punto, la varianza es identificada por S2.
PASO 3: Calcular la desviación estándar a partir de la raíz cuadrada de la varianza.
Los datos se alejan en promedio de la media aritmética en 6,5516 puntos.
3.- Hallar la desviación media, la varianza y la desviación típica de la series de números siguientes:
2, 3, 6, 8, 11.
12, 6, 7, 3, 15, 10, 18, 5.
2, 3, 6, 8, 11.
12, 6, 7, 3, 15, 10, 18, 5.
4.-Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de andar por primera vez:
Meses | Niños |
9 | 1 |
10 | 4 |
11 | 9 |
12 | 16 |
13 | 11 |
14 | 8 |
15 | 1 |
Calcular la desviación típica.
5.-.El resultado de lanzar dos dados 120 veces viene dado por la tabla:
Sumas | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | ||
Veces | 3 | 8 | 9 | 11 | 20 | 19 | 16 | 13 | 11 | 6 | 4 |
Calcular la desviación típica.
6.-Calcular la desviación típica de una distribución estadística que viene dada por la siguiente tabla:
7.-Calcular la desviación típica de la distribución de la tabla:
8.-Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla:
Altura | [170, 175) | [175, 180) | [180, 185) | [185, 190) | [190, 195) | [195, 2.00) | |
Nº de jugadores | 1 | 3 | 4 | 8 | 5 | 2 |
Calcular la desviación típica
9.-Dada la distribución estadística:
[0, 5) | [5, 10) | [10, 15) | [15, 20) | [20, 25) | [25, 8) | ||||||||||||
fi | 3 | 5 | 7 | 8 | 2 | 6 |
Calcular la desviación típica.
Media
No se puede calcular la media, porque no se puede hallar la marca de clase del último intervalo.
Desviación típica
Si no hay media no es posible hallar la desviación típica.
10.- Calcular la desviación típica de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
Ejercicios de varianza
1.-Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
2.-Calcular la varianza de la distribución de la tabla:
3.-Hallar la desviación media, la varianza y la desviación típica de la series de números siguientes:
2, 3, 6, 8, 11.
12, 6, 7, 3, 15, 10, 18, 5.
2, 3, 6, 8, 11.
4.-Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla:
Altura | [170, 175) | [175, 180) | [180, 185) | [185, 190) | [190, 195) | [195, 2.00) | |
Nº de jugadores | 1 | 3 | 4 | 8 | 5 | 2 |
Calcula la varianza.
| xi | fi | Fi | xi · fi | xi2 · fi | |||||
[1.70, 1.75) | 1.725 | 1 | 1 | 1.725 | 2.976 | |||||
[1.75, 1.80) | 1.775 | 3 | 4 | 5.325 | 9.453 | |||||
[1.80, 1.85) | 1.825 | 4 | 8 | 7.3 | 13.324 | |||||
[1.85, 1.90) | 1.875 | 8 | 16 | 15 | 28.128 | |||||
[1.90, 1.95) | 1.925 | 5 | 21 | 9.625 | 18.53 | |||||
[1.95, 2.00) | 1.975 | 2 | 23 | 3.95 | 7.802 | |||||
|
| 23 |
| 42.925 | 80.213 |
5.-Determinar la media o valor esperado de la distribución cuya función densidad de probabilidad está por la regla de correspondencia:
Solución:
6.-Calcular la varianza para la función densidad
Solución:
7.- calcular la varianza de la altura de varios perros
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Así que la varianza es 21,704.
Escala
ESCALA NOMINAL
Las escalas de medición son nominal ordinal intervalo y razón
ESCALA NOMINAL utiliza nombres para establecer categorías, pueden usarse pero estos no son de carácter simbólico
Ejemplo: *sano *bueno *enfermo
ESCALA ORDINAL
También define categorías pero establece una relación entre > o < que
Los números asignados si establecen jerarquía.
No se puede establecer distancia entre los puntos
ESCALA DE INTERVALOS
Reúne las características anteriores
Registra de manera numérica la distancia entre dos puntos.
El cero no indica ausencia de variable y es arbitrario.
EJEMPLO *Temperatura *Fechas de calendario *hora * GMT
ESCALA DE RAZON
Escala más fuerte
El cero indica usencia de la variable
La diferencia entre dos variables es de magnitud conocida
EJEMPLO
0 INGRESOS/ MES
Probabilidades
Es el conjunto de posibilidades de que un evento ocurra o no en un momento y tiempo determinado. Dichos eventos pueden ser medibles a través de una escala de 0 a 1, donde el evento que no pueda ocurrir tiene una probabilidad de 0 y uno que ocurra con certeza es de 1.
Ejemplo: 1. Cuando se lanza una moneda, se desea saber cual es la probabilidad de
Que se sello o cara, es decir existe un 0,5 (50%) de que sea cara o 0,5 (50%) de que
Sea sello.
Ejemplo: 2.
Un dado común (un cubo) tiene los pontajes del uno al seis en cada cara {1, 2, 3, 4, 5, 6}la probabilidad de par o de impar, pues eso es un suceso seguro, pues si cae cualquier cara por arriba como 2, 4 o 6 (tres entre 6 = 3/6) es par y si no, sera 1, 3 ó 5
(tres entre 6 = 3/6) y será impar: P(par o impar) = probabilidad de par + probabilidad de impar P(par o impar) = 3/6 + 3/6 = 1/2 + 1/2 = 1
Ejemplo: 3
Según un estudio estadístico la selección de fut de Guatemala tiene una probabilidad de 50% de ganar, 40% de empatar y 10% de perder si Guatemala juega un partido.a) Por lo menos empate una partida:b) Pierda los 3 partidos:c) Gane solo un partido.
Aquí como ya se están dando las posibilidades del equipo en cada partido, como al parecer jugaran 3 partidos solo hay que ver el planteamiento como lo que dice el primero: Habla de las posibilidades que tiene de empatar en un juego, pues la mismas respuestas dan en la pregunta ya que tiene un 40% de posibilidad de empatar
Ejemplo: 4
El equipo de baloncesto Tema, un equipo de la liga menor de la organización Verapacense, juega 70% de sus juegos de noche, y 30% de día. El equipo gana el 50 por ciento de sus juegos de noche y el 90% de sus juegos de día. Según star Chanell, ganaron ayer. ¿Cuál es la probabilidad de que el juego haya sido de noche?
Como siempre tenemos que calcular los casos favorables frente a los posibles.Favorables: Que haya ocurrido de noche y que hayan ganado.Ocurridos de noche: 0,7 (70%)Ganados de noche el 50%, es decir multiplicar por 0,5./ 0,7*0,5 = 0,35Probabilidad 0,35 (35%)Posibles; para calcular los posibles tenemos que ver el total de GANADOS pues es el dato que nos dan "ganaron ayer".Ganados de noche: 0,35Ganados de día: 0,9*0,3 = 0,27 (27%)Total ganados: 0,35+0,27 = 0,62El número de casos favorables para nuestro problema: 0,35Número de casos totales (ya sabemos que han ganado): 0,62Probabilidad: 0,35/0,62 = 0,56; es decir hay un 56 por ciento de probabilidades de que sabiendo que ganaron ayer el juego hubiera ocurrido de noche.
Ejemplo: 5
el profesor Marcos ha estado enseñando estadística básica muchos años. Ya sabe que el 80% de sus alumnos hace toda la tarea. También sabe que el 90% de todos los que hacen la tarea aprueban el curso. De los estudiantes que no hacen la tarea, el 60% aprueba. Mike tomó estadística el semestre pasado con la doctora Staller y obtuvo una calificación aprobatoria.¿ Cuál es la probabilidad de que el haya hecho todas las tareas?Casos favorables: que haya aprobado y hecho todas las tareas.Que han aprobado y hecho la tarea: 0,8*0,9 = 0,72El número total es el de aprobados (puesto que sabemos que han aprobado) que son:0,72 que han aprobado y hecho la tarea + 0,20*0,60 (0,12) que son los que han aprobado pero no hecho la tarea)0,72 +0,12 = 0,84Casos favorables/Casos totales = 0,72/0,84 = 0,86; hay una probabilidad del 86 por ciento de que habiendo aprobado sea uno de los que han hecho todas las tareas.
Ejemplo: 6
El departamento de crédito de la tienda departamental de Cemaco, reportó que el 30% de sus ventas son pagadas en efectivo, 30 por ciento con cheque y el 40% con tarjeta de crédito. 20% de las compras en efectivo, 90% de las compras con cheques y 60% de las compras con tarjeta son por más de 50.
La señora Pérez acaba de comprar un vestido que costó Q 120. ¿Cuál es la probabilidad de que haya falta algo, lo resuelvo para las tres posibilidades: efectivo, cheque y tarjeta.Sabemos que compró >50, por lo tanto el número casos favorables son los de efectivo que hayan comprado más de 50 + los de cheque que hayan comprado más de 50 + los de tarjeta que hayan comprado> 50.No nos dan el tanto por ciento de las compras en efectivo, pero como sabemos que hay un 30% de cheques y una 40% de tarjeta, queda un 30% de efectivo.Favorables.Efectivo > 50: 0,3*0,2 = 0,06Cheques >50: 0,3*0,9=0,27Tarjeta >50: 0,4*0,6 = 0,24TOTAL: 0,57
Favorables: si se trata de EFECTIVO0,06/0,57 = 0,105; 10,5%Si la pregunta termina hablando de Cheques:0,27/0,57 = 0,47; 47%Si fueran tarjetas:0,24/0,57 = 0,42; 42%
Ejemplo: 7
¿Cuantos números de 5 dígitos se pueden formar con los números de 1 al 9, si:A) los números deben ser impares. B) los dos primeros dígitos son pares.C) se permiten repeticiones
A) los números deben ser impares. (5/9) x 9C5 = (5/9) x 126 = 70 númerosC) se permiten repeticiones. 9P5 = 15 120 números
Ejemplo: 8
Tras un estudio estadístico en una ciudad se observa que el 70% de los motoristas son varones y, de estos, el 60% llevan habitualmente casco. El porcentaje de mujeres que conducen habitualmente con casco es del 40%. Se pide:Calcular la probabilidad de que un motorista elegido al azar lleve casco.Se elige un motorista al azar y se observa que lleva casco. ¿Cuál es la probabilidad de que sea varón?
sea A=motoristas varonesB=Llevan cascoa) p(B) = 54/100 = 0.54 (54 de la suma del 70% de varones y 30% de mujeres que llevan casco; 100, del numero de personas en total)b) p(AnB) = (70/100) x (42/70) = 0.42 La fórmula para la intersección es P(AnB) = p(A) x p(B/A)El (70/100) sale de la probabilidad que sea varón (hay 70 varones de 100 motoristas)el (60/70) sale de que de 70 motoristas varones, el 60% (o sea 42) usan casco.
Ejemplo: 9
Se ha determinado que 60% de los estudiantes de la universidad De San Carlos fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solución:
Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la aproximación de la distribución normal a la binomial y el segundo utilizando la fórmula de la distribución muestral de proporciones.
Aproximación de la distribución normal a la binomial:
Datos:
Distribución Muestral de Proporciones
Datos:
n=800 estudiantes
P=0.60
p= 0.55
p(p< 0.55) = ?
Observe que este valor es igual al obtenido en el método de la aproximación de la distribución normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma probabilidad de 0.0017. También se debe de tomar en cuenta que el factor de corrección de 0.5 se esta dividiendo entre el tamaño de la muestra, ya que estamos hablando de una proporción.
La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por lo que diríamos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa universidad, la proporción de estudiantes que fuman cigarrillos sea menor al 55% es del 0.17%.
Ejemplo: 10
Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción de la muestra de los usuarios que realmente presentan una reacción adversa, exceda el 4%.
Resolverlo mediante la aproximación de la normal a la binomial
Resolverlo con la distribución muestral de proporciones
Aproximación de la distribución normal a la binomial:
Datos:
n=150 personas
p=0.03
x= (0.04)(150) = 6 personas
p(x>6) = ?
Media = np= (150)(0.03)= 4.5
p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer una muestra de 150 personas, mas de 6 presentarán una reacción adversa.
Distribución Muestral de Proporciones
Datos:
n=150 personas
P=0.03
p= 0.04
p(p>0.04) = ?
Observe que este valor es igual al obtenido y la interpretación es: existe una probabilidad del 17% de que al tomar una muestra de 150 personas se tenga una proporción mayor de 0.04 presentando una reacción adversa.
Ejemplo:
Se sabe que la verdadera proporción de los componentes defectuosos fabricadas por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga:
Menos del 3% de los componentes defectuosos.
Más del 1% pero menos del 5% de partes defectuosas.
Solución:
Datos:
n= 60 artículos
P=0.04
p= 0.03
p(p<0.03) = ?
La probabilidad de que en una muestra de 60 artículos exista una proporción menor de 0.03 artículos defectuosos es de 0.2327.
Datos:
n= 60 artículos
P=0.04
p= 0.01 y 0.05
p(0.01
<0.05) = ?
Normalidad de los datos
En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro. Esta curva se conoce como campana de Gauss.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.
De hecho, la estadística es un modelo matemático que sólo permite describir un fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y sociología sea conocido como método correlacional.
La distribución normal también es importante por su relación con la estimación por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son:
Caracteres morfológicos de individuos como la estatura;
Caracteres fisiológicos como el efecto de un fármaco;
Caracteres sociológicos como el consumo de cierto producto por un mismo grupo de individuos;
Caracteres psicológicos como el cociente intelectual; nivel de ruido en telecomunicaciones; errores cometidos al medir ciertas magnitudes; etc.
La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo, la distribución muestral de las medias muéstrales es aproximadamente normal, cuando la distribución de la población de la cual se extrae la muestra no es normal.[1] Además, la distribución normal maximiza la entropía entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la elección natural de la distribución subyacente a una lista de datos resumidos en términos de media muestral y varianza. La distribución normal es la más extendida en estadística y muchos test estadísticos están basados en una supuesta "normalidad".
En probabilidad, la distribución normal aparece como el límite de varias distribuciones de probabilidad continua y discreta.
EJEMPLO
Función de densidad
Su gráfica se muestra a la derecha y con frecuencia se usan …tablas para el cálculo de los valores de su distribución.
[editar] Función de distribución
La función de distribución de la distribución normal está definida como sigue:
Esta función de distribución puede expresarse en términos de una función especial llamada función error de la siguiente forma:
La inversa de la función de distribución de la normal estándar (función cuantil) puede expresarse en términos de la inversa de la función de error:
y la inversa de la función de distribución puede, por consiguiente, expresarse como:
Esta función cuantil se llama a veces la función probit. No hay una primitiva elemental para la función probit. Esto no quiere decir meramente que no se conoce, sino que se ha probado la inexistencia de tal función. Existen varios métodos exactos para aproximar la función cuantil mediante la distribución normal (véase función cuantil).
Los valores pueden aproximarse con mucha precisión por distintos métodos, tales como integración numérica, series de Taylor, series asintóticas y fracciones continuas.
Límite inferior y superior estrictos para la función de distribución
Bibliografía
1.Pértega Díaz S, Pita Fernández S. Representación gráfica en el análisis de datos. Cad Aten Primaria 2001; 8: 112-117.
2.Altman DA. Practical statistics for medical research. 1th ed., repr. 1997. London: Chapman & Hall; 1997.
3.Daniel WW. Bioestadística. Base para el análisis de las ciencias de la salud. Mexico: Limusa; 1995.
4.Elston RC, Johnson WD. Essentials of Biostatistics. Philadelphia: F.A. Davis Company; 1987.
5.Altman DG, Bland JM. Statistics notes: The normal distribution. BMJ 1995; 310: 298-298. [Texto completo]
6.-http://www.spssfree.com/spss/analisis2.html
7.-http://www.mitecnologico.com/Main/DesviacionEstandar
Autor:
La Sirenita