Método Estadístico
Un estudio estadístico comprende los siguientes pasos:
Suele iniciarse con una fijación de objetivos o algunas preguntas como ¿cuál será la media de esta población respecto a tal característica?, ¿se parecen estas dos poblaciones?, ¿hay alguna relación entre…?
En el planteamiento se definen con precisión la población, la característica a estudiar, las variables, etc.
Se analizan también en este punto los medios de los que se dispone y el procedimiento a seguir.
- 1. Planteamiento del problema
Se establece un modelo teórico de comportamiento de la variable de estudio. En ocasiones no es posible diseñar el modelo hasta realizar un estudio previo. Los posibles modelos son distribuciones de probabilidad.
- 2. Elaboración de un modelo
Se usa alguna técnica de muestreo o un diseño experimental para obtener información de una pequeña parte de la población.
- 3. Extracción de la muestra
En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que serán necesarios en pasos posteriores, como la media muestral, la varianza muestral, proporciones, etc.
Los métodos de esta etapa están definidos por la estadística descriptiva.
- 4. Tratamiento de los datos
Con determinadas técnicas se realiza una predicción sobre cuáles podrían ser los parámetros de la población.
- 5. Estimación de los parámetros
Son técnicas que permiten simplificar el modelo.
- 6. Contraste de hipótesis
- 7. Conclusiones
Se critica el modelo y se hace un balance. Las conclusiones obtenidas en este punto pueden servir para tomar decisiones o hacer predicciones.
El estudio puede comenzar de nuevo a partir de este momento, en un proceso cíclico que permite conocer cada vez mejor la población y características de estudio.
Población y Muestra
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.
El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadística, y este tamaño vienen dado por el número de elementos que constituyen la población, según el número de elementos la población puede ser finita o infinita.
Cuando el número de elementos que integra la población es muy grande, se puede considerar a esta como una población infinita; por ejemplo: el conjunto de todos los números positivos.
Una población finita es aquella que está formada por un limitado número de elementos; por ejemplo: el número de estudiante del Liceo Bolivariano Mariano de Talavera.
Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo llamada muestra.
Se llama muestra a una parte de la población a estudiar que sirve para representarla, esta es una colección de algunos elementos de la población, pero no de todos.
Por ejemplo el estudio realizado a 50 alumnos del Liceo Mariano de Talavera
El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo. Por último se ha comprobado que el examen de una población entera todavía permite la aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad.
Una muestra representativa contiene las características relevantes de la población en las mismas proporciones que están incluidas en tal población.
Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer referencias sobre la población que está representada por la muestra.
Estadística Descriptiva
Es una de las ramas de la Estadística más accesible a la mayoría de la población. Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos parámetros útiles para la explicación de la información. Esta, por lo general, no pasa a ser un análisis más profundo de la información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de presentar la información ante cualquier lector, ya sea especialista o no.
- Metodología
- Selección y determinación de la muestra.
- Obtención de los datos.
- Clasificación y organización de los datos.
- Análisis descriptivo de los datos.
- Representación gráfica de los datos.
- Contraste de hipótesis, si procede.
- Conclusiones.
Ejemplos de este tipo de análisis descriptivo pueden encontrarse en la prensa diaria, en la parte de información económico-social: series de tiempo, gráfica de barras, índices de precios, resultados de una encuesta, etc.
Estadística Inferencial
La estadística inferencial es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra).
La bondad de estas deducciones se mide en términos probabilísticos, es decir, toda inferencia se acompaña de su probabilidad de acierto.
La estadística inferencial comprende:
- La Teoría de muestras.
- La estimación de parámetros.
- El Contraste de hipótesis.
- El Diseño experimental.
- La Inferencia bayesiana.
Ejemplo: Para estimar el voltaje requerido para provocar fallas en un dispositivo eléctrico, una muestra de estos dispositivos puede someterse a voltajes crecientes hasta que falle cada uno de ellos. Con base en estos resultados muestrales puede estimarse la probabilidad de falla a varios niveles de voltaje de los demás dispositivos de la población muestreada .
Distribución de Frecuencias
Para estudiar el comportamiento de un fenómeno se requiere información y ¿Cómo recopilarla?
1. Por medio de encuestas (interrogatorio oral o escrito que se aplica a varias personas acerca del problema).
2. Por medio del registro de las observaciones que se hacen de él.
La información obtenida debe presentarse en forma organizada. ¿Cómo?
Se puede utilizar una distribución de frecuencias (o también llamada tabla de frecuencias), en donde se asocia a cada dato o subgrupo de datos (llamado intervalo de clase o clase) una frecuencia (número de observaciones que corresponden a cada dato o a cada grupo de datos).
La presentación de los datos puede hacerse en forma ordenada, si son datos:
Cualitativos
– Orden alfabético
– Escribir, primero el que más se repite, luego el que sigue y así sucesivamente.
Cuantitativos
– Forma creciente (menor al mayor).
– Forma decreciente (mayor al menor)
Ejemplo:
A. Se preguntó a un grupo de alumnos de Ingeniería Industrial su materia preferida.
Distrib. de frecuencia
En este caso los datos se colocaron en orden alfabético.
B. Se preguntó a un grupo de alumnos su estatura en cms.
Distrib. de frecuencia
Los datos por ser cuantitativos los datos se han ordenado en forma creciente.
Medidas de Tendencia Central
Supóngase que Pedro obtiene 32 puntos en una prueba de lectura. La calificación por sí misma tiene muy poco significado a menos que usted conozca cuál es el total de puntos que obtiene una persona promedio al participar en esa prueba, cuál es la calificación menor
y mayor que se obtiene, y cuán variadas son esas calificaciones. Es decir que para que una calificación tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios estadísticos.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba. Digamos por ejemplo que la calificación promedio en la prueba que hizo Pedro fue de 20 puntos. De ser así podemos decir que la calificación de Pedro se ubica notablemente sobre el promedio. Pero si la calificación promedio fue de 60 puntos, entonces la conclusión sería muy diferente, dado que se ubicaría muy por debajo del promedio de la clase.
En resumen, el propósito de las medidas de tendencia central es:
- Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
- Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico.
- Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones.
- Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos.
- Media Aritmética
La media aritmética de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresión:
xi representa el valor de la variable o en su caso la marca de clase.
Propiedades:
- Si multiplicamos o dividimos todas las observaciones por un mismo número, la media queda multiplicada o dividida por dicho numero.
- Si le sumamos a todas las observaciones un mismo número, la media aumentará en dicha cantidad.
- Además de la media aritmética existen otros conceptos de media, como son la media geométrica y la media armónica.
- Mediana
La mediana es el punto central de una serie de datos, para datos agrupados la mediana viene dada por:
Ejemplo:
Hallar la mediana en los siguientes datos: 25,30,28,26,32
Solución:
Se ordenan en forma creciente o decreciente y se toma el valor central. 25,26,28,30,32
mediana = 28
Ejemplo:
Hallar la mediana en los siguientes datos 7, 10,15,13,10,12
Solución:
Al ordenar se tiene: 7, 10,10,12,13,15 pero como el número de datos es par se toma la media aritmética de los dos internos.
- Moda
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo.
Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. En cuyo caso tendremos una distribución bimodal o polimodal según el caso.
Para distribuciones de frecuencia la moda viene dada por:
Ejemplo:
Hallar la moda en los siguientes datos.
16,18,15,20,16
Solución:
Moda = 16
De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil. Sin embargo, cuando en una distribución se presentan casos cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la moda.
Representaciones Gráficas
- Graficas de barras
Se utilizan rectángulos separados, que tienen como base a cada uno de los datos y como altura la frecuencia de ese dato.
Ejemplo: En la siguiente tabla se muestra el total de vacunas aplicadas durante el verano de l991 en un estado de la República Mexicana.
El diagrama de barras o gráfica de barras suele elaborarse con algunas variantes; por ejemplo, se pueden utilizar líneas en vez de rectángulos ó barras (o líneas) horizontales en vez de verticales.
Si se tienen datos cuantitativos se grafica en el eje de las x los valores centrales (marcas de clase), cuyas alturas son proporcionales a sus frecuencias. Así en la distribución de frecuencias de las alturas de 35 alumnos se tiene:
- Histograma
El histograma es un gráfico para la distribución de una variable cuantitativa continua que representa frecuencias mediante el volumen de las áreas. Un histograma consiste en un conjunto de rectángulos con:
a. bases en el eje horizontal, centros en las marcas de clase y longitudes iguales a los tamaños de los intervalos de clase
b. áreas proporcionales a las frecuencias de clase.
En el caso de un histograma para intervalos desiguales sólo se señalizan los valores sobre el eje horizontal, el eje vertical no tiene sentido porque las frecuencias corresponden al área de cada rectángulo.
Si en la distribución se toman clases de la misma longitud, las frecuencias son proporcionales a las alturas de los rectángulos del histograma ya que el área se obtiene multiplicando la base por la altura por lo que queda similar a un diagrama de barras, solo que ahora las barras van una junto a otra por tratarse de una variable continua
- Polígonos de frecuencia
El polígono de frecuencias es una representación gráfica de la distribución de frecuencias que resulta esencialmente equivalente al histograma y se obtiene uniendo mediante segmentos los centros de las bases superiores de los rectángulos del histograma (es decir, los puntos de las marcas de clase).
Para cerrar la figura, se une la línea quebrada con lo que sería la marca de clase (sobre la superficie del eje horizontal) anterior a la primera y posterior a la última registrada
Polígono de Frecuencias Acumuladas u Ojiva
La misma idea de unir los centros de las bases superiores de los rectángulos de la distribución del histograma de frecuencias acumuladas, da lugar al polígono de frecuencias acumuladas u ojiva.
Conclusión
La Estadística es una ciencia matemática que se utiliza para describir, analizar e interpretar ciertas características de un conjunto de individuos llamado población. Cuando nos referimos a muestra y población hablamos de conceptos relativos pero estrechamente ligados. Una población es un todo y una muestra es una fracción o segmento de ese todo.
Podemos dividir la estadística en dos ramas; la estadística descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio; y la estadística inferencial, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión.
La estadística trata en primer lugar, de acumular la masa de datos numéricos provenientes de la observación de multitud de fenómenos, procesándolos de forma razonable. Mediante la teoría de la probabilidad analiza y explora la estructura matemática subyacente al fenómeno del que estos datos provienen y, trata de sacar conclusiones y predicciones que ayuden al mejor aprovechamiento del fenómeno.
Bibliografía
www.aldeaeducativa.com
www.wiquipedia.com
Realizado por:
Giulliana López,
Punto Fijo- Venezuela
Estudiante de 4to año de Educación Media Diversificada en el Liceo Bolivariano Nacional Mariano de Talavera
Punto Fijo, diciembre 2006
Página anterior | Volver al principio del trabajo | Página siguiente |