- Introducción
- Definición de estadística
- Clasificación
- Conceptos básicos de la estadística
- Etapas del proceso de investigación estadístico
- Conclusión
- Bibliografía
La palabra "estadística" suele utilizarse bajo dos significados distintos, a saber:
Como colección de datos numéricos.- Esto es el significado más vulgar de la palabra estadística. Se sobrentiende que dichos datos numéricos han de estar presentados de manera ordenada y sistemática. Una información numérica cualquiera puede no constituir una estadística, para merecer este apelativo, los datos han de constituir un conjunto coherente, establecido de forma sistemática y siguiendo un criterio de ordenación. Tenemos muchos ejemplos de este tipo de estadísticas. El Anuario Estadístico publicado por el Instituto Nacional de Estadística, El Anuario de Estadísticas del Trabajo,…
Como ciencia.- En este significado, La Estadística estudia el comportamiento de los fenómenos de masas. Como todas las ciencias, busca las características generales de un colectivo y prescinde de las particulares de cada elemento. Así por ejemplo al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo numeroso de nacimientos y obtener después la proporción de varones. Es muy frecuente enfrentarnos con fenómenos en los que es muy difícil predecir el resultado; así, no podemos dar una lista, con las personas que van a morir con una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo,…
Por tanto, el objetivo de la estadística es hallar las regularidades que se encuentran en los fenómenos de masa.
"La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares". (Gini, 1953).
Murray R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.
Estadística es una ciencia que proporciona un conjunto de métodos que se utilizan para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos con respecto a una característica, materia de estudio o investigación. En primera instancia se encarga de obtener información, describirla y luego usa esta información a fin de predecir algo respecto a la fuente de información. (Moya Calderón, Rufino).
La estadística es el arte de aprender a partir de los datos. Está relacionada con la recopilación de datos, su descripción subsiguiente y su análisis, lo que nos lleva a extraer conclusiones. (M. Ross, Sheldon).
Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la estadística, debido al gran campo de aplicación que posee.
Podemos definir la Estadística Descriptiva como un método para describir numéricamente conjuntos numerosos. (Vargas Sabadías, Antonio. 1995).
Por tratarse de un método de descripción numérica, la estadística descriptiva utiliza el número como medio para describir un conjunto, que debe ser numeroso, ya que las permanencias estadísticas no se dan en los casos raros. No es posible, por tanto, sacar conclusiones concretas y precisas de los datos estadísticos. La Estadística Descriptiva trata sobre el análisis y presentación de la información, luego de su recolección, se elabora cuadros estadísticos, gráficos y algunos cálculos.
La estadística inferencial tiene como función generalizar los resultados de la muestra para estimar las características de la población. No obstante, el conjunto de datos muestrales puede describirse o analizarse de la misma forma que una población. Por lo tanto, el conjunto de datos u observaciones de una muestra puede utilizarse en un doble sentido: primero, para describir el propio conjunto de observaciones y, segundo, para inferir o predecir lo que ocurre en la población. (Spagni De Barletta; 2005)
En consecuencia, la fase descriptiva es común a cualquier conjunto de observaciones o datos, ya se refieran éstos a toda la población, a una muestra o, incluso, a una subpoblación. La Estadística Descriptiva es la parte más clásica, más conocida y más elemental de la ciencia estadística.
3.1.- POBLACIÓN. DEFINICIÓN, CLASIFICACIÓN Y EJEMPLOS.
Población, en estadística, también llamada universo o colectivo se define como cualquier conjunto de personas, objetos, ideas o acontecimientos que se someten a la observación estadística de una o varias características que comparten sus elementos y que permiten diferenciarlos. (Fernández Fernández, Santiago)
El significado que se da en Estadística a la palabra población es más amplio que el utilizado en el lenguaje habitual, referido exclusivamente a un conjunto de personas. Son poblaciones por ejemplo, los diferentes automóviles que se encuentran en un concesionario o las diferentes religiones de un país. ¿Se puede considerar como población a las diferentes fábricas de un sector industrial? ¿Y a los alumnos de una clase? ¿Y a las religiones del mundo? ¿Y a cada uno de los días de un mes?
La contestación es afirmativa en todos los casos. En estadística la palabra "población" no sólo se refiere a personas, como es el caso de los alumnos, sino también objetos, ideas o acontecimientos, como son las fábricas, las creencias religiosas o los días.
(es.wikipedia.org). La población puede ser:
Población finita: el número de elementos que la forman es finito, por ejemplo el número de alumnos de un centro de enseñanza.
Población infinita: el número de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos. Como por ejemplo: si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita.
Población base: es el grupo de personas designadas por las siguientes características: personales, geográficas o temporales, que son elegibles para participar en el estudio.
Población muestreada: es la población base con criterios de viabilidad o posibilidad de realizarse el muestreo. Ejemplo: Eficacia de un fármaco hacia enfermos de sida en USA.
Población diana: es el grupo de personas a la que va proyectado dicho estudio, la clasificación característica de los mismos, lo cual lo hace modelo de estudio para el proyecto establecido. Ejemplo: Población de estudiantes de Licenciatura en Contaduría entre 18 y 23 años.
3.2.- MUESTRA. DEFINICIÓN, CLASIFICACIÓN Y EJEMPLOS.
"Se llama muestra a una parte de la población a estudiar qué sirve para representarla". Murray R. Spiegel (1991).
Podemos decir que una muestra es un subconjunto de elementos de la población. Hay, sin embargo, distintas formas o métodos de seleccionar una muestra, que dependen, en general, de las características de la población que se va a estudiar, pueden ser realizados de forma probabilística o aleatoria (al azar), o no probabilística.
(www.monografias.com). Los autores proponen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.
Muestreo probabilístico. Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcularse la probabilidad de extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de muestreo es el más aconsejable.
El muestreo aleatorio simple puede ser de dos tipos:
Sin reposición de los elementos: cada elemento extraído se descarta para la subsiguiente extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla seleccionada.
Con reposición de los elementos: las observaciones se realizan con reemplazamiento de los individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición aunque, realmente, no lo sea.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.
Muestreo estratificado: Se realiza una la división de la población de estudio en grupos o estratos homogéneos (o que se suponen homogéneos) respecto a la variable de interés. A cada estrato se le asignaría una cantidad o cuota que representa el número de miembros o elementos del mismo que deben componer la muestra. Dentro de cada estrato el muestreo se realizaría mediante un muestreo aleatorio simple.
Por ejemplo, para un estudio por estratos mediante asignación proporcional sería: Se está realizando un estudio de opinión de hombres y mujeres; se estima que, dentro de cada uno de estos grupos, hay cierta homogeneidad (la variabilidad de opiniones es la misma). La población se compone de un 55% de mujeres y un 45% de hombres, por lo tanto conviene un muestreo estratificado con asignación proporcional, ya que se tomaría una muestra que contenga también esa misma proporción.
Muestreo sistemático: Se usa cuando el universo es muy grande o éste se extiende en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo y n el tamaño de la muestra. Determinar en qué fecha se producirá la primera extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Si es posible, es conveniente tener en cuenta la periodicidad del fenómeno.
Muestreo por conglomerados: Cuando la población se encuentra dividida, de manera natural, en grupos que se suponen que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio.
Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es decir, los miembros del grupo, o sólo se les podría aplicar a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de simplificar el levantamiento de datos sobre la información muestral.
Ejemplos: Una ganadería tiene 3 000 vacas. Se quiere extraer una muestra de 120. Explica cómo se obtiene la muestra: a) Mediante muestreo aleatorio simple. b) Mediante muestreo aleatorio sistemático.
a) Se numeran las vacas del 1 al 3 000. Se sortean 120 números de entre los 3 000. La muestra estará formada por las 120 vacas a las que correspondan los números obtenidos.
b) Coeficiente de elevación: h=25. Se sortea un número del 1 al 25. Supongamos que sale el 9. Las vacas seleccionadas para la muestra serían las que correspondieran a los números 9, 34, 59, 84, 109, …, 2 984.
En cada uno de los casos que se mencionan a continuación, el colectivo ¿es población o es muestra? Explica por qué.
a) Un campesino tiene 87 gallinas. Para probar la eficacia de un nuevo tipo de alimentación, las pesa a todas antes y después de los 30 días que dura el tratamiento.
b) Un granjero prueba con 100 de sus gallinas la eficacia de un nuevo tipo de alimentación.
a) Es población, porque pesa a todas las gallinas.
b) Es muestra, porque no pesa a todas las gallinas, sino solo a una parte de ellas.
Muestreo no probabilísticos: A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa. Los métodos de muestreo no probabilísticos no garantizan la representatividad de la muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la población.
(En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población.)
Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.
Muestreo opinático o intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.
Muestreo casual o incidental: Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).
Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
3.3.- VARIABLE. DEFINICIÓN, CLASIFICACIÓN Y EJEMPLOS.
Una variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. (www.wikipedia.com)
Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable estadística.
Variables cualitativas: Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. No se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). Las variables cualitativas pueden ser ordinales y nominales.
Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave.
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia.
Variables cuantitativas: Son las variables que se expresan mediante cantidades numéricas, es decir, tienen valor numérico (edad, precio de un producto, ingresos anuales). Las variables cuantitativas además pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3…., etc., pero, por ejemplo, nunca podrá ser 3.45).
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo el peso o la altura, que solamente limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera. Pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h…etc.
3.4.- ESCALA. DEFINICIÓN, CLASIFICACIÓN Y EJEMPLOS.
Una escala es un patrón convencional de medición, y básicamente consiste en un instrumento capaz de representar con gran fidelidad verbal, gráfica o simbólicamente el estado de una variable. La medición de las variables puede realizarse por medio de cuatro escalas de medición. Dos de las escalas miden variables categóricas y las otras dos miden variables numéricas. Los niveles de medición son las escalas nominal, ordinal, de intervalo y de razón. Se utilizan para ayudar en la clasificación de las variables, el diseño de las preguntas para medir variables, e incluso indican el tipo de análisis estadístico apropiado para el tratamiento de los datos.
Escala nominal: Utiliza los números para identificar que un dato pertenece a un grupo o a una categoría. Es aquella escala que no presenta un orden o dimensión particular, son observaciones que pueden clasificarse o contarse. En el análisis de datos resulta más sencillo asignar a ciertos atributos "etiquetas" numéricas en lugar de utilizar datos complejos. Por ello podemos utilizar un "1" para designar a las mujeres y un "2" para designar a los hombres, sin que ninguno de los números represente más o menos, solamente con el objetivo de distinguir y organizar datos. En esta escala cada persona u objeto debe pertenecer a una y solamente una de las categorías que tienen y el conjunto de estas categorías debe ser exhaustivo; es decir, tiene que contener a todos los casos posibles.
Escala ordinal: En esta escala los números representan una clasificación (mayor que o menor que), sin que represente una unidad de medida, quedando implícito que un número de mayor cantidad tiene más alto grado de atributo medido en comparación de un número menor. Se establece una gradación u orden natural para las categorías, cada uno de los datos puede localizarse dentro de alguna de las categorías disponibles.
Escala de intervalo: En esta escala además del "mayor que" y el "menor que" también se establece una unidad de medida que nos permite precisar cuánto se es mayor o menor. La unidad de medición es arbitraria, el cero es convencional y pueden existir cantidades negativas; la medición de la temperatura y del coeficiente intelectual son ejemplos de este tipo de escala. En esta escala se pueden hacer comparaciones por medio de diferencias o de sumas, sin embargo no se admiten comparaciones por medio de multiplicaciones, divisiones o porcentajes pues carecen de sentido.
Escala de razón: Similar a la escala de intervalo, pero tiene un cero absoluto y por ello los múltiplos de los valores de la escala serán significativos; el nivel de votos en una elección sería un buen ejemplo de una escala de medición de razón.
3.5.- DATOS. DEFINICIÓN Y EJEMPLOS.
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. (www.ditutor.com)
3.6.- PARÁMETROS Y ESTADÍSTICOS. DEFINICIÓN Y DIFERENCIAS.
Estadístico: valor numérico que describe una característica de la muestra y se obtiene mediante la manipulación algebraica de sus datos. (Pardo Merino). Ejemplo: Suponga se tomó una muestra representativa de los estudiantes regulares de La Universidad del Zulia. Para esta muestra se calculó: edad promedio, rendimiento promedio, porcentaje de estudiantes que fuman.
Parámetro: valor numérico que describe una característica de la población (Pardo Merino). Los parámetros se estiman a partir de la información aportada por una muestra de la población. Ejemplo: Si se considera como universos a todos los estudiantes regulares de La Universidad del Zulia, la edad promedio de estos, el porcentaje de estudiantes de sexo masculino que fuman, el ingreso medio todos los estudiantes, son valores que describen a este conjunto.
La diferencia es que el estadístico es la cantidad que caracteriza a una muestra, y que sirve para aproximar el valor de un parámetro desconocido y un parámetro es un valor fijo que caracteriza a una población.
Es una actividad que tiene como fruto descubrir las esencias de una realidad empleando para ello técnicas estadísticas. (Quesada Ibarguen, Víctor Manuel y Vergara Schmalbach, Juan Carlos). Etapas de la investigación estadística:
Selección y determinación de la población o muestra y las características contenidas que se desean estudiar. En el caso de que se desee tomar una muestra, es necesario determinar el tamaño de la misma y el tipo de muestreo a realizar (probabilístico o no probabilístico).
Obtención de los datos. Esta puede ser realizada mediante la observación directa de los elementos, la aplicación de encuestas y entrevistas, y la realización de experimentos.
Clasificación, tabulación y organización de los datos. La clasificación incluye el tratamiento de los datos considerados anómalos que pueden en un momento dado, falsear un análisis de los indicadores estadísticos. La tabulación implica el resumen de los datos en tablas y gráficos estadísticos.
Análisis descriptivo de los datos. El análisis se complementa con la obtención de indicadores estadísticos como las medidas: de tendencia central, dispersión, posición y forma.
Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos que involucran elementos probabilísticos que permiten inferir conclusiones de una muestra hacia la población (opcional).
Elaboración de conclusiones. Se construye el informe final.
Después de haber brindado algunas nociones básicas de la estadística, su definición, clasificación y las diferentes técnicas que la misma utiliza para estudiar una determinada población, podemos sintetizar lo siguiente: la estadística es una ciencia, debido a que utiliza métodos de investigación científica y a la vez es una serie de herramientas, instrumentos y estrategia para estudiar a una población.
Por otra parte, la estadística se califica en descriptiva e inferencial. Donde la primera estudia los métodos de recolección y descripción de los fenómenos en estudios; mientras que la otra se dedica a la generación de los métodos, inferencias y predicciones asociados a los fenómenos en cuestión, teniendo en cuenta lo aleatorio e incertidumbre en las observaciones.
Corrado Gini, Luigi Galvani. Curso de Estadística, 1953.
Spiegel, Murray R. Estadística. McGraw-Hill, 1991.
M. Ross, Sheldon. Introducción a la Estadística. Editorial Reverté, S.A.
Moya Calderón, Rufino. Estadistica descriptiva. Conceptos y Aplicaciones. Lima-Perú. 1991
Pardo Merino, Antonio; Ruiz Díaz, Miguel Ángel. Spss 11 Guía Para el Análisis de Datos. McGraw-Hill, 2002.
www.monografias.com
www.wikipedia.com
Autor:
Orlando Acosta