Descargar

Compendio de estadística (página 2)

Enviado por J. A. Gómez Giménez


Partes: 1, 2

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

edu.red

Este tipo de tablas de frecuencias se utiliza con variables discretas.

Distribución de Frecuencias Agrupadas:

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

Límites de la clase: Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. Amplitud de la clase: Es la diferencia entre el límite superior e inferior de la clase. Marca de clase: Es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Construcción de una tabla de Datos Agrupados:

Dada la siguiente serie de datos:

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

  • 1) Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.

  • 2) Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos queramos establecer.

Es conveniente que el número de intervalos oscile entre 6 y 15.

En este caso, 48 – 3 = 45, incrementamos el número hasta 50 ÷ 5 = 10 intervalos.

Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece a intervalo, se cuenta en el siguiente intervalo. Por ejemplo:

edu.red

Diagrama de Barras:

Se utiliza para representar datos cualitativos o datos cuantitativos de tipo discreto. Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas. Los datos se representan mediante barras de una altura proporcional a la frecuencia.

Ejemplo: Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguíneo ha dado el siguiente resultado:

edu.red

edu.red

Polígonos de Frecuencia:

Se forma uniendo los extremos de las barras por medio de segmentos. También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos.

Ejemplo: Las temperaturas en un día de otoño en la ciudad de Barquisimeto han sufrido las siguientes variaciones:

edu.red

edu.red

Diagrama de Sectores: Se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente.

edu.red

El diagrama circular se construye con la ayuda de un transportador de ángulos.

Ejemplo: En una clase de 30 alumnos, 12 juegan baloncesto, 3 practican la natación, 4 juegan fútbol y el resto no practica algún deporte.

edu.red

edu.red

edu.red

Histograma de Frecuencias: Es una representación gráfica de una variable en forma de barras. Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases.

En el eje abscisas se construyen rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados.

Es una de las maneras más comunes de representar una distribución de frecuencia. Su grafica consiste en un conjunto de barras, en la que la base de cada barra representa una clase o intervalo, indicada en el eje horizontal, y la altura por su frecuencia, indicada en el eje vertical. Generalmente las barras se trazan adyacentes una a la otra.

edu.red

Polígono de Frecuencia: Para construirlo se toma la marca de clase que coincide con el punto medio de cada rectángulo. Es una representación de segmentos de línea que conectan los puntos formados por la intersección del punto medio de clase y la frecuencia de clase absoluta, relativa o porcentual.

edu.red

Ejemplo: El peso de 65 personas adultas viene dado por la siguiente tabla:

edu.red

edu.red

Histograma y Polígono de Frecuencias Acumuladas: Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polígono.

edu.red

Histogramas con Intervalos de Amplitud Diferente: Para construir un histograma con intervalo de amplitud diferente tenemos que calcular las alturas de los rectángulos del histograma.

edu.red

Donde:

hi es la altura del intervalo.

fi es la frecuencia del intervalo.

ai es la amplitud del intervalo.

Ejemplo: En la siguiente tabla se muestra las calificaciones (reprobado, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos.

edu.red

edu.red

Gráficos Estadísticos:

Diagrama Circular: Es de especial utilidad para mostrar proporciones (porcentajes) relativas de una variable. Se crea marcando una porción del círculo correspondiente a cada categoría de la variable.

edu.red

Diagrama de Barras: Es una forma gráfica de representar datos cualitativos que se han resumido en una distribución de frecuencias, de relativas o de porcentuales. Hay varios tipos de gráficos de barras, como son:

Gráfica Simple de Barras Verticales: Para respuestas categóricas cualitativas en el que solo interviene una barra para cada clase. Su trazo se realiza ubicando en el eje horizontal de la gráfica los nombres que identifican cada una de las clases. En el eje vertical se usa una escala de frecuencias, una de frecuencias relativas o una de porcentuales. Luego, con una barra de un ancho fijo trazada sobre cada indicador de clase llegamos a la altura que corresponde al tipo de frecuencia escogido. Las barras se separan a fin de señalar que cada clase es una categoría independiente. Los espacios entre las barras deben corresponder a la mitad del ancho de una barra.

edu.red

Gráfica Simple de Barras Horizontales: Se utiliza principalmente para facilitar la comparación entre las diferentes clases que componen los datos categóricos. El trazo de la gráfica es muy similar a la gráfica de barras verticales, solo que éstas van en forma horizontal y se ordenan de la mayor a la menor frecuencia absolutas, de frecuencia relativas o de porcentajes. De esta manera se logra una mejor visualización en las preferencias.

edu.red

Gráfica de Barras Componentes: Este tipo de gráfica se usa cuando las diferentes categorías de datos se componen de otras clases, de tal forma que cada barra se pueda subdividir y representar cada una de estas clases .Así mismo, entre las categorías y sus componentes se comparan valores.

También se le conoce como Barras Agrupadas. Se puede hacer uso de barras horizontales o de barras verticales; su escogencia depende de lo que se pretenda ilustrar para que facilite su visualización.

edu.red

Gráfica de Barras Seccionadas: Esta gráfica compara entre categorías el aporte de cada valor al total, dando lugar a una columna apilada para cada clase. También se puede presentar de manera horizontal o vertical.

edu.red

Diagrama de Pareto: Es un tipo especial de diagrama de barras verticales, donde las respuestas categóricas se grafican en orden descendente de frecuencias y se combinan con un polígono acumulado en la misma escala. Se usa ampliamente en el control estadístico de procesos y en el control estadístico de la calidad del producto.

Lo que se pretende con este tipo de grafico es describir donde se presenta el mayor porcentaje del problema y cuales factores lo afectan. Este concepto, se conoce como la regla de 80-20, por cuanto considera que el 80 % de la actividad se debe al 20 % de los factores actuantes. Al concentrarse en el 20 % de los factores, los gerentes pueden atacar el 80 % del problema.

edu.red

Gráficas de Línea: Se ilustra por medio de segmentos de línea los cambios en cantidades con respecto al tiempo. Son especialmente útiles en el comercio y en los negocios.

edu.red

Ojiva: Es un polígono acumulado de frecuencia absoluta, relativa o porcentual y por lo tanto representa segmentos de línea que se originan al conectar los puntos formados por la intersección entre el límite inferior de cada clase con la frecuencia acumulada. Es conocida como Polígono de Frecuencia Acumulada Menor Que, por cuanto muestra el número o porcentaje de observaciones menores a cierto valor.

Es importante por cuanto permite extrapolar información que la distribución de frecuencia oculta, así como calcular estadísticos como la Mediana, Cuartiles, Deciles y Percentiles, en forma aproximada. Para construir la ojiva se debe primero elaborar la distribución de frecuencia menor que.

edu.red

Diagrama de Caja: Es una representación gráfica, basada en cinco números estadísticos: Valor Mínimo, Q1, la Mediana, Q3 y Valor Máximo. Se utiliza como una técnica de Análisis Exploratorio de Datos y tiene la ventaja que no se requiere de la Desviación Estándar, ni de la Media Aritmética y resume los datos en una distribución de frecuencia, situación que si necesita el histograma, el polígono y la ojiva. Para su trazo, se lleva a cabo los siguientes pasos:

1. Crear una escala apropiada a lo largo del eje horizontal.

2. Dibujar una caja entre el Q1 y el Q3.

3. Dentro de la caja trazamos una línea recta vertical que representa la mediana.

4. Finalmente, trazamos líneas horizontales de la caja hasta el valor mínimo y de la caja hasta el valor máximo. A estas líneas horizontales fuera de la caja se les conoce como "Bigotes".

edu.red

Parámetros Estadísticos

Es un número que se obtiene a partir de los datos de una distribución estadística. Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.

Tipos de Parámetros Estadísticos:

Hay tres tipos parámetros estadísticos:

Las medidas de centralización son:

  • a) Media Aritmética: Es el valor promedio de la distribución.
  • b) Mediana: Es la puntación de la escala que separa la mitad superior de la distribución y la inferior, es decir, divide la serie de datos en dos partes iguales.
  • c) Moda: Es el valor que más se repite en una distribución.
  • B- De posición. Dividen un conjunto de datos en grupos con el mismo número de individuos.

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

Las medidas de posición son:

  • a) Cuartiles: Dividen la serie de datos en cuatro partes iguales.
  • b) Deciles: Dividen la serie de datos en diez partes iguales.
  • c) Percentiles: Dividen la serie de datos en cien partes iguales.
  • C- De dispersión. Informan sobre cuanto se alejan del centro los valores de la distribución.

Las medidas de dispersión son:

  • 1) Rango o Recorrido: Es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
  • 2) Desviación Media: Es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
  • 3) Varianza: Es la media aritmética del cuadrado de las desviaciones respecto a la media.
  • 4) Desviación Típica: Es la raíz cuadrada de la varianza.

Tablas Estadísticas:

Según el número de observaciones y según el recorrido de la variable estadística, nos ofrecen los siguientes tipos de tablas estadísticas:

Tablas tipo I: Se utiliza cuando el tamaño de la muestra y el recorrido de la variable son pequeños, por ejemplo, si tenemos una muestra de las edades de 5 personas, por lo que no hay que hacer algo especial, simplemente anotarlas de manera ordenada en filas o columnas.

Edad de los 5 miembros de una familia:

5, 8, 16, 38, 45

Tablas tipo II: Se emplea cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño, por lo que hay valores de la variable que se repiten. Por ejemplo, si preguntamos el número de personas activas que hay en 50 familias obtenemos la siguiente tabla:

Personas Activas en 50 familias

edu.red

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla en la que resumamos estos datos quedando la siguiente tabla:

edu.red

Tablas tipo III: Su uso se observa cuando el tamaño de la muestra y el recorrido de la variable son grandes, por lo que será necesario agrupar en intervalos los valores de la variable. Por ejemplo si a un grupo de 30 alumnos les preguntamos el dinero que en ese momento llevan encima, nos encontramos con los siguientes datos:

edu.red

Evidentemente, la variable estadística tiene un recorrido muy grande, 4.998 bolívares, por lo que sí queremos hacer una tabla con estos datos debemos tomar intervalos. Para decidir la amplitud de los intervalos, necesitaremos decidir ¿cuántos intervalos queremos?. Normalmente se suele trabajar con no más de 10 o 12 intervalos.

Amplitud = 4.998/10 = 499,8 Por lo que tomaremos intervalos de amplitud 500.

Debemos tener en cuenta las siguientes consideraciones:

  • 1) Tomar pocos intervalos implica que la "pérdida de información" sea mayor.

  • 2) Los intervalos serán siempre Cerrados por la izquierda y Abiertos por la Derecha [ Li-1, Li).

  • 3) Procuraremos que en la decisión de intervalos los valores observados no coincidan con los valores de los extremos del intervalo y si esto ocurre que no sea en más de un 5 % del total de observaciones.

Con estas recomendaciones tendremos la siguiente tabla:

edu.red

Tipos de Frecuencia: Uno de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, entre otros. Estos números se denominan Frecuencias. Los tipos de frecuencia son:

  • 1) Frecuencia Absoluta: Es el número de veces que aparece en la muestra dicho valor de la variable, la representaremos por ni

  • 2) Frecuencia Relativa: Es una medida que está influida por el tamaño de la muestra, debido a que al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de Frecuencia Relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fi

edu.red

Donde N = Tamaño de la muestra

  • 3) Porcentaje: La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante frecuente hablar siempre en términos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.

edu.red

  • 4) Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por Ni.

  • 5) Frecuencia Relativa Acumulada: Al igual que en el caso anterior, es la frecuencia absoluta acumulada dividida por el tamaño de la muestra, y la denotaremos por Fi

edu.red

  • 6) Porcentaje Acumulado: Análogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la frecuencia relativa acumulada por 100.

edu.red

Veamos esto con un ejemplo:

Tomamos para ello los datos relativos a las personas activas.

 

edu.red

En este ejemplo se puede ver fácilmente como se calculan estas frecuencias.

Formas de Observar la Población:

  • Atendiendo a la fuente se clasifican en directa o indirecta.

  • Observación Directa: Es aquella donde se tienen contacto directo con los elementos y/o caracteres en los cuales se presenta el fenómeno que se pretende investigar, y los resultados obtenidos se consideran datos estadísticos originales. El investigador observa directamente los casos o los individuos en los cuales se produce el fenómeno, entrando en contacto con ellos y sus resultados son datos estadísticos originales, por eso se llama también a esta investigación Primaria.

Ejemplo: El seguimiento de la población agrícola por año, llevado en una determinada granja.

  • Observación Indirecta: Es aquella donde la persona que investiga hace uso de datos estadísticos ya conocidos en una investigación anterior, y/o de datos observados por un tercero (persona o entidad), a fin de deducir otros hechos y/o fenómenos.

Ejemplo: Si un investigador pretende estudiar la producción por años de una granja avícola, en sus últimos cinco años de producción, tendría que hacer un seguimiento, para tal fin se recurriría a las observaciones que posee la oficina administrativa de la granja durante estos cinco años, o dirigirse a la oficina de estadística o del ministerio de producción o de Comercio de la localidad donde está registrada dicha granja. Es de notar que el investigador se vale de observaciones realizadas por terceros.

  • Atendiendo a la periodicidad, puede ser Continua, Periódica o Circunstancial.

  • Una Observación Continua; como su nombre lo indica es aquella que se lleva a cabo de un modo permanente.

Por ejemplo: La contabilidad comercial, llevada en cuanto a compras, ventas y otras operaciones que se van registrando a medida que van produciéndose.

  • Una Observación Periódica; es aquélla que se lleva a cabo a través de períodos de tiempo constantes. Estos períodos de tiempos pueden ser semanas, trimestres, semestres, años, entre otros. Lo destacable es que los períodos de tiempo tomados como unidad deben tomarse constantes en lo posible.

Por ejemplo: El registró llevado por las Oficinas de Control de Estudios de la UCV, en cuanto a la inscripción de los bachilleres por semestre.

  • La Observación Circunstancial, es aquella que se efectúa de forma ocasional o esporádica, esta observación hecha más por una necesidad momentánea, que de carácter regular o permanente.

Por ejemplo; la obtención de números de aulas utilizadas y no utilizadas en los colegios privados pertenecientes al municipio Palavecino del Estado Lara.

  • Atendiendo a la cobertura; pueden ser Exhaustiva, Parcial o Mixta.

  • Observación Exhaustiva: Cuando la observación es efectuada sobre la totalidad de los elementos de la población se habla de una observación exhaustiva.

  • Observación Parcial: Dado que las poblaciones en general son grandes, la observación de todos sus elementos se ve imposibilitada. La solución para superar este inconveniente es observar una parte de esta población.

  • Observación Mixta: En este tipo de observación se combinan adecuadamente la observación exhaustiva con la observación parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran básicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la población es muy grande, parte de ella se observa parcialmente.

  • Censo: Es aquella numeración que se efectúa a todos y cada uno de los caracteres componentes de una población.

Si es posible listar o enumerar y observar cada elemento de la población, pero los censos se utilizan cada cierto tiempo porque a menudo su compilación es bastante difícil, consume mucho tiempo y resulta demasiado costoso.

  • Encuesta: Son las observaciones realizadas por muestreo, es decir, son observaciones parciales.

El diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa que si queremos conocer algo acerca del comportamiento de las personas, lo mejor, más directo y simple es preguntárselo directamente a ellas.

  • Estadística Descriptiva: Tiene por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observación de todos los elementos de una población (observación exhaustiva) sino también a la descripción de los elementos de una muestra (observación parcial).

  • Estadística Inductiva: Está fundamentada en los resultados obtenidos del análisis de una muestra de población, con la finalidad de inducir y/o inferir el comportamiento y/o característica de la población de la cual procede, por lo que recibe también el nombre de Inferencia estadística.

El objetivo de la inferencia en investigación científica y tecnológica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas compuestas por los mismos elementos.

En relación a la estadística descriptiva y la inferencial, Levin & Rubin (1.996) citan los siguientes ejemplos para ayudar a entender la diferencia entre las dos:

Supóngase que un profesor calcula la calificación promedio de un grupo de alumnos en Historia Universal. Como la estadística describe el desempeño del grupo pero no hace ninguna generalización acerca de los diferentes grupos, podemos decir que el profesor está utilizando Estadística Descriptiva. Gráficas, tablas y diagramas que muestran los datos de manera que sea más fácil su entendimiento son ejemplos de Estadística Descriptiva.

Supóngase ahora que el profesor de historia decide utilizar el promedio de calificaciones obtenidas por uno de sus grupos para estimar la calificación promedio de las demás secciones del mismo curso de historia. El proceso de estimación de tal promedio sería un problema concerniente a la Estadística Inferencial.

Los estadísticos se refieren a esta rama como Inferencia Estadística, la cual implica generalizaciones y afirmaciones con respecto a la probabilidad de su validez.

Medidas Estadísticas:

Tipo de Medidas:

  • Medidas de Centralización:

  • Sirven para determinar los valores centrales o medios de la distribución frecuencial.

  • Medidas de Dispersión:

  • Otorgan una idea sobre la representatividad de las medidas centrales, por cuanto a mayor dispersión menor representatividad.

  • Medidas de Localización:

  • Son útiles para encontrar determinados valores importantes, para una clasificación de los elementos de la muestra y/o población.

  • Medidas de la Simetría:

  • Permiten determinar si la distribución tiene el mismo comportamiento por encima y por debajo de los valores centrales.

  • Cálculo de los coeficientes de Simetría y Curtósis.

Medidas de Centralización:

Media Aritmética:

Es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.

Se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por edu.redy se calcula mediante la expresión:

edu.red

xi representa el valor de la variable o en su caso la marca de clase.

Media aritmética para datos agrupados:

Ejercicio de media aritmética:

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media.

edu.red

Propiedades de la Media Aritmética:

  • Si multiplicamos o dividimos todas las observaciones por un mismo número, la media queda multiplicada o dividida por dicho numero.

  • Si le sumamos a todas las observaciones un mismo número, la media aumentará en dicha cantidad.

  • Además de la media aritmética existen otros conceptos de media, como son la media geométrica y la media armónica.

  • La suma de las desviaciones de todas las puntuaciones de una distribución respecto a la media de la misma igual a cero.

Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:

8 – 7.6 + 3 – 7.6 + 5 – 7.6 + 12 – 7.6 + 10 – 7.6 =

= 0. 4 – 4.6 – 2.6 + 4. 4 + 2. 4 = 0

  • La media aritmética de los cuadrados de las desviaciones de los valores de la variable con respecto a un número cualquiera se hace mínima cuando dicho número coincide con la media aritmética.

  • Si a todos los valores de la variable se les suma un mismo número, la media aritmética queda aumentada en dicho número.

  • Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda multiplicada por dicho número.

Observaciones acerca de la Media Aritmética:

1) La media se puede hallar sólo para variables cuantitativas.

2) La media es independiente de las amplitudes de los intervalos.

3) La media es muy sensible a las puntuaciones extremas. Si tenemos una distribución con los siguientes pesos:

65 kg, 69 kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.

La media es igual a 74 kg, que es una medida de centralización poco representativa de la distribución.

4) La media no se puede calcular si hay un intervalo con una amplitud indeterminada.

Media Geométrica: La media geométrica de N observaciones es la raíz de índice N del producto de todas las observaciones. La representaremos por G.

edu.red

Solo se puede calcular si no hay observaciones negativas. Es una medida estadística poco o nada usual.

Media Armónica: La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H.

edu.red

Al igual que en el caso de la media geométrica su utilización es bastante poco frecuente.

Mediana:

Es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el valor que divide en dos partes la muestra.

La mediana se representa por Me.

La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la mediana:

1) Ordenamos los datos de menor a mayor.

2) Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6 Me = 5

3) Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.

7, 8, 9, 10, 11, 12 Me = 9.5

Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua.

edu.red

Cálculo de la mediana en el caso continuo:

a. Si la variable es continua, la tabla vendrá en intervalos, por lo que se calcula de la siguiente forma:

  • Nos vamos a apoyar en un gráfico de un histograma de frecuencias acumuladas.

edu.red

Donde la mediana vale: edu.redy donde ai es la amplitud del intervalo.

Cálculo de la Mediana para datos agrupados:

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas, es decir, tenemos que buscar el intervalo en el que se encuentre cociente.

Li-1 es el límite inferior de la clase donde se encuentra la mediana, lo cual representa el cociente es la semisuma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

La mediana es independiente de las amplitudes de los intervalos.

Ejemplo:

Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:

edu.red

Clase modal: [66, 69)

Moda:

Es el valor que tiene mayor frecuencia absoluta, es decir, el que más veces se repite en una serie de datos. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas.

Hallar la moda de la distribución:

2, 3, 3, 4, 4, 4, 5, 5 Mo = 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo = 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.

2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8 Mo = 4

Cálculo de la moda para datos agrupados:

  • Todos los intervalos tienen la misma amplitud.

Li-1 es el límite inferior de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi–1 es la frecuencia absoluta inmediatamente inferior a la de la clase modal.

fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.

ai es la amplitud de la clase.

Ejemplo:

Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:

edu.red

2) Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas. La clase modal es la que tiene mayor altura.

Medidas de Dispersión

Desviación media: Es la media de los valores absolutos de las desviaciones, y la denotaremos por dm.

edu.red

Varianza: Es la media de los cuadrados de las desviaciones, y la denotaremos por edu.redo también por edu.red

edu.red

Aunque también es posible calcularlo como:

edu.red

Este estadístico tiene el inconveniente de ser poco significativo, por cuanto se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. la varianza vendrá en cm2.

Desviación típica: Es la raíz cuadrada de la varianza, se denota por Sx o s x.

edu.red

Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor.

Otros dos estadísticos importantes son la Cuasivarianza y la Cuasidesviación Típica, que son los estimadores de la Varianza y Desviación Típica Poblacionales respectivamente.

Cuasivarianza: Es una medida de dispersión, cuya única diferencia con la varianza es que dividimos por N-1, la representaremos por edu.redo edu.redy la calcularemos de la siguiente forma:

edu.red

Cuasidesviación Típica: La raíz cuadrada de la cuasivarianza y la denotaremos por SN—1 o s N-1.

edu.red

Todas estas medidas de dispersión vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad de medida, los valores de estos estadísticos se vean a su vez modificados. Además, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan más dispersión por cuanto no es posible comparar unidades de distinto tipo.

De manera tal que se precisa una medida Escalar, es decir, que no lleve asociado ninguna unidad de medida.

Coeficiente de Variación: Es un estadístico de dispersión que tiene la ventaja que no lleva asociada ninguna unidad, por lo cual permite saber entre dos muestras, cual presenta mayor dispersión. Se denota C.V. y su formula es:

edu.red

Ejemplo:

Veamos un ejemplo de cómo se calculan todas estas medidas.

edu.red

Medidas de Localización:

Cuartiles, Deciles y Percentiles

Estas medidas dividen la distribución en partes iguales y sirven para clasificar a un individuo y/o elemento dentro de una determinada población y/o muestra. Así en psicología los resultados de los test o pruebas que realizan a un determinado individuo, sirve para clasificar a dicho sujeto en una determinada categoría en función de la puntuación obtenida.

Cuartiles: Medida de localización que divide la población y/o muestra en cuatro partes iguales representadas así:

  • Q1= Valor de la variable que deja a la izquierda el 25 % de la distribución.

  • Q2= Valor de la variable que deja a la izquierda el 50 % de la distribución = Mediana.

  • Q3= Valor de la variable que deja a la izquierda el 75 % de la distribución.

Al igual que ocurre con el cálculo de la mediana, el cálculo de estos estadísticos, depende del tipo de variable.

Caso I: Variable Cuantitativa Discreta: En este caso debemos observar el tamaño de la muestra: N y para calcular Q1 o Q3 procederemos como si tuviésemos que calcular la mediana de la correspondiente mitad de la muestra.

Caso II: Variable cuantitativa continua: En este caso el cálculo es más simple, sea la distribución que sigue:

edu.red

Siendo el intervalo coloreado donde se encuentra el Cuartil correspondiente:

edu.redy edu.red

Cálculo de los Cuartiles:

1) Ordenamos los datos de menor a mayor.

2) Buscamos el lugar que ocupa cada cuartil mediante la expresión:

edu.red

Número impar de datos:

2, 5, 3, 6, 7, 4, 9

edu.red

Número par de datos:

2, 5, 3, 4, 6, 7, 1, 9

edu.red

Cálculo de los Cuartiles para datos agrupados:

En primer lugar buscamos la clase donde se encuentra edu.reden la tabla de las frecuencias acumuladas.

edu.red

Donde:

Li es el límite inferior de la clase donde se encuentra el cuartil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del cuartil.

ai es la amplitud de la clase.

Ejercicio de Cuartiles:

Calcular los cuartiles de la distribución en la siguiente tabla:

edu.red

Cálculo del primer Cuartil:

edu.red

edu.red

Cálculo del segundo Cuartil:

edu.red

edu.red

Cálculo del tercer Cuartil:

edu.red

edu.red

Deciles: Es la medida de localización que divide la población o muestra en 10 partes iguales. No tiene mucho sentido calcularlas para variables cualitativas discretas, de manera tal que solo la usaremos para las variables continuas.

dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k·10 % de la distribución.

edu.red

Intervalo donde se encuentra el Decil correspondiente:

edu.red

k = 1 .. 9

Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

Los deciles dan los valores correspondientes al 10 %, al 20 %… y al 90 % de los datos.

D5 coincide con la mediana.

Cálculo de los Deciles: En primer lugar buscamos la clase donde se encuentra edu.reden la tabla de las frecuencias acumuladas.

edu.red

Donde:

Li es el límite inferior de la clase donde se encuentra el decil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del decil.

ai es la amplitud de la clase.

Ejercicio de Deciles:

Calcular los deciles de la distribución en la siguiente tabla:

edu.red

Cálculo del primer Decil:

edu.red

edu.red

Cálculo del segundo Decil:

edu.red

edu.red

Cálculo del tercer Decil:

edu.red

edu.red

Cálculo del cuarto Decil:

edu.red

edu.red

Cálculo del quinto Decil:

edu.red

edu.red

Cálculo del sexto Decil:

edu.red

edu.red

Cálculo del séptimo Decil:

edu.red

edu.red

Cálculo del octavo Decil:

edu.red

edu.red

Cálculo del noveno Decil:

edu.red

edu.red

Percentiles: Es la medida de localización que divide la población y/o muestra en 100 partes iguales. No tiene mucho sentido calcularlas para variables cualitativas discretas, razón por la cual solo la vamos a observar para las variables continuas.

pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribución.

edu.red

Intervalo donde se encuentra el percentil correspondiente:

edu.red

K = 1 = 99

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.

Los percentiles dan los valores correspondientes al 1 %, al 2 %… y al 99 % de los datos.

P50 coincide con la mediana.

Cálculo de los Percentiles:

En primer lugar buscamos la clase donde se encuentra edu.reden la tabla de las frecuencias acumuladas.

edu.red

Donde:

Li es el límite inferior de la clase donde se encuentra el percentil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del percentil.

ai es la amplitud de la clase.

Ejercicio de Percentiles:

Calcular el percentil 35 y 60 de la distribución en la siguiente tabla:

edu.red

Percentil 35:

edu.red

edu.red

Percentil 60:

edu.red

edu.red

Ejemplo:

Como se puede observar la forma de calcular estas medidas es muy similar a la del cálculo de la mediana.

Veamos el cálculo de algunas de estas medidas en el ejemplo que estamos estudiando.

edu.red

Cálculo de Q1: Buscamos en la columna de las Frecuencias Acumuladas el valor que supere al 25 % de N = 50, corresponde al 2º intervalo. (50/4=12.5)

edu.red

Análogamente calculemos Q3, Buscamos ahora en la misma columna el correspondiente al 75 % de N que en este caso es el 4º intervalo. (3.50/4=37.5)

edu.red

Veamos ahora el decil 3º. (Corresponde al 30 % 3 · 50 / 10 = 15) sería el 2º intervalo.

edu.red

Por último veamos el percentil 45 (45·50/100 = 22.5) Corresponde al intervalo 3º.

edu.red

Desviación Media:

Desviación respecto a la media: Es la diferencia en valor absoluto entre cada valor de la variable estadística y la media aritmética.

Di = |x – x|

Desviación Media: Es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

La desviación media se representa por edu.red

edu.red

edu.red

Ejemplo:

Calcular la desviación media de la siguiente distribución:

edu.red

Desviación media para datos agrupados:

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:

edu.red

edu.red

Ejemplo:

Calcular la desviación media de la siguiente distribución:

edu.red

edu.red

edu.red

Algunas medidas de Dispersión asociadas:

Una vez estudiadas las medidas de localización surgen dos nuevas medidas de dispersión, que son:

edu.red

Medidas de Simetría: Al igual que la Curtosis, van a ser medidas de la forma de la distribución, es frecuente que los valores de una distribución tiendan a ser similares a ambos lados de las medidas de centralización. La simetría es importante para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable.

Medir la asimetría se puede realizar atendiendo básicamente a dos criterios:

  • Comparando la Media y la Moda.

  • Comparando los valores de la variable con la media.

Comparando la Media y la Moda:

edu.red

Esta medida es muy fácil de calcular, pero menos precisa que el Coeficiente de Asimetría de Pearson.

El Coeficiente de Asimetría de Pearson, se basa en la comparación con la media de todos los valores de la variable, así que es una medida que se basará en las diferencias edu.redcomo vimos en el caso de la dispersión si medimos la media de esas desviaciones sería nulas, si las elevamos al cuadrado, serían siempre positivas por lo que tampoco servirían, por lo tanto precisamos elevar esas diferencias al cubo.

Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo tanto relativa, dividimos por el cubo de su desviación típica. Con lo que resulta la siguiente expresión:

edu.red

Curtosis: Es una medida del a53-1-u-puntamiento, que nos indicará si la distribución es muy a53-1-u-puntada o poco a53-1-u-puntada.

edu.red

Como podemos observar, el coeficiente de Curtosis nos mide el grado de a53-1-u-puntamiento de la distribución. Este coeficiente lo vamos a denotar por K y se calcula según la siguiente expresión:

edu.red

Veamos por último el cálculo de estos dos últimos coeficientes en el ejemplo que estamos estudiando:

Luego es una distribución asimétrica negativa o a la izquierda y Platicúrtica.

edu.red

Asimetría: Se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media aritmética).

edu.rededu.red

edu.red

Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher, que viene definido:

edu.red

Los resultados pueden ser los siguientes:

g 1 = 0 (Distribución Simétrica: Existe la misma concentración de valores a la derecha y a la izquierda de la media).

g1 > 0 (Distribución Asimétrica Positiva: Existe mayor concentración de valores a la derecha de la media que a su izquierda).

g1 < 0 (Distribución Asimétrica Negativa: Existe mayor concentración de valores a la izquierda de la media que a su derecha).

Ejemplo:

Calcular el Coefiente de Asimetría de Fisher de la serie de datos referidos a la estatura de un grupo de alumnos:

edu.red

edu.red

Por lo tanto el Coeficiente de Fisher de Simetría de esta muestra es – 0,1586, lo que quiere decir que presenta una distribución asimétrica negativa por cuanto se concentran más valores a la izquierda de la media que a su derecha.

Curtosis: Analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Se definen tres tipos de distribuciones según su grado de curtosis:

1) Distribución Mesocúrtica: Presenta un grado de concentración medio alrededor de los valores centrales de la variable, el mismo que presenta una distribución normal.

2) Distribución Leptocúrtica: Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

3) Distribución Platicúrtica: Presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

edu.red

El Coeficiente de Curtosis viene definido por la siguiente fórmula:

edu.red

Los resultados pueden ser los siguientes:

g 2 = 0 (Distribución Mesocúrtica).

g2 > 0(Distribución Leptocúrtica).

g2 < 0 (Distribución Platicúrtica).

Ejemplo:

Calcular el Coefiente de Curtosis de la serie de datos referidos a la estatura de un grupo de alumnos, cuya tabla aparece en el apartado anterior.

Recordemos que la media de esta muestra es 1,253.

edu.red

Por lo tanto, el Coeficiente de Curtosis de esta muestra es – 1,39, lo que quiere decir que se trata de una distribución platicúrtica, por cuanto posee una reducida concentración alrededor de los valores centrales de la distribución, aunque tampoco en este caso esta deviación de la simetría está suficientemente alejada del 0 para ser considerada significativa debido a que se encuentra entre – 2 y 2.

Otras Definiciones:

Estadística Inferencial: Es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades y/o hacer inferencias de una población, a partir de una pequeña parte de la misma, esto es, una muestra.

Planteamiento del problema: Suele iniciarse con una fijación de objetivos o algunas preguntas como ¿cuál será la media de esta población respecto a tal característica?, ¿se parecen estas dos poblaciones?, ¿hay alguna relación entre ellas?, entre otras.

En el planteamiento se definen con precisión la población, la característica a estudiar, las variables, entre otros.

Elaboración de un modelo: Se establece un modelo teórico de comportamiento de la variable de estudio. En ocasiones no es posible diseñar el modelo hasta realizar un estudio previo.

Los posibles modelos son Distribuciones de Probabilidad.

Extracción de la muestra: Se usa alguna técnica de muestreo o un diseño experimental para obtener información de una pequeña parte de la población. Tratamiento de los datos: En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que serán necesarios en pasos posteriores, como la Media Muestral y la Varianza Muestral.

Los métodos de esta etapa están definidos por la Estadística Descriptiva.

Estimación de los parámetros: Con determinadas técnicas se realiza una predicción sobre cuáles podrían ser los parámetros de la población. Contraste de hipótesis: Son técnicas que permiten simplificar el modelo matemático bajo análisis. Frecuentemente el contraste de hipótesis recurre al uso de estadísticos muestrales. Conclusiones: Se critica el modelo y se hace un balance. Las conclusiones obtenidas en este punto pueden servir para tomar decisiones o hacer predicciones. El estudio puede comenzar de nuevo a partir de este momento, en un proceso cíclico que permite conocer cada vez mejor la población y características de estudio.

Método para la recolección de datos:

En estadística se emplean una variedad de métodos diversos para obtener información de los que se desea investigar. Presento aquí los métodos más importantes, incluyendo las ventajas y limitaciones de estos:

La Entrevista Personal: Los datos estadísticos necesarios para una investigación, se reúnen frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente, directamente a la persona investigada. El investigador efectuará a esta persona una serie de preguntas previamente escritas en un cuestionario o boleta, donde anotará las respuestas correspondientes.

Este procedimiento permite obtener una información más veraz y completa que la proporcionada por otros métodos, debido que al tener contacto directo con la persona entrevistada, el entrevistador podrá aclarar cualquier duda que se presente sobre el cuestionario o investigación.

Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje de las preguntas al nivel intelectual de las personas entrevistadas.

Una de las desventajas de este método se debe a que si el entrevistador no obra de buena fe o no tiene un entrenamiento adecuado, puede alterar las respuestas por las personas entrevistadas.

Otra desventaja es su alto costo, ya que resulta bastante oneroso el entrenamiento de los agentes o entrenadores y los supervisores de estos, sobre todo si se trata de una investigación extensa.

Cuestionarios por correo: Consiste en enviar por correo el cuestionario acompañado por el instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una de las preguntas, sino también una breve explicación del objeto de la encuesta con el fin de evitar interpretaciones erróneas.

Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto que no hay que incluir gastos de entrenamiento de personal, el único gasto sería el de franqueo postal.

Dentro de las desventajas de este procedimiento podemos señalar que solo un porcentaje bastante bajo de estos es devuelto, en algunos casos no estamos seguros que los formularios hayan sido recibidos por sus destinatarios y que hayan sido respondidos por ellos mismos. Lo que trae como consecuencia que la información se obtenga con una serie de errores difíciles de precisar por el investigador.

Entrevista por teléfono: Consiste en telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este método es bastante simple y económico, ya que el entrenamiento y supervisión de las personas encargadas de efectuar las preguntas es siempre fácil.

Entre las limitaciones que presenta este método podemos señalar el número de preguntas que pueden formularse es relativamente limitado; además las investigaciones efectuadas por este método tienen un carácter selectivo, debido a que muchas de las personas que potencialmente podrían ser investigadas no posee servicio telefónico, por lo que quedan sin la posibilidad de ser entrevistados.

edu.red

Instrumentos para la recolección de datos:

Cuestionarios: Cualquiera sea el método por el que se decida el investigador para recabar información, es necesario elaborar un estudio de preguntas. Los cuestionarios en general, constan de las siguientes partes:

  • La identificación del cuestionario: Nombre del patrocinante de la encuesta sea oficial o privada, nombre de la encuesta, número del cuestionario, nombre del encuestador, lugar y fecha de la entrevista.

  • Datos de identificación y de carácter social del encuestado: Apellidos, nombres, cédula de identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado civil, grado de instrucción, ocupación actual, ingresos, entre otros.

  • Datos propios de la investigación: Son los datos que interesa conocer para construir el propósito de la investigación.

Como es natural, estas partes, así como las preguntas, varían de acuerdo a la finalidad de la encuesta. En algunos tipos de investigación, la parte referente a los datos personales es eliminada por no tener ningún tipo de interés para el estudio.

Consideraciones que debemos tomar en cuenta:

  • El cuestionario debe ser conciso; tratar en lo posible que con el menor número de preguntas, se obtenga la mejor información.

  • Claridad de la redacción; evitar preguntas ambiguas o que sugieran respuestas incorrectas, por lo que deben estar formuladas las preguntas de la forma más sencilla.

  • Discreción: Un cuestionario hecho a conciencia, no debe tener preguntas indiscretas o curiosas, sobre datos personales que puedan ofender al entrevistado.

  • Facilidad de contestación: Se deben evitar en lo posible, las preguntas de respuestas libres o abiertas y también la formulación de preguntas que requieran cálculos numéricos por parte del entrevistado.

  • Orden de las preguntas: Deben tener una secuencia y un orden lógico, agruparlas procurando que se relacionen unas con otras.

Series o distribuciones estadísticas:

Anteriormente hemos señalado que la estadística, no se encarga del estudio de un hecho aislado, sino que tienen por objeto de los colectivos. Pues bien cuando se realiza una investigación se obtiene una masa de datos que deben ser organizados para disponerlos en un orden, arreglo o secuencia lógica, con el fin de facilitar el análisis de los mismos esta colección de datos numéricos obtenidos de la observación, que se clasifican y ordenan según un determinado criterio, se denominan Series Estadísticas, también conocidas como Distribución Estadística.

Clasificación de las series estadísticas:

  • Ejemplo:

Producción nacional de madera en Rola en m³

Rollizos (periodo 1993 – 1998):

Años:

Producción (m³ rollizos):

1993

1.161.061,454

1994

981.668,626

1995

1.087.926,142

1996

1.440.306,250

1997

1.618.075,000

1998

1.027.177,876

Fuente: MARN – D.G.S Recurso Forestal. 1.999. CVG – PROFORCA

Es importante resaltar que cuando se trata de series temporales o cronológicas, se debe especificar el instante o el periodo de tiempo a los que se refiere los caracteres en estudio.

Cuando nos referimos a instantes de tiempo, por el hecho que la observación se hace en un momento específico de tiempo.

Ejemplo:

Plantaciones forestales ejecutadas a nivel nacional, al 31 de diciembre de cada año entre 1997 – 2001.

  • Series temporales o cronológicas: Se definen como una masa o conjunto de datos producto de la observación de un fenómeno individual o colectivo, cuantificable en sucesivos instantes o periodos de tiempo.

  • Series atemporales: Cuando las observaciones de un fenómeno se hacen referidas al mismo instante o intervalo de tiempo, nos encontramos ante una serie atemporal. Aquí el tiempo no va incluido a cada observación, puesto que es el mismo tiempo para todas ellas. Este tipo de observación proporciona una visión instantánea de los fenómenos o caracteres de los componentes del colectivo en estudio.

Ejemplo:

Las notas de las participantes en la materia de estadística I en el periodo académico que terminó en septiembre del 2.001.

2.1) Series de frecuencia: Cuando realizamos un estudio de cada uno de los elementos que componen la población o muestra bajo análisis, observamos que en general, hay un número de veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la misma modalidad de un atributo. Este número de repeticiones de un resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia.

El procedimiento mediante el cual se realiza el conteo, para así determinar el número de veces que cada dato se repite, recibe el nombre de tabulación.

Ejemplo:

Consideremos las edades de 20 niños, pertenecientes al Preescolar Blanca de Pérez, ubicado en la urbanización Monseñor Padilla:

5

6

5

4

3

6

3

4

5

4

3

4

6

5

3

4

3

6

4

6

Tabulando los datos tenemos:

Niños distribuidos por edades:

Edad (variable):

Nº de niños (Frecuencia):

3

5

4

6

5

4

6

5

Total =

20

Al agrupar los resultados de las observaciones en término de las veces que éstos se repiten, da lugar a las llamadas Series de Frecuencias o Distribuciones de Frecuencias; las cuales se dividen a su vez en series de frecuencia cualitativas y cuantitativas, según que los caracteres de estudio se refieran a atributos o variables respectivamente.

2.2.1) Series de frecuencia acumulativa: Son comúnmente llamadas series de frecuencia de atributos o caracteres cualitativos y las formas de representar un atributo recibe el nombre de modalidades.

Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un carácter de tipo cualitativo y se procede a agruparlos según las distintas modalidades que toma el atributo, frecuencia cualitativa.

Ejemplo:

Agrupamos los resultados obtenidos al observar los 35 bachilleres de la materia estadística I, respecto a su estado civil.

Bachilleres de la materia Estadísticas I, clasificados por su estado civil.

Estado civil:

Nº de Estudiantes (frecuencia):

Solteros

18

Casados

12

Viudos

1

Divorciados

4

2.1.2) Series de frecuencias cualitativas: Es el resultado del agrupamiento de los valores que se repiten (frecuencia) al ser observada una variable.

Ejemplo:

Tomamos nuevamente los 35 bachilleres de la materia estadística I, respecto a su edad.

Edad (en años):

Nº de estudiantes (frecuencia):

19

12

20

2

25

8

28

6

32

4

42

3

Total =

35

2.2) Series especiales o geográficas: Es aquella que está formada por los valores que toman una variable en función del espacio geográfico.

A manera de conclusión

La Estadística es una ciencia matemática utilizada para describir, analizar e interpretar ciertas características de un conjunto de individuos llamado Población. Al referirnos a Muestra y Población hablamos de conceptos relativos que están estrechamente ligados. Una Población es un todo y una Muestra es una parte o segmento de ese todo.

Podemos dividir la estadística en dos ramas: la Estadística Descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio; y la Estadística Inferencial, dedicada a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión.

La estadística trata en primer lugar, de acumular la masa de datos numéricos provenientes de la observación de multitud de fenómenos, procesándolos de forma razonable. Por medio de la teoría de la probabilidad analiza y explora la estructura matemática subyacente al fenómeno del que estos datos provienen y, trata de sacar conclusiones y predicciones que ayuden al mejor aprovechamiento del fenómeno.

Se puede decir que desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos para contar el número de personas, animales o ciertas cosas.

La historia de la estadística se basaba en grandes etapas o fases; las cuales fueron los Censos que constituye una autoridad política. La idea de inventariar de una forma más o menos regular la población y las riquezas existentes en el territorio está ligada a la conciencia de soberanía y a los primeros esfuerzos administrativos; de la Descripción de los Conjuntos a la Aritmética Política que eran las ideas mercantilistas entrañan una intensificación de este tipo de investigación.

Colbert multiplica las encuestas sobre artículos manufacturados, el comercio y la población y por último la Estadística y Cálculo de Probabilidades que se incorpora rápidamente como un instrumento de análisis extremadamente poderoso para el estudio de los fenómenos económicos y sociales y en general para el estudio de los fenómenos.

La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos. La estadística tiene una suma de importancia que cabe señalar por cuanto se utiliza términos como lo son:

  • Estadística Descriptiva, que tiene por objeto describir y analizar un determinado colectivo sin pretender sacar conclusiones de tipo más general.

  • Estadística Inductiva, que basándose en los resultados obtenidos del análisis de una muestra de la población, infiere, induce o estima las leyes de comportamiento de la población a la cual pertenece la muestra.

  • Población o universo, es la totalidad de elementos, personas o cosas cuyas características se trata de estudiar.

  • Muestra, parte de la población a estudiar que la representa, esta es una colección de algunos elementos de la población, pero no de todos.

  • Censo, numeración que se efectúa a todos y cada uno de los caracteres componentes de una población.

  • Encuesta, las observaciones realizadas por muestreo, es decir son observaciones parciales.

  • Variables, son las características que estamos midiendo. Existen dos categorías o tipo de variables:

  • A) Variable Cualitativa: Es aquella que expresa un atributo o característica, por ejemplo: Rubio, moreno, entre otros.

  • B) Variable Cuantitativa: Es aquella que podemos expresar numéricamente, por ejemplo: edad, peso, número de hijos, entre otros.

  • Frecuencia Absoluta, es el número de repeticiones que presenta una observación.

  • Frecuencia Relativa, es la frecuencia absoluta dividida por el número total de datos, se suele expresar en tanto por uno, siendo su valor –iésimo.

En estadística se utiliza las representaciones grafica como lo son:

  • a) Diagrama de barras: Se utiliza para frecuencias absolutas o relativas, acumuladas o no, de una variable discreta.

  • b) Histograma: Igual que el anterior en cuanto al tipo de frecuencias que se pueden utilizar. La diferencia es que se usa para las variables continuas.

  • c) Diagrama de escalera: Utilizada para frecuencias acumuladas.

  • d) Pictograma: Se suele utilizar para expresar un atributo.

  • e) Polígono de frecuencias: Es la recta que une los extremos de las variables de una distribución.

Los conceptos antes mencionados han sido analizados e investigados de tal manera de hacer más fácil su comprensión y entendimiento por cuanto la estadística es la ciencia que trata de entender, organizar y tomar decisiones que estén de acuerdo con los análisis efectuados.

La estadística juega un papel muy importante en nuestras vidas, debido a que actualmente ésta se ha convertido en un método muy efectivo para describir con mucha precisión los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, además, sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico ha evolucionado mucho, ya no consiste sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información, ahora tiene un papel mucho más importante del que tenía en años pasados.

Es de vital importancia para nuestra vida profesional venidera, que manejemos estos conceptos con facilidad, así mismo el que los usemos de la manera apropiada, siempre en pro de buscar soluciones a los problemas que se nos puedan presentar.

La estadística ha estado presente desde hace siglos atrás con las antiguas civilizaciones, su uso ha sido necesario en primeras instancias para resolver casos de la vida diaria, luego sería empleada con fines a mayor escala como trabajos investigativos o estudios, y ha adquirido relevancia, debido a que por medio de ella se puede procesar una extensa información, lo cual se puede llevar a cabo de forma más sencilla sin pasar a ser algo tedioso.

Tanto así es su importancia que ha dejado de ser solo una parte de las matemáticas y se ha convertido en una ciencia empleada en diferentes campos, pues han tomado sus métodos para aplicarlos a sus áreas independientemente de la que sea, como por ejemplo: la psicología, la medicina, la contaduría, administración, entre otras.

La significación de la estadística es posible gracias a que los métodos que la acompañan son reconocidos por su gran confiabilidad y validez, por lo cual son totalmente apropiados para manejar información.

Es por ello, que la presente obra plantease los diversos conceptos básicos de la estadística, los tipos de estadística haciendo énfasis en la primera con sus diferentes medidas, así como los medios que utiliza para representar e interpretar datos, por último, al análisis de correlación y regresión lineal simple, y su aplicación para cualquier trabajo investigativo o de estudio.

Además, teniendo en cuenta que nos encontramos en una época donde lo tecnológico tiene gran influencia en la vida diaria de cada persona, la estadística también ha hecho uso de lo computacional, para hacer mucho más sencillo el trabajo de procesar tanta información, donde podemos hacer uso de distintos sistemas, por ejemplo el Windows, junto con los programas que ofrece, entre ellos: Microsoft Word, Power Point, Excel, entre otros, realizando diversos trabajos estadísticos, debido a que nos facilita cálculos, así como la construcción de tablas y gráficos, necesarios en la estadística.

También tenemos a nuestro alcance el internet que nos permite encontrar información desde cualquier parte del mundo. Por ello, esta obra presenta estos temas informáticos, que en su análisis, permitirá llegar a la conclusión de la importancia de la estadística e informática cuando van de la mano a la hora de realizar un trabajo de investigación, sin importar la dificultad del mismo.

En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico ahora no consiste solamente en reunir y tabular los datos, sino sobre todo el proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística.

Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.

La estadística es una ciencia cuya finalidad radica en facilitar la solución de problemas en los cuales necesitamos conocer algunas características sobre el comportamiento de algún suceso o evento. Dichas características nos permiten conocer o mejorar el conocimiento de ese suceso. Además nos permiten inferir el comportamiento de sucesos iguales o similares sin que estos ocurran.

Un objetivo común para un proyecto de investigación estadística es investigar la causalidad, y en particular extraer una conclusión en el efecto que algunos cambios en los valores de predictores o variables independientes tienen sobre una respuesta o variables dependientes. Hay dos grandes tipos de estudios estadísticos para estudiar causalidad: los estudios experimentales y los observacionales. En ambos tipos de estudios, el efecto de las diferencias de una variable independiente o variables en el comportamiento de una variable dependiente es observado.

La diferencia entre ambos es la forma en que el estudio es conducido. Cada uno de ellos puede ser muy efectivo.

 

 

 

Autor:

Lic. J. A. Gómez Giménez.

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente