Descargar

Edades de las Personas que Asisten a Cines Unidos

Enviado por Maria Lucila


    Ubicado en el Centro Comercial Regina (CCR) –Puerto La Cruz.

    1. Bases teóricas
    2. Distribución de frecuencias.
    3. Medidas de tendencia central.
    4. Medidas de posición.
    5. Medidas de dispersión.
    6. Conclusión
    7. Bibliografía

    INTRODUCCIÓN

    Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de maderas y paredes de cuevas para contar el número de personas, animales o ciertas cosas.

    En nuestros días, la estadística se ha convertido en un método efectivo para descubrir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para analizar y relacionar dichos datos.

    La estadística se puede definir como un conjunto de métodos para manejar la recolección, presentación y agrupación de los datos, así como del análisis, interpretación, proyección e inferencia de ellos, y ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones.

    En este trabajo se realizará un análisis estadístico de las edades de las personas que asisten a Cines Unidos, ubicado en el Centro Comercial Regina (CCR) – Puerto La Cruz, para el desarrollo de este análisis se utilizará un conjunto de mediciones estadísticas que hemos venido estudiando a lo largo de toda la materia y que ayudaran en el análisis de estos datos. Estas mediciones serán:

    • Distribución de Frecuencias.
    • Medidas de Tendencia Central.
    • Medidas de Posición.
    • Medidas de Dispersión.

    BASES TEÓRICAS

    Estadística:

    Se define como el conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas. Es la recopilación, presentación y caracterización de la información en fin de que se auxilie tanto en el análisis de datos como en el proceso de la toma de decisiones.

    Probabilística:

    Es aquella que proporciona una base racional para tratar de resolver situaciones influidas por factores aleatorios.

    Población:

    Es el conjunto de los elementos sobre el cual realizamos nuestro estudio. Es un conjunto de elementos con características comunes, que pueden ser finitos o infinitos.

    Muestra:

    Es un conjunto de medidas, observaciones tomadas a partir de una población dada.

    Frecuencia:

    Es el número de veces que se repite un valor, dato o término dentro de una serie en estudio.

    Tipos de frecuencias estadísticas:

    • Frecuencia simple absoluta: es el número de veces que se observa en un mismo ítem o la cantidad de datos que caen en un mismo intervalo.
    • Frecuencia simple relativa: es la razón geométrica entre la frecuencia absoluta y el total de datos, es decir el cociente de dividir el número de veces que aparece un dato de un intervalo entre la totalidad de datos que conforma la muestra de que se trate. Su máximo será la unidad y su mínimo será el cero.
    • Frecuencia acumulada: es la suma de la frecuencia de un intervalo de clases con todas las frecuencias de los intervalos que la preceden.
    • Frecuencia acumulada absoluta: es la evaluación o suma de todas las frecuencias absolutas hasta el intervalo de la clase considerado inclusive.
    • Frecuencia acumulada relativa: viene a ser la acumulación de todas las frecuencias relativas hasta el mismo intervalo considerado inclusive.

    Variable:

    Es la característica de interés sobre cada elemento de una población o muestra y puede tomar diferentes valores.

    Variables estadísticas:

    • Variable aleatoria: cuando los valores que asume la variable han sido antecedidos por una selección aleatoria de los objetos medidos o son resultados de algún proceso al azar.
    • Variable continua: es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo.
    • Variable discreta: es aquella que toma valores separados entre sí por alguna cantidad.
    • Variable cuantitativa: es aquella que asume valores acompañados de una unidad de medida.
    • Variable cualitativa: es la que se refiere a la clasificación, como estado civil, preferencia por una marca, etc.

    Datos:

    Son números o medidas que han sido recopilados como resultado de observaciones. Los datos pueden provenir de recuentos tales como el número de personas que laboran en una empresa o de mediciones como el peso de una persona.

    Tipos de datos estadísticos:

    • Datos simples: cuando a los datos no se les han aplicado algún tratamiento de agrupación, pudiendo ser dichas series:
    1. Sin frecuencias: cuando no se repiten los valores.
    2. Con frecuencias: cuando se repiten los valores.
    • Datos agrupados en clase: los datos se agrupan en clases con el fin de sintetizar, condensar, resumir o hacer más fácilmente manejable la información.

    Las clases constan de un límite inferior () y de un limite superior ().

    Tablas estadísticas:

    Son aquellas que están formadas por la columna matriz y el cuerpo esta compuesto por más de una columna y se dividen en simples y complejas.

    Gráficos estadísticos:

    Son datos cuantitativos que vienen representados por dibujos geométricos donde la longitud o el área de una parte de la figura es proporcional a la cantidad o magnitud representada.

    Escala:

    Es la asociación de cosas distintas pero de la misma especie. Es el tamaño o proporción con el que se desarrolla un plan de ideas.

    Tipos de escala:

    • Escala nominal: es aquella en que los números solo se emplean para diferenciar los objetos o distintas categorías o cuando se emplean nombres.
    • Escala ordinal: es aquella en la que los números se utilizan para diferenciar de acuerdo con ciertos criterios jerárquicos, como son los números que empleamos para clasificar los distintos extractos socioeconómicos o para designar preferencias.
    • Escala de intervalos: es una escala más especializada que la ordinal y la nominal en la cual es posible ordenar las mediciones y decir también cuanto difiere una situación de otra.

    DISTRIBUCIÓN DE FRECUENCIAS.

    Es el conjunto de valores que puede presentar una variable junto con sus frecuencias, estas se pueden clasificar de acuerdo a sus tipos.

    Según la naturaleza de la variable estudiada las distribuciones de frecuencia pueden ser:

    • No agrupadas: se presentan cuando el número de valores que puede presentar una variable no es muy elevado y en ese caso podemos observar todos los valores de esa variable. Este caso se presenta cuando la variable es discreta y no presenta excesivos valores.
    • Agrupados en intervalos: se presenta cuando la variable es continua o discreta pero con elevado número de valores. Es esta situación se agrupan dichos valores en intervalos o clases. Se llama amplitud del intervalo a la distancia que existe entre los extremos de los intervalos de clases.

    Fila de datos:

    Sirve para ordenar en forma creciente los datos de acuerdo a su frecuencia. Se agrupan a partir del número más pequeño de la muestra hasta el número mayor.

    n = número total de datos

    Rango:

    Resulta de la diferencia entre el límite superior y el límite inferior, existe en los datos no agrupados, se expresa con la siguiente ecuación:

    Número de clases:

    Se expresa por la siguiente ecuación:

    n° de clases =

    Intervalo de clases:

    Es el cociente que resulta de dividir el rango entre el número de clases.

    Punto medio ():

    Es el valor promedio de cada intervalo de clase.

    Límites reales:

    Es el resultado de restar 0,5 al límite inferior de clases y luego sumar esa misma cantidad al límite superior de clases.

    Histograma de frecuencia:

    Son segmentos de geometría rectangular graficado con el intervalo de clases o los límites reales de clase.

    En el caso que se utilice la frecuencia simple se graficaran histogramas simples y en el caso de que se utilicen frecuencias acumuladas se graficaran histogramas acumulados.

    Polígonos de frecuencia:

    Se obtienen de la unión de puntos obtenidos con los puntos medios de cada clase y su frecuencia simple o acumulada dependiendo del tipo que se quiere graficar.

    MEDIDAS DE TENDENCIA CENTRAL.

    Es un valor, que es típico o representativo de un conjunto de datos. Como tales valores tienden a situarse en el centro del conjunto de datos ordenados según su magnitud.

    Se pueden definir varios tipos de medidas de tendencia central, las más comunes son la media aritmética o brevemente media, la mediana y la moda.

    Media aritmética ():

    La media aritmética o media de un conjunto de N números se representa por y se define como:

    Para datos no agrupados

    Donde:

    xi = cada uno de los datos.

    n = número total de datos.

    Para datos agrupados

    Donde:

    xi = punto medio.

    fi = frecuencia simple relativa.

    n = número total de datos.

    Mediana ():

    La mediana de una colección de datos ordenados en orden de magnitud es el valor medio o la media aritmética de los dos valores medios.

    Para datos no agrupados

    Para datos agrupados

    Donde:

    LI = frontera inferior de clase.

    Linf fi = límite inferior de la franja modal

    fa = frecuencia acumulada anterior a la clase total.

    fi = frecuencia modal.

    n = número total de datos.

    Moda o modo ():

    La moda de una serie de números es aquel valor que se presenta con la mayor frecuencia, es decir, es el valor más común.

    Para datos no agrupados

    Es el valor que mas se repite dentro de la muestra de datos.

    Para datos agrupados

    Donde:

    LI = frontera inferior de clases.

    A1 = fi – fi ant

    fi ant = frecuencia modal anterior

    fi post = frecuencia modal posterior.

    Ic = intervalo de clases.

    A2 = fi – fi post

    MEDIDAS DE POSICIÓN.

    Son indicadores usados para señalar que porcentaje de datos dentro de una distribución de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se encuentra en el centro de la distribución de frecuencia, por lo que también se les llama " Medidas de Tendencia Central ".

    Pero estas medidas de posición de una distribución de frecuencias han de cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a la que resumen. Toda síntesis de una distribución se considerara como operativa si intervienen en su determinación todos y cada uno de los valores de la distribución, siendo única para cada distribución de frecuencias y siendo siempre calculable y de fácil obtención. A continuación se describen las medidas de posición más comunes utilizadas en estadística, como lo son:

    • Cuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales: primero, segundo y tecer cuartil.
    • Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil).
    • Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve percentil).

    Cuartiles (Q1, Q2, Q3)

    a) Primer cuartil (Q1):

    Aquel valor de una serie que supera al 25% de los datos y es superado por el 75% restante.

    Formula de Q1 para series de Datos Agrupados en Clase.

    Donde:

    : posición de Q1, la cual se localiza en la primera frecuencia acumulada que la contenga, siendo la clase de Q1, la correspondiente a tal frecuencia acumulada.

    Li, faa, fi, Ic : idéntico a los conceptos vistos para Mediana pero referidos a la medida de la posición correspondiente.

    b) Segundo cuartil (Q2):

    Coincide, es idéntico o similar al valor de la Mediana (Q2 = Md). Es decir, supera y es superado por el 50% de los valores de una Serie.

    c) Tercer cuartil (Q3):

    Aquel valor, termino o dato que supera al 75% y es superado por el 25% de los datos restantes de la Serie.

    Formula de Q3 para series de Datos Agrupados en Clase.

    Donde:

    : posición de Q3, todo idéntico al calculo de la Mediana.

    Deciles (D1, D2, … D9)

    Primer Decil (D1), Quinto Decil (D5) y Noveno Decil (D9).

    El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10 partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es superado por el 90% restante).

    El D9 (noveno decil) supera al 90% y es superado por el 10% restante.

    • Como se observa, son formulas parecidas a la del calculo de la Mediana, cambiando solamente la respectivas posiciones de las medidas.

    Percentiles (P1, P2, … P99)

    Primer Percentil (P1), Percentil 50 (P50) y Percentil 99 (P99).

    El primer percentil supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restantes.

    Formulas de P1, P50, P99 para series de Datos Agrupados en Clase.

    El P99 (noventa y nueve percentil) supera al 99% de los datos y es superado a su vez por el 1% restante.

    • Idénticas formulas al cálculo de la Mediana, cambiando obviamente las correspondientes posiciones de cada medida.

    Para determinar estas medidas se aplicara el principio de la mediana; así, el primer cuartil cereal valor por debajo del cual se encuentra el 25 por ciento de los datos; bajo el tecer cuartil se encuentra el 75 por ciento; el 80 decil será el valor por encima del cual estará el 20 por ciento de los datos, etc.

    Como se observa, todas estas medidas no son sino casos particulares del percentil ya que el primer cuartil no es sino el 25° percentil, el tercer cuartil el 75° percentil, el cuarto decil el 40° percentil, etc.

    Datos no agrupados:

    Se hace difícil calcular estas medidas, sin embargo, siguiendo los mismos principios mencionados para la Mediana, se pueden localizar en la forma siguiente:

    Si tenemos una serie de valores X1, X2, X3 … Xn, se localiza el primer cuartil como el valor cuando n es par, y cuando n es impar. Para el tercer cuartil será (n par); (n impar).

    En caso de los textiles será o donde A representa el número del textil.

    Para los deciles será o siendo A el número del decil; y para los percentiles o .

    Ejemplo:

    En una serie de 32 términos se desea localizar el 4° sextil, 8° decil y el 95° percentil.

    Esto significa que el 4° textil se encuentra localizado en el termino numero 21, es decir, el que ocupa la 21° posición; el 8° decil se encuentra localizado entre el termino numero 25° y 26° ; y el 95° percentil entre la posición 30° y 31° .

    Calculo para una distribución de frecuencia

    Para el cálculo de esta medida en datos agrupados en una distribución de frecuencia, se utiliza el mismo procedimiento estudiado para el cálculo de la Mediana, el cual es:

    1. Se efectúa la columna de las frecuencias acumuladas.
    2. Se determina la posición del término cuyo valor se pretende calcular, en caso de ser el primer cuartil será , si fuese el 95° centil … etc.
    3. Se verifica cual es la clase que lo contiene; para ello se utiliza la columna de las frecuencias acumuladas.
    4. Se hace la diferencia entre el número que representa el orden de posición cuyo valor se pretende calcular y la frecuencia acumulada de la clase anterior a la que lo contiene.
    5. Se calcula la medida solicitada de acuerdo a la siguiente fórmula:

    Donde:

    1i: limite inferior de la clase que lo contiene.

    P: valor que representa la posición de la medida.

    fi: la frecuencia de la clase que contiene la medida solicitada.

    fa-1: frecuencia acumulada anterior a la que contiene la medida solicitada.

    Ic: intervalo de clase.

    Ejemplo:

    Determinación del primer cuartil, el cuartil textil, el séptimo decil y el 30° percentil.

    Salarios

    (I. de Clases)

    N° de empleados

    (fi)

    fa

    200 – 299

    85

    85

    300 – 399

    90

    175

    400 – 499

    120

    295

    500 – 599

    70

    365

    600 – 699

    62

    427

    700 – 800

    36

    463

    Estos resultados nos indican que el 25 por ciento de los empleados ganan salarios por debajo de Bs. 334; que sobre Bs. 519,51 ganan el 33,33 por ciento de los empleados; que bajo 541,57 gana el 57 por ciento de los empleados y sobre Bs. 359,88 gana el 70 por ciento de los empleados.

    Muchas veces necesitamos conocer el porcentaje de valores que esta por debajo o por encima de un valor dado; lo que representa un problema contrario al anterior, esto es, dado un cierto valor en la abscisa determinar en la ordenada el tanto por ciento de valores inferiores y superiores al valor dado. Operación que se resuelve utilizando la siguiente formula general:

    Donde:

    P: lugar percentil que se busca.

    P: valor reconocido en la escala X.

    fa-1: frecuencia acumulada de la clase anterior a la clase en que esta incluida P.

    fi: frecuencia de la clase que contiene a p.

    Li: limite inferior de la clase que contiene a P.

    Ic: intervalo de clase.

    N: frecuencia total.

    Ejemplo:

    Utilizando la distribución anterior, determinar que porcentaje de personas ganan salarios inferiores a Bs. 450,00

    El 50,75 por ciento de las personas ganan salarios inferiores a Bs. 450.

    Método gráfico para fraccionar la distribución

    Se pueden obtener en forma gráfica, a través de la curva de la frecuencia acumulada (ojiva).

    Para ello basta después de trazar la ojiva, llevar el orden de posición de la medida que se quiere sobre la ordenada, trazar por ese punto una perpendicular toca a la ojiva, baja una paralela a la ordenada hasta tocar la abscisa; en el punto donde toque a dicho eje, se encontrará el valor buscado.

    Obtención gráfica de las medidas de posición

    Similar o idéntico a la distribución grafica de la Mediana con la sola excepción de que se llevaría al eje vertical (frecuencias acumuladas) las especificas posiciones de cada indicador de posición en particular.

    Ejemplo:

    Forma de obtener los indicadores de posición (cuartiles, deciles y percentiles) para series de datos agrupados en clases:

    Supongamos la siguiente distribución de frecuencias referidas a las estaturas que representaban 40 alumnos de un curso.

    (I. de Clases)

    Estaturas

    (mts)

    N° alumnos

    (fi)

    fa

    1,60

    1,639

    5

    5

    1,64

    1,679

    8

    13

    ** 1,68

    1,719

    15

    ** 28

    * 1,72

    1,759

    10

    38 *

    1,76

    1,80

    2

    40

    Q3=?

    La cual se ubica en la primera fa que la contenga

    Esta estatura de Q3 = 1,73 mts. Supera en la distribución de frecuencia al 75% de los alumnos del curso y es superada por el 25% de los mismos

    D8 = ?

    supera esta estatura de 1,736 mts a 8/10 partes de curso y es superado por las 2/10 partes restantes.

    P55 = ?

    Esta estatura supera al 55% de los alumnos del curso y es superada por el 45% restante.

    MEDIDAS DE DISPERSIÓN.

    Una medida del grado de variación de un conjunto de valores de una variable estadística la proporciona el propio rango o recorrido de la variable. Lo mas frecuente, sin embargo, es describir esa variación mediante las diferencias entre esos valores y alguna medida de tendencia central. Para las variables cuantitativas, las medidas de dispersión mas utilizadas son la desviación media y la desviación típica.

    Desviación media (DM):

    Se conoce también como promedio de desviación. Es igual a la media aritmética de las desviaciones de una serie de valores respecto de su media aritmética. Para una serie de N valores: X1, X2, X3,… Xn, se define a través de la siguiente expresión:

    Desviación típica (S):

    Se define como la raíz cuadrada positiva del promedio aritmético de los cuadrados de los desvíos con respecto a la medida aritmética y se considera como el indicador de variación o dispersión más importante.

    Varianza (S2):

    La varianza se define como el cuadrado de la desviación típica. Su mayor utilidad se presenta en la estadística inductiva. Se puede determinar como una medida de variación promedio y se obtiene dividiendo la variación total por el número de medidas.

    Coeficiente de variación (CV):

    Se define como el cociente que resulta de dividir la desviación típica entre la medida aritmética de la serie de datos, multiplicado luego por cien para que su resultado venga expresado en porcentaje.

    Coeficiente de Shepeard (CS):

    Se define como el cociente que resulta de dividir el intervalo de clases al cuadrado entre doce para luego restarlo con la varianza para ser utilizado en las distribuciones cuando ya se debe haber hecho un examen completo de la situación.

    Análisis Estadístico de las Edades de las Personas que Asisten a Cines Unidos Ubicado en el Centro Comercial Regina (CCR) – Puerto La Cruz

    Distribución de Frecuencias

    Muestra de datos

    31 33 40 32 22 23 32 21 20 16 22

    24 18 20 15 18 20 10 21 39 17 15

    13 16 54 18 11 37 45 19 37 15 40

    19 27 37 19 51 21 30 34 11 34 46

    14 23 36 42 43 26 41 26 42 14 30

    15 16 26 35 33 23 17 46 17 35 29

    Fila de datos

    10 = 1 16 = 3 22 = 2 28 = 0

    11 = 2 17 = 3 23 = 3 29 = 1

    12 = 0 18 = 3 24 = 1 30 = 2

    13 = 1 10 19 = 3 18 25 = 0 10 31 = 1 8

    14 = 2 20 = 3 26 = 3 32 = 2

    15 = 4 21 = 3 27 = 1 33 = 2

    34 = 2 40 = 2 46 = 2 52 = 0

    35 = 2 41 = 1 47 = 0 53 = 0 1

    36 = 1 42 = 2 48 = 0 54 = 1

    37 = 3 9 43 = 1 7 49 = 0 3

    38 = 0 44 = 0 50 = 0 n = 66

    39 = 1 45 = 1 51 = 1

    n° de clases =

    =

    n° de clases = 7,04

    Þ

    Tabla de Distribución de Frecuencias.

    I. de clase

    fi

    fa

    xi

    fir

    far

    fir%

    far%

    Limites reales

    10 – 15

    10

    10

    12,5

    0,15

    0,15

    9,5 – 15,5

    16 – 21

    18

    28

    18,5

    0,27

    0,42

    15,5 – 21,5

    22 – 27

    10

    38

    24,5

    0,15

    0,57

    21,5 – 27,5

    28 – 33

    8

    46

    30,5

    0,12

    0,69

    27,5 – 33,5

    34 – 39

    9

    55

    36,5

    0,13

    0,83

    33,5 – 39,5

    40 – 45

    7

    62

    42,5

    0,10

    0,93

    39,5 – 45,5

    46 – 51

    3

    65

    48,5

    0,04

    0,08

    45,5 – 51,5

    52 – 57

    1

    66

    54,5

    0,01

    1

    51,5 – 57,5

    Polígono e Histograma de Frecuencia Acumulada

    Polígono e Histograma de Frecuencia Simple

    Medidas de Tendencia Central

    Medidas de Tendencia Central.

    Para datos no agrupados

    Þ

    Para datos agrupados

    I. de clase

    fi

    fa

    xi

    xi × fi

    10 – 15

    10

    10

    12,5

    125

    16 – 21

    18

    28

    18,5

    333

    22 – 27

    10

    38

    24,5

    245

    28 – 33

    8

    46

    30,5

    244

    34 – 39

    9

    55

    36,5

    328,5

    40 – 45

    7

    62

    42,5

    297,5

    46 – 51

    3

    65

    48,5

    145,5

    52 – 57

    1

    66

    54,5

    54,5

    Þ

    Þ

    Þ Þ

    Þ

    Þ

    Medidas de Posición

    Datos agrupados

    I. de clases

    fi

    fa

    10 – 15

    10

    10

    16 – 21

    18

    28

    22 – 27

    10

    38

    28 – 33

    8

    46

    34 – 39

    9

    55

    40 – 45

    7

    62

    46 – 51

    3

    65

    52 – 57

    1

    66

    n = 66

    Cuartiles:

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Deciles:

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Percentiles:

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Þ

    Medidas de Dispersión

    I. de clases

    fi

    xi

    10 – 15

    10

    12,5

    125

    14,36

    143,6

    2062,096

    16 – 21

    18

    18,5

    333

    8,36

    150,48

    1258,012

    22 – 27

    10

    24,5

    245

    2,36

    23,6

    55,696

    28 – 33

    8

    30,5

    244

    3,64

    29,12

    105,996

    34 – 39

    9

    36,5

    328,5

    9,64

    86,76

    836,366

    40 – 45

    7

    42,5

    297,5

    15,64

    109,48

    1712,267

    46 – 51

    3

    48,5

    145,5

    21,64

    64,92

    1404,868

    52 – 57

    1

    54,5

    54,5

    27,64

    27,64

    763,969

    Þ Þ

    Þ Þ

    Þ Þ

    Þ Þ

    Þ Þ

    CONCLUSIÓN

    Una ordenación tabular de los datos en clases, reunidas las clases y con las frecuencias correspondientes a cada una, se conoce como una distribución de frecuencias o tabla de frecuencias. Los datos ordenados y resumidos, se suelen llamar datos agrupados. Aunque en el proceso de agrupamiento generalmente se pierde parte del detalle original de los datos, tiene la importante ventaja de presentarlos todos en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos.

    Para realizar una distribución de frecuencias se deben seguir los siguientes procedimientos:

    • Determinar la diferencia entre el mayor y el menor de los datos registrados y así encontrar el rango.
    • Dividir el rango entre el número de clases para así obtener el intervalo de clases.
    • Sumar el límite inferior de clases con el límite superior de clases y dividirlo entre dos para así obtener los puntos medios.
    • Restarle 0,5 al límite inferior de clases y luego sumarle esa misma cantidad al límite superior de clases nos permite obtener los límites reales.

    Los histogramas y polígonos de frecuencia son dos representaciones gráficas de las distribuciones de frecuencias. Un histograma de frecuencia consiste en una serie de rectángulos que tienen sus bases sobre un eje horizontal (el eje x) con longitud igual al tamaño de los intervalos de clase. Un polígono de frecuencia es un gráfico de línea trazado uniendo los puntos medios de los techos de los rectángulos en el histograma.

    Un promedio es un valor, que es típico a representativo de un conjunto de datos. Como tales valores tienden a situarse en el centro del conjunto de datos ordenados según su magnitud, los promedios se conocen también como medidas de tendencia central. Se pueden definir varios tipos de medidas de tendencia central las mas comunes son la media aritmética, la mediana y la moda.

    Las medidas de posición se usan para describir la posición que tiene un valor de datos específicos en relación con el resto de los datos. Las medidas de posición más conocidas son los cuartiles, los percentiles y los deciles. Un percentil es el valor sobre la escala de medida, debajo del cual cae un porcentaje dado de los datos en la distribución. Cuartiles son los valores de las variables que dividen en cuartos a los datos ordenados; cada conjunto de datos posee tres cuartiles. El primer cuartil Q1, es un número tal que cuando mucho el 25% de los datos es menor en valor que Q1 y cuando mucho el 75% de los datos es mayor que Q1. EL segundo cuartil es la media. El tercer cuartil Q3, es un número tal que cuando mucho el 75% de los datos es menor en valor que Q3 y cuando mucho el 25% de los datos es mayor que Q1. Deciles son valores de un conjunto de datos que dividen el total de observaciones en diez partes y no en cuatro, como los cuartiles, o en 100, como los percentiles. Así entre los deciles se encuentra el quinto decil (intervalo), que es otro nombre para la mediana. De todas las medidas de dispersión las más empleadas son los percentiles y los cuartiles.

    Una medida del grado de variación de un conjunto de valores de una variable estadística la proporciona el propio rango o recorrido de la variable. Lo más frecuente, sin embargo, es describir esa variación mediante las diferencias entre esos valores y alguna medida de tendencia central. Las medidas de dispersión más utilizadas son la desviación media, la desviación típica, la varianza, el coeficiente de variación y el coeficiente de Shepeard.

    BIBLIOGRAFÍA

    Armando, Soto Negrin. Principios de Estadística. Editorial Panapo. 1999. Pág.: 71-81.

    Ernesto, Rivas González. Estadística General. Ediciones de la Biblioteca. Caracas. 2000. Pág.: 164-169.

    www.monografias.com

    www.google.com

    www.elrincondelvago.com

    Rojas, Carlos.

    Belda, María

    PUERTO LA CRUZ