Descargar

Estadísticas para administradores

Enviado por ginageorge


    1. Introducción 2. Definición y conceptos previos 3. Tipos de muestreo 3.1 Métodos de muestreo probabilísticos 3.1.1.- Muestreo aleatorio simple 3.1.2.- Muestreo aleatorio sistemático 3.1.3.- Muestreo aleatorio estratificado 3.1.4.- Muestreo aleatorio por conglomerados 3.1.5 Muestreo por Rutas Aleatorias 3.2.- Métodos de muestreo no probabilísticos 3.2.1.- Muestreo por cuotas 3.2.2.- Muestreo opinático o intencional 3.2.3.- Muestreo casual o incidental 3.2.4.- Bola de nieve 3.2.5 Muestreo Discrecional 4. Cálculo del tamaño de la muestra 4.1.- Tamaño de muestra para estimar la media de la población 5. Técnicas de muestreo sobre una población 6. Medidas de tendencia central y dispersión de v.a. 7. Bibliografía

    1. Introducción

    El propósito de un estudio estadístico suele ser, extraer conclusiones acerca de la naturaleza de una población. Al ser la población grande y no poder ser estudiada en su integridad en la mayoría de los casos, las conclusiones obtenidas deben basarse en el examen de solamente una parte de ésta, lo que nos lleva, en primer lugar a la justificación, necesidad y definición de las diferentes técnicas de muestreo.

    Los primeros términos obligados a los que debemos hacer referencia, definidos en el primer capítulo, serán los de estadístico y estimador.

    Dentro de este contexto, será necesario asumir un estadístico o estimador como una variable aleatoria con una determinada distribución, y que será la pieza clave en las dos amplias categorías de la inferencia estadística: la estimación y el contraste de hipótesis.

    El concepto de estimador, como herramienta fundamental, lo caracterizamos mediante una serie de propiedades que nos servirán para elegir el “mejor" para un determinado parámetro de una población, así como algunos métodos para la obtención de ellos, tanto en la estimación puntual como por intervalos.

    ¿Cómo deducir la ley de probabilidad sobre determinado carácter de una población cuando sólo conocemos una muestra?

    Este es un problema al que nos enfrentamos cuando por ejemplo tratamos de estudiar la relación entre el fumar y el cáncer de pulmón e intentamos extender las conclusiones obtenidas sobre una muestra al resto de individuos de la población.

    La tarea fundamental de la estadística inferencial, es hacer inferencias acerca de la población a partir de una muestra extraída de la misma.

    2. Definición y conceptos previos

    En la investigación científica es habitual que se empleen muestras como medio de acercarse al conocimiento de la realidad. Sin embargo, para que esto sea posible , para que a través de las muestras sea posible reproducir el universo con la precisión que se requiera en cada caso es necesario que el diseño muestral se atenga a los principios recogidos en las técnicas de muestreo.

    Antes de pasar describir algunos de los métodos de muestreo más habituales introduzcamos algunos conceptos importantes en este contexto:

    Población: Es todo conjunto de elementos, finito o infinito, definido por una o más características, de las que gozan todos los elementos que lo componen, y sólo ellos.

    En muestreo se entiende por población a la totalidad del universo que interesa considerar , y que es necesario que esté bien definido para que se sepa en todo momento que elementos lo componen.

    No obstante, cuando se realiza un trabajo puntual, conviene distinguir entre 0 : conjunto de elementos accesibles en nuestro estudio.

    Censo: En ocasiones resulta posible estudiar cada uno de los elementos que componen la población, realizándose lo que se denomina un censo, es decir, el estudio de todos los elementos que componen la población.

    La realización de un censo no siempre es posible, por diferentes motivos: a) economía: el estudio de todos los elementos que componen una población, sobre todo si esta es grande, suele ser un problema costoso en tiempo, dinero, etc; b) que las pruebas a las que hay que someter a los sujetos sean destructivas; c) que la población sea infinita o tan grande que exceda las posibilidades del investigador.

    Si la numeración de elementos, se realiza sobre la población accesible o estudiada, y no sobre la población teórica, entonces el proceso recibe el nombre de marco o espacio muestral.

    Muestra: En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que hacemos es trabajar con una muestra, entendiendo por tal una parte representativa de la población. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, ejemplificar las características de la misma. Cuando decimos que una muestra es representativa indicamos que reúne aproximadamente las características de la población que son importantes para la investigación.

    a. Población

    Los estadísticos usan la palabra población para referirse no sólo a personas si no a todos los elementos que han sido escogidos para su estudio.

    b. Muestra

    Los estadísticos emplean la palabra muestra para describir un porción escogida de la población. Matemáticamente, podemos describir muestras y poblaciones al emplear mediciones como la Media, Mediana, la moda, la desviación estándar. Cuando éstos términos describen una muestra se denominan estadísticas.

    Una estadística es una característica de una muestra, los estadísticos emplean letras latinas minúsculas para denotar estadísticas y muestras.

    3. Tipos de muestreo

    Los autores proponen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.

    • Muestreos Probabilísticos:
      • Aleatorio Simple
      • Aleatorio Sistemático
      • Estratificado
      • por Conglomerados
      • Polietápico
      • por Ruta Aleatoria
    • Muestreos No Probabilísticos:
      • de Conveniencia
      • de Juicios
      • por Cuotas
      • de Bola de Nieve
      • Discrecional

    3.1 Métodos de muestreo probabilísticos

    Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

    3.1.1.- Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.

    Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.

    3.1.2.- Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupan los lugares i, i+k, i+2k, i+3k,…,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k=N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k.

    El riesgo se este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.

    3.1.3.- Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (tamaño geográfico, sexos, edades,…).

    La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:

    Afijación Simple: A cada estrato le corresponde igual número de elementos muestrales.

    Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.

    Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación.

     3.1.4.- Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muestrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc, son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son área geográficas suele hablarse de "muestreo por áreas".

    El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.

    Para finalizar con esta exposición de los métodos de muestreo probabilísticos es necesario comentar que ante lo compleja que puede llegar a ser la situación real de muestreo con la que nos enfrentemos es muy común emplear lo que se denomina muestreo polietápico. Este tipo de muestreo se caracteriza por operar en sucesivas etapas, empleando en cada una de ellas el método de muestreo probabilístico más adecuado.

    3.1.5 Muestreo por Rutas Aleatorias

    • La selección de los miembros de la muestra se realiza como parte del trabajo de campo.
    • Establecida un área de muestreo, se define un punto de partida, sobre el que se aplica una ruta predefinida en la que se van seleccionan-do los miembros de la muestra con arreglo a un procedimiento heurístico.
    • Busca asegurar una cobertura geográfica de la muestra y/o suplir la falta de censo.
    • No es aconsejable en planos no lineales o poco homogéneos en manzanas y edificación.

    3.2.- Métodos de muestreo no probabilísticos

    A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa.

    3.2.1.- Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.

    En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

    3.2.2.- Muestreo opinático o intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.

    3.2.3.- Muestreo casual o incidental: Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso particular es el de los voluntarios.

    3.2.4.- Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

    3.2.5 Muestreo Discrecional

    • A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.
    • Ej.: muestreo por juicios; cajeros de un banco o un supermercado; etc.

    4. Cálculo del tamaño de la muestra

    A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de cálculo del tamaño muestral delimitemos estos factores.

    Parámetro. Son las medidas o datos que se obtienen sobre la población.

    Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.

    Error Muestral, de estimación o standard. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varían muestra a muestra). Varía según se calcule al principio o al final. Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.

    Nivel de Confianza. Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro.

    Varianza Poblacional. Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias para construir un modelo reducido del universo, o de la población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

    4.1.- Tamaño de muestra para estimar la media de la población

    Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que estamos dispuestos a admitir en nuestra estimación.

    5. Técnicas de muestreo sobre una población

    La teoría del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la distribución de un carácter en dicha población y las distribuciones de dicho carácter en todas sus muestras.

    Las ventajas de estudiar una población a partir de sus muestras son principalmente:

    Coste reducido:

    Si los datos que buscamos los podemos obtener a partir de una pequeña parte del total de la población, los gastos de recogida y tratamiento de los datos serán menores. Por ejemplo, cuando se realizan encuestas previas a un referéndum, es más barato preguntar a 4.000 personas su intención de voto, que a 30.000.000;

    Mayor rapidez:

    Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas elecciones, muchas horas antes de que el recuento final de votos haya finalizado;

    Más posibilidades:

    Para hacer cierto tipo de estudios, por ejemplo el de duración de cierto tipo de bombillas, no es posible en la práctica destruirlas todas para conocer su vida media, ya que no quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar conclusiones sobre las demás.

    De este modo se ve que al hacer estadística inferencial debemos enfrentarnos con dos problemas:

    • Elección de la muestra (muestreo), que es a lo que nos dedicaremos en este capítulo.
    • Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la población (inferencia).

    El tipo de muestreo más importante es el muestreo aleatorio, en el que todos los elementos de la población tienen la misma probabilidad de ser extraídos; Aunque dependiendo del problema y con el objetivo de reducir los costes o aumentar la precisión, otros tipos de muestreo pueden ser considerados como veremos más adelante: muestreo sistemático, estratificado y por conglomerados.

     6. Medidas de tendencia central y dispersión de v.a.

    De forma análoga podemos definir para variables aleatorias medidas de centralización, dispersión, simetría y forma. Por su interés nos vamos a centrar en dos medidas sobre v.a. que son la esperanza matemática que desempeña un papel equivalente al de la media y el momento central de segundo orden, también denominado varianza.

    Media, número calculado mediante determinadas operaciones utilizando todos los elementos de un conjunto y que sirve para representar a éste. La media puede recibir distintos nombres según las operaciones realizadas para calcularla: media aritmética, media geométrica, media armónica, entre otras.

    Mediana, en estadística, una de las cantidades utilizadas para representar un conjunto de números. Colocando todos los valores en orden creciente o decreciente, la mediana es aquél que ocupa la posición central.

    Moda (estadística), valor que aparece con más frecuencia en un conjunto dado de números. Por ejemplo, en el conjunto {3,4,5,6,6,7,10,13} la moda es 6. Si son dos los números que se repiten con la misma frecuencia, el conjunto tiene dos modas. Otros conjuntos no tienen moda.

    Desviación estándar, número que representa el alejamiento de una serie de números de su valor medio. Se calcula a partir de todas las desviaciones individuales con respecto de la media. Es un concepto importante en la mayoría de los cálculos estadísticos porque es una indicación precisa de la variabilidad entre un grupo de números.

    Un ejemplo sencillo es considerar las alturas de un grupo de cinco niños: 1,41, 1,45, 1,50, 1,59 y 1,60 m. La media de las alturas es 1,51 m. Las desviaciones son las diferencias con respecto a la media. No se puede utilizar una media simple de las desviaciones, porque automáticamente se obtendría un valor de cero (los valores positivos y negativos se cancelan entre sí), y ésta es la razón por la que se recurre a un método más complejo. En la práctica, se promedian los cuadrados de las desviaciones (los cuadrados son siempre positivos), y luego se toma la raíz cuadrada. La media de las desviaciones al cuadrado es 0,00564, y su raíz cuadrada es 0,075. Ésta es la desviación típica, que se representa normalmente por el símbolo s (sigma). Muchos ordenadores y calculadoras de bolsillo poseen procedimientos para calcularla directamente, una vez que se han introducido las series de números.

    Otro grupo de niños podría tener alturas de 1,46, 1,48, 1,51, 1,53 y 1,57 m. La altura promedio es de nuevo 1,51 m, pero esta vez la desviación típica es 0,038. El segundo grupo está más agrupado en torno a la media, y el valor menor de la desviación típica lo muestra con claridad.

    Si cada desviación individual se simboliza por xi, y si existen n valores en la serie, la desviación típica viene dada por la fórmula:

    Análisis de los datos calculados

    La muestra la seleccione a las 5:40 p.m. y luego me ubiqué en la columna #5 línea 40 de la tabla de números aleatorios estableciendo el siguiente criterio, se va a leer 15 números aleatorios menores o iguales a 52 leyendo del lado derecho de la columna en forma horizontal hasta el final de la página y se continuó con la siguiente línea de la misma manera:

    Los resultados de la muestra son:

    01 04 07 14 17

    18 20 33 34 35

    39 45 46 47 49

    Explicación sobre los datos calculados:

    Teóricamente el Coeficiente de Variación(%) debe ser menor del 15% para considerar que la media es representativa si no lo es, se debe buscar otra medida de tendencia central como lo es la mediana y la moda. Recomiendo que la media no es representativa ya que sus valores originales (valores de los bancos) tienen mucha dispersión.

    El 50% de los bancos ganó aproximadamente 28 millones o menos y el otro 50% de los bancos ganó aproximadamente 28 millones o más ingresos por intereses en el período del año 1999.

    7. Bibliografía

    Abad de Servin, a. y Servin Andrade, L.A. (1978). Introducción al muestreo. Mexico: Limusa.

    Azorin, F. (1972). Curso de muestreo y aplicaciones. Madrid: Aguilar.

    Azorin, F. y Sanchez Crespo, J.L. (1986). Métodos y aplicaciones de muestreo .Madrid: Alianza.

    Martinez Arias, M.R.; Macia, A. y Perez Ruy-Diaz, J. (1989). Psicología Matemática II. Madrid: UNED.

    Pardo, A. y San Martin, R. (1994). Análisis de datos en psicología II. Madrid: Pirámide.

    Rodriguez Osuna, J. (1991). Métodos de muestreo. Madrid: CIS.

    Rodriguez Osuna, J. (1993). Métodos de muestreo. Casos prácticos. Madrid: CIS.

    Manual de La Universidad de Málaga-España

    Texto: Estadística para Administradores, Autor: Richard Levin y David Rubin.

    Enciclopedia Microsoft Encarta 99

    Páginas visitadas en Internet:

    www.bancoaliado.comwww.altavista.comwww.panamafinance.comwww.superintendenciadebancos.com www.bgeneral.comwww.towerbank.comwww.banistmo.com www.bladex.comwww.bancolat.com www.banconal.com

     

     

    Autor:

    Gina George de Moreno ginageorge[arroba]unete.com