DISEÑO Y PROCEDIMIENTOS DE MUESTREO Muestra o censo Terminología y fundamentos del muestreo Etapas den la selección de la muestra Muestreo no probabilístico Muestreo de conveniencia Muestreo de juicios Muestreo por cuotas Muestreo de “bola de nieve” 5. Muestreo probabilístico Muestreo aleatorio simple Muestreo aleatorio sistemático Muestreo aleatorio estratificado Muestreo por conglomerados 6. Determinación del diseño muestral apropiado 7. Determinación del tamaño de la muestra 7.1. Muestreo aleatorio simple 7.2. Muestreo estratificado
2. TERMINOLOGÍA Muestreo: conjunto de operaciones encaminadas a determinar una muestra, su tamaño y demás características necesarios para identificar a los elementos que la forman. Población: conjunto formado por la totalidad de elementos con arreglo a unas características concretas. Población de estudio: conjunto de elementos sobre los que se toma la muestra. Muestra: subconjunto de elementos de la población elegidos para estudiar y así tratar de inferir características de la población. Censo: relación completa de los elementos de una población. Sesgo: error específico de la muestra por falta de representatividad. Error muestral: es el imputable al estudio de una parte de la población o muestra. Error no muestral: es el que se produce en toda la investigación como consecuencia de definiciones conceptuales incorrectas, de fallos en los instrumentos de medida, en la entrevista o en el desarrollo del trabajo de campo.
2. TERMINOLOGÍA Marco muestral: listado que identifica a los elementos de la población objetivo. Elemento: cada una de las unidades sobre las que interesa obtener información. Unidad muestral: unidad seleccionada de la población para la aplicación de la técnica de investigación; contiene los elementos de la población que pueden formar parte de la muestra. Parámetro: medida de una característica determinada de una población. Si esta medida está referida a una muestra entonces se denomina estadístico. La diferencia entre ambos valores es el error muestral. Estimador: es el valor muestral utilizado para inferir un valor poblacional. Un estimador insesgado es un estimador cuya esperanza matemática es el parámetro poblacional que estima. Se dice que un estimador es consistente si al sustituir el tamaño de la muestra por el del total de la población la estimación coincide con el parámetro poblacional. Distribución muestral: Es la representación de los valores de los estadísticos (la media, por ejemplo) con sus frecuencias.
2. TERMINOLOGÍA Teorema central del límite: si el tamaño de la muestra es lo suficientemente grande (a partir de 30) y si las muestras se extraen aleatoriamente, este teorema nos dice que la distribución de muestreo de la media aproximadamente tendrá una distribución normal con una media igual a la de la población y con una varianza igual a la varianza de la población dividida por el tamaño de la muestra. Dispersión: medida estadística del nivel de variación de la opinión del colectivo total sobre el tema analizado respecto al valor medio. Inferencia estadística: proceso de estimación de resultados válidos para una población a partir de los resultados obtenidos de una muestra de esa población. Intervalo de confianza: intervalo con una determinada probabilidad de incluir el valor poblacional. Se determina a partir de los resultados muestrales y el error de muestreo. Nivel de confianza: probabilidad de obtener un intervalo de confianza concreto. Método de muestreo: procedimiento utilizado para seleccionar de forma representativa las unidades muestrales.
3. ETAPAS EN LA SELECCIÓN DE LA MUESTRA Definición de la población objetivo: en términos de contenido, unidades, extensión y tiempo. Identificar el marco muestral: normalmente es imposible confeccionar una lista que no excluya a algunos miembros de la población. Determinar el método de muestreo: si la unidad de muestreo es diferente del elemento es necesario especificar también cómo se deben seleccionar los elementos dentro de la unidad de muestreo. Determinar el tamaño de la muestra: se deben considerar los siguientes factores cualitativos: Importancia de la decisión. Naturaleza de la investigación. Número de variables. Naturaleza del análisis. Tamaños de muestra utilizados en estudios similares. Restricciones de recursos.
3. ETAPAS EN LA SELECCIÓN DE LA MUESTRA Selección material de la muestra: elegir los componentes de la muestra y localizar materialmente la muestra, es decir, localización física de las unidades. Decidir el trato que se ha de dar a la falta de respuestas: se niega a responder, no se localiza, no sabe contestar o no es accesible. Para reducir este riesgo de no respuesta hay varios procedimientos: Mejorar el diseño de la investigación para reducir las negativas. Repetir los intentos. Estimar los efectos de la falta de respuesta en lo que respecta a la calidad de la información.
4. MUESTREO NO PROBABILÍSTICO: CARACTERÍSTICAS La selección de la muestra no es aleatoria, sino que se basa, en parte, en el juicio del entrevistador o de responsable de la investigación. No se basa en ninguna teoría de la probabilidad y, por lo tanto, no es posible calcular la precisión o acotar el error cometido. No es posible calcular estos errores ni la confianza de las estimaciones que, además, no siempre se reducen aumentando el tamaño de la muestra. En el muestreo no probabilístico los costes y la dificultad del diseño son más reducidos (al no ser necesario disponer de un marco). Este muestreo puede dar buenos resultados, pero también apareja el riesgo de proporcionar una información errónea.
4. MUESTREO NO PROBABILÍSTICO Muestreo de conveniencia Las muestras se seleccionan según un criterio de accesibilidad o comodidad. Suele emplearse en centros comerciales, plazas, estaciones de autobuses o de tren, metro, aeropuertos o lugares de gran afluencia pública. Se utiliza para obtener un mayor número de cuestionarios completados de forma rápida y económica. Adecuado en la investigación exploratoria que venga seguida de una investigación adicional en la que se extraiga una muestra probabilística. Muestreo de juicios La muestra es elegida por un experto de acuerdo con su criterio, buscando las unidades más representativas. Ejemplo: mercados de prueba, presuntos líderes seleccionados en la investigación de conducta de voto…. Se emplea cuando el tamaño de la muestra es pequeño.
4. MUESTREO NO PROBABILÍSTICO Muestreo por cuotas Tiene por objetivo asegurar que los diversos subgrupos de una población estén representados en la muestra respecto de las características pertinentes de la muestra y con la proporción exacta que el investigador desee. La selección accidental de sujetos puede producir sesgo. La velocidad de recopilación de datos, los menores costes y la comodidad son sus principales ventajas frente al muestreo de probabilidad. Puede resultar apropiado cuando el investigador sabe que es más probable que un cierto grupo demográfico rehúse colaborar con una encuesta. Muestreo de “bola de nieve” Los primeros elegidos como encuestados (probablemente a juicio del investigador) proponen y ayudan a la selección de los restantes de la muestra. Esta técnica se utiliza para localizar por referencias a miembros de poblaciones peculiares. Ventajas: los reducidos tamaños de muestra y los costes. Sesgo porque la persona sugerida por otro miembro de la muestra tiene una probabilidad mayor de ser similar a la primera.
5. MUESTREO PROBABILÍSTICO: CARACTERÍSTICAS Las muestras se seleccionan al azar, no se seleccionan por los investigadores. Cada elemento de la población tiene la misma probabilidad de ser elegido. Se puede conocer el error muestral, el nivel de confianza y el nivel de precisión de las estimaciones. Los resultados se pueden generalizar. Es el único método que puede evaluar la representatividad de la muestra. Es más caro que el muestreo no probabilística. Es, en general, más lento y complicado que el muestreo no probabilística.
5. MUESTREO ALEATORIO SIMPLE: INCONVENIENTES Su utilización está supeditada a la existencia de una “base de sondeo” donde se puedan enumerar todos los elementos constituyentes del universo objeto de estudio. La extracción al azar dispersa totalmente a los componentes de la muestra. Imaginemos los costoso que sería ir a Gerona a hacer una entrevista a una sola persona, a otra en Cádiz, a otra en Vigo, … No tiene en cuenta criterios de homogeneidad/heterogeneidad entre conjuntos de elementos del universo. Es un método lento, sobre todo cuando el número de elementos que constituyen el universo objeto de estudio y/o la muestra es elevado.
5. MUESTREO ALEATORIO SISTEMÁTICO En primer lugar se selecciona el “coeficiente de elevación” (tamaño población/tamaño muestra), a continuación se elige al azar un número inferior al coeficiente de elevación. La primera unidad muestral es el número elegido, la segunda unidad muestral se determina agregando a ese primer número el coeficiente de elevación y así sucesivamente hasta completar el tamaño de la muestra. Es preciso un listado de los elementos, que normalmente sigue algún criterio coincidente o no con el interés objeto de investigación: orden alfabético, domicilio, momento o tiempo en que se produce un hecho, indicadores de tamaño, otros indicadores. Este muestreo es sencillo, fácil de ejecutar y menos caros que otros muestreos aleatorios, sólo se efectúa una selección al azar al principio y a partir de ahí el proceso es automático. Este muestreo asegura un reparto de los componentes de la muestra contribuyendo a evitar que esté compuesta únicamente por valores extremos.
5. MUESTREO ALEATORIO ESTRATIFICADO Determina el número de elementos a seleccionar de cada segmento, necesarios para formar una muestra representativa. Es un proceso en dos fases en el que la población se divide en estratos. El estrato debe ser mutuamente excluyente y colectivamente exhaustivo. Después, los elementos se seleccionan para cada estrato mediante un procedimiento aleatorio, por lo general m.a.s. Difiere del muestreo por cuotas en que los elementos de la muestra se seleccionan en forma probabilística en vez de hacerlo por conveniencia o por juicio. Un objetivo principal de este muestreo es incrementar la precisión sin aumentar el coste El criterio para la selección de las variables de estratificación consiste en homogeneidad, heterogeneidad, relación y coste. Las variables comúnmente utilizadas incluyen características demográficas, tipo de cliente (con o sin tarjeta), tamaño de la empresa o tipo de industria.
5. MUESTREO ALEATORIO ESTRATIFICADO El número de estratos a utilizar es cuestión de juicio, pero la experiencia sugiere el uso de no más de seis. Procedimientos utilizados para la estratificación de la muestra: Afijación simple: se reparte la muestra total en partes iguales para cada estrato. Afijación proporcional: la muestra se reparte proporcionalmente a la población de cada estrato. Afijación óptima o no proporcional: se considera la mayor o menor heterogeneidad dentro de cada estrato, lo que se mide por la desviación típica. La corrección de la proporcionalidad con este criterio exige más información de cada estrato, en concreto la varianza o la desviación típica.
5. MUESTREO POR CONGLOMERADOS En ocasiones, con el fin de ahorrar tiempo y disminuir costes, se divide la población total en conglomerados o grupos de unidades maestrales excluyentes y colectivamente exhaustivos. Luego se selecciona una muestra aleatoria de grupos con base en una técnica de muestreo probabilística, como el MAS. Para cada grupo seleccionado, se incluyen todos los elementos en la muestra o se toma una muestra de elementos en forma probabilística. Si todos los elementos en cada grupo seleccionado están incluidos en la muestra, el procedimiento se llama muestreo por conglomerados de una etapa. Si una muestra de elementos se toma en forma probabilística de cada grupo seleccionado, el procedimiento es un muestreo por conglomerados en dos etapas. La unidad muestral primaria ya no es el elemento de la población sino un grupo mayor de elementos que están situados cerca el uno del otro (por ejemplo, ciudades).
5. DIFERENCIAS ENTRE MUESTREO POR CONGLOMERADOS Y ESTRATIFICADO En el de conglomerados sólo se elige una muestra de subpoblaciones, en el estratificado todas las subpoblaciones (estratos) se seleccionan para muestreo posterior. El objetivo del m. por conglomerados es incrementar la precisión al reducir costes. En relación a la homogeneidad y la heterogeneidad, el criterio para formar conglomerados es el opuesto al de formar estratos. Los elementos dentro de un conglomerado deben ser tan heterogéneos como sea posible, pero los conglomerados mismos deben ser tan homogéneos como sea posible. Cada conglomerado debe ser una representación en pequeña escala de la población. En el m. por conglomerados se necesita un marco de muestreo sólo para aquellos agrupamientos seleccionados para la muestra
5. MUESTREO POR CONGLOMERADOS Una forma común de este muestreo es el muestreo por área, en el que los agrupamientos consisten en áreas geográficas, como países, zonas de casas o calles. El muestreo por conglomerados se clasifica como técnica de muestreo probabilístico porque o bien la selección de conglomerados es aleatoria, o bien la selección de elementos dentro de cada conglomerado es aleatoria. El conglomerado ideal debería ser tan heterogéneo como la propia población. Este muestreo puede resultar problemático si las características y actitudes de los elementos del conglomerado son demasiado similares.
6. DETERMINACIÓN DEL DISEÑO MUESTRAL APROPIADO Grado de precisión: La selección de una muestra representativa es importante para todos los investigadores. No obstante, el grado de precisión necesario o la tolerancia del investigador de los errores de muestreo y ajenos al muestreo pueden ser distintos en cada proyecto, especialmente cuando la reducción de la precisión pueda compensarse con el ahorro de costes u otros beneficios. Recursos: Los costes asociados a las diversas técnicas de muestreo varían enormemente. Si los recursos financieros y humanos del investigador son restringidos, habrán de eliminarse ciertas opciones. Tiempo: El investigador que necesite cumplir con un plazo o completar un proyecto rápidamente seguramente elegirá un diseño simple que ocupe poco tiempo . Conocimiento previo de la población: disponibilidad de listas de sus miembros. Proyecto nacional o local. Necesidad de análisis estadístico.