Indice1. Introducción 2. Distribución Normal 3. Función De Densidad 4. La Distribución Binomial
Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio nombre indica su extendida utilización, justificada por las frecuencia o normalidad con la que las ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución. Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana. En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de p y de valores de n cada vez mayores, se ve que sus polígonos de frecuencias se aproximan a una forma en forma de campana. En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal. – Caracteres morfológicos de individuos (personas, animales, plantas,…) de una especie. Por ejemplo: tallas, pesos, envergaduras, diámetros, perímetros,… – Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono. – Caracteres sociológicos, por ejemplo: consciente intelectual, grado de adaptación a un medio. – Errores cometidos al medir ciertas magnitudes. – Valores estadísticos maestrales, por ejemplo: la media. – Otras distribuciones como la binomial o la Poisson son aproximaciones normales. Y en general cualquier característica que se obtenga como suma de mucho factores.
Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución. Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana. En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de p y valores de n cada vez mayores, se ve que sus polígonos de frecuencias se aproximan a una curva en "forma de campana". En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal.
- Caracteres morfológicos de individuos (personas, animales, plantas,…) de una especie, p. ejm. Tallas, pesos, envergaduras, diámetros, perímetros…
- Caracteres fisiológicos, por ejemplo; efecto de una misma dosis de un fármaco, o de una misma cantidad de abono.
- Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen.
- Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio……
- Errores cometidos al medir ciertas magnitudes.
- Valores estadísticos maestrales, por ejemplo: la media.
- Otras distribuciones como la binomial o la de Poisson son aproximaciones normales…
Y en general cualquier característica que se obtenga como suma de muchos factores.
Empleando cálculos bastante laboriosos, puede demostrarse que el modelo de la función de densidad que corresponde a tales distribuciones viene dando por la fórmula
Función De Una Distribución
- Puede tomar cualquier valor (- ∞ ,+ ∞ )
- Son más probables los valores cercanos a uno central que llamados media
- Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de igual forma a derecha e izquierda (es simétrica).
- Conforma nos separamos de ese valor µ , la probabilidad va decreciendo de forma más o menos rápida dependiendo de un parámetro s , que es la desviación típica.
Funciones de probabilidad: Llamamos función d probabilidad f a la aplicación de E(X) (Espacio Muestral) en el intervalo [0,1] QUE VERIFICA: f(A)= p (A) Básicamente se trata de estudiar la probabilidad como una función utilizando para su estudio todas las propiedades de las funciones.
La Distribucion Binomial: Llamamos experiencia aleatoria dicotómica a aquella que solo puede tener dos posibles resultados A y A'. Usualmente A recibe el nombre de éxito, además representaremos como p= p(A) y q=1-p=p(A’). A la función de probabilidad de una variable aleatoria X resultado de contar el número de éxitos al repetir n veces una experiencia aleatoria dicotómica con probabilidad de éxito p la llamamos distribución binomial y la representamos por B (n, p) Para esta distribución se verifica que, la variable X puede tomar los valores: 0,1,2,…, n y que la variable toma cada uno de estos valores con probabilidad: p( X = r ) = (nr) pr (1 – p) n-r
Parámetros de una distribución binomial: Esperanza: n · p Desviación típica (n · p · q )0.5 ( raíz cuadrada) Ajuste de una serie de datos a una distribución binomial: Disponemos de una serie de k datos que toman los valores 0,1, … ,n. Para saber si estos datos siguen pueden aproximarse por una distribución binomial: Calculamos la media de los k datos y la igualamos a la Esperanza teórica de la Binomial (n · p). Despejamos de aquí el valor de p. Calculamos los valores teóricos de p(X = r), multiplicándolos por k para obtener los valores teóricos de cada posible valor de la variable aleatoria en series de k datos. Si la diferencia es " suficientemente pequeña " aceptamos como buena la aproximación Binomial, si no, la rechazamos. (nota: la fundamentación estadística que nos permitiría decidir de manera objetiva si la diferencia entre los datos teóricos y los reales es "suficientemente pequeña" escapa de los objetivos de esta unidad didáctica, con lo cual la decisión se deberá tomar de manera subjetiva)
Muestreo En estadística, es el proceso por el cual se seleccionan los individuos que formarán una muestra. Para que se puedan obtener conclusiones fiables para la población a partir de la muestra, es importante tanto su tamaño como el modo en que han sido seleccionados los individuos que la componen. El tamaño de la muestra depende de la precisión que se quiera conseguir en la estimación que se realice a partir de ella. Para su determinación se requieren técnicas estadísticas superiores, pero resulta sorprendente cómo, con muestras notablemente pequeñas, se pueden conseguir resultados suficientemente precisos. Por ejemplo, con muestras de unos pocos miles de personas se pueden estimar con muchísima precisión los resultados de unas votaciones en las que participarán decenas de millones de votantes. Para seleccionar los individuos de la muestra es fundamental proceder aleatoriamente, es decir, decidir al azar qué individuos de entre toda la población forma parte de la muestra. Si se procede como si de un sorteo se tratara, eligiendo directamente de la población sin ningún otro condicionante, el muestreo se llama aleatorio simple o irrestrictamente aleatorio. Cuando la población se puede subdividir en clases (estratos) con características especiales, se puede mostrar de modo que el número de individuos de cada estrato en la muestra mantenga la proporción que existía en la población. Una vez fijado el número que corresponde a cada estrato, los individuos se designan aleatoriamente. Este tipo de muestreo se denomina aleatorio estratificado con asignación proporcional. Las inferencias realizadas mediante muestras seleccionadas aleatoriamente están sujetas a errores, llamados errores de muestreo, que están controlados. Si la muestra está mal elegida – no es significativa – se producen errores sistemáticos no controlados.
Métodos De Muestreo Existen dos métodos de muestreo: El muestreo probabilístico y no probabilístico Métodos de muestreo probabilístico Los métodos de muestreo probabilísticas son aquéllos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticas nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticas encontramos los siguientes tipos:
Muestreo aleatorio simple El procedimiento es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.
Muestreo aleatorio sistemático Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios solo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestras son los que ocupan los lugares i,i+k,i+2k,i+3k,…,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k=N/n. el número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo de este tipo de muestreo está en los casos en que se dan periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los últimos 5 son mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.
Muestreo aleatorio estratificado. Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (tamaño geográfico, sexos, edades…). La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:
Afijación simple A cada estrato le corresponde igual número de elementos maestrales.
Afijación proporcional La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.
Afijación Optima Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no suele conocer la desviación.
Muestreo aleatorio por conglomerados Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades maestrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos. Para finalizar con esta exposición de los métodos de muestreo probabilístico es necesario comentar que ante lo compleja que puede llegar a ser la situación real de muestreo con la que nos enfrentemos es muy común emplear lo que se denomina muestreo polietápico. Este tipo de muestreo se caracteriza por operar en sucesivas etapas, empleando en cada una de ellas el método de muestreo probabilístico más adecuado.
Métodos de muestreo no probabilísticos A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aún siendo conscientes de que no sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa.
Muestreo por cuotas. También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez terminada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.
Muestreo opinático o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias en voto.
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e intencionalmente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso particular es el de los voluntarios.
Bola de nieve Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
Error Muestral De estimación o estándar. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de al variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta donde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varían muestra a muestra). Varía según se calcule al principio o al final. Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.
Autor: