Trabajo integrador probabilidad y estadística
Resumen:
El siguiente informe trata, acerca la distribución de probabilidad discreta, ya en casos aplicados, donde se analizaran los resultados del estudio planteado en el muestreo del integrador anterior.
Abstract:
The following report is, on the descriptive statistics, and in real cases, where the results of the present case were analyzed.
Objetivos
1. Aplicar los conocimientos aprendidos acerca de la distribución en diferentes casos, mediante los datos obtenidos en las encuestas del trabajo integrador con respecto al primer interciclo, para verificar su utilidad en la estadística y la oportunidad de inferir resultados.
2. Emitir conclusiones y comparar resultados, de los valores hallados con los posiblemente discernidos, poniendo en práctica las distribuciones.
Introducción
Continuando con el estudio de la probabilidad y estadística, ahora estudiaremos las distribuciones de probabilidad, las cuales son aplicadas en muchas ramas de la ingeniería en general.
Para este trabajo vamos a realzar un ajuste de datos a una de las distribuciones de probabilidad estudiadas, basándonos en los datos obtenidos en el primer trabajo de estadística descriptiva, en cual vamos a obtener más información acerca del uso de los SMS. Como pueden ser los porcentajes o probabilidades acerca del uso de SMS en la universidad, las personas que utilizan este servicio, las que poseen un plan de datos activo, etc.
Tenemos que realizar un análisis del los tipos de datos obtenidos en este trabajo y escoger, ya sea una o varias distribuciones de probabilidad para realizar la aplicación, y obtener las información requerida.
Marco teorico
Distribuciones de variable discreta
Figura 1. Distribución normal
[Se denomina distribución de variable discreta a aquella cuya función de probabilidad sólo toma valores positivos en un conjunto de valores de finito o infinito numerable. A dicha función se le llama función de masa de probabilidad. En este caso la distribución de probabilidad es la suma de la función de masa, por lo que tenemos entonces que:] [1]
1)
Y, tal como corresponde a la definición de distribución de probabilidad, esta expresión representa la suma de todas las probabilidades desde hasta el valor
Distribuciones de variable discreta más importantes
Las distribuciones de variable discreta más importantes son las siguientes:
Distribución binomial
Distribución binomial negativa
Distribución Poisson
Distribución geométrica
Distribución hipergeométrica
Distribución de Bernoulli
Distribución Rademacher, que toma el valor 1 con probabilidad ½ y el valor -1 con probabilidad ½.
Distribución uniforme discreta, donde todos los elementos de un conjunto finito son equiprobables.
En esta parte daremos una breve descripción de un grupo de las distribuciones que fueron las utilizadas en este trabajo.
Distribución Binomial
[En estadística, la distribución binomial es una distribución de probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles dos resultados. A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.][1]
Para representar que una variable aleatoria X sigue una distribución binomial de parámetros n y p, se escribe:
1)
Caracteristicas Analiticas:
Su función de probabilidad es
1)
donde
siendo (1)
las combinaciones de en ( elementos tomados de en
Distribución Binomial Negativa
[En estadística la distribución binomial negativa es una distribución de probabilidad discreta que incluye a ladistribución de Pascal.
El número de experimentos de Bernoulli de parámetro independientes realizados hasta la consecución del k-ésimo éxitoes una variable aleatoria que tiene una distribución binomial negativa con parámetros k y
La distribución geométrica es el caso concreto de la binomial negativa cuando k = 1.]1]
Propiedades:
Su función de probabilidad es
Para enteros x mayores o iguales que k, donde
1)
Su media es
1)
si se piensa en el número de fracasos únicamente y
1)
si se cuentan también los k-1 éxitos.
Su varianza es
1)
En ambos casos.
Distribución Geométrica
[En teoría de probabilidad y estadística, la distribución geométrica es cualquiera de las dos distribuciones de probabilidad discretas siguientes:
la distribución de probabilidad del número X del ensayo de Bernoulli necesaria para obtener un éxito, contenido en el conjunto { 1, 2, 3,…} o
la distribución de probabilidad del número Y = X - 1 de fallos antes del primer éxito, contenido en el conjunto { 0, 1, 2, 3,… }.
Cuál de éstas es la que uno llama "la" distribución geométrica, es una cuestión de convención y conveniencia.] [1]
Propiedades:
[Si la probabilidad de éxito en cada ensayo es p, entonces la probabilidad de que x ensayos sean necesarios para obtener un éxito es
1)
Para x = 1, 2, 3,…. Equivalentemente, la probabilidad de que haya x fallos antes del primer éxito es
1)
Para x = 0, 1, 2, 3,….
En ambos casos, la secuencia de probabilidades es una progresión geométrica.
El valor esperado de una variable aleatoria X distribuida geométricamente es
1)
y dado que Y = X-1,
1)
En ambos casos, la varianza es
1)
Las funciones generatrices de probabilidad de X y la de Y son, respectivamente,
Como su análoga continua, la distribución exponencial, la distribución geométrica carece de memoria. Esto significa que si intentamos repetir el experimento hasta el primer éxito, entonces, dado que el primer éxito todavía no ha ocurrido, la distribución de probabilidad condicional del número de ensayos adicionales no depende de cuantos fallos se hayan observado. El dado o la moneda que uno lanza no tiene "memoria" de estos fallos. La distribución geométrica es de hecho la única distribución discreta sin memoria.] [1]
[De todas estas distribuciones de probabilidad contenidas en {1, 2, 3,… } con un valor esperado dado µ, la distribución geométrica X con parámetro p = 1/µ es la de mayor entropía.] [1]
[La distribución geométrica del número y de fallos antes del primer éxito es infinitamente divisible, esto es, para cualquier entero positivo n, existen variables aleatorias independientes Y 1,…, Yn distribuidas idénticamente la suma de las cuales tiene la misma distribución que tiene Y. Estas no serán geométricamente distribuidas a menos que n = 1.] [1]
Distribución Hipergeométrica
[En teoría de la probabilidad la distribución hipergeométrica es una distribución discreta relacionada con muestreos aleatorios y sin reemplazo. Supóngase que se tiene una población de N elementos de los cuales, pertenecen a la categoría A y N-d a la B. La distribución hipergeométrica mide la probabilidad de obtener x () elementos de la categoría A en una muestra sin reemplazo de n elementos de la población original.] [1]
Propiedades:
[La función de probabilidad de una variable aleatoria con distribución hipergeométrica puede deducirse a través de razonamientos combinatorios y es igual a
1)
donde es el tamaño de población,
es el tamaño de la muestra extraída, es el número de elementos en la población original que pertenecen a la categoría deseada y es el número de elementos en la muestra que pertenecen a dicha categoría. La notación hace referencia al coeficient binomial, es decir, el número de combinaciones posibles al seleccionar elementos de un total [1]
[El valor esperado de una variable aleatoria X que sigue la distribución hipergeométrica es
1)
y su varianza,
1)
En la fórmula anterior, definiendo
1)
y
1)
se obtiene
1)
La distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es pequeño.] [1]
Por nombrar las más resaltadas y convenientes para este trabajo.
Materiales y herramientas
Desarrollo
Hemos decidido para cada pregunta de nuestra encuentra encuesta aplicar una distribución, ya que denominaremos aciertos y fracasos según queramos los resultados a obtener.
1. Con la creación de nuevas tecnologías y la factibilidad hoy en día del internet, ¿usted cree que el servicio de SMS tradicional debería desaparecer de nuestro medio?
- SI NO
Como vemos en esta pregunta las opciones son dos, fácilmente, "SI" y "NO" pero está dirigida a 100 estudiantes dentro de nuestro campus universitario, lo que nos dejaría claro la distribución aplicada, donde la más opcionada sería la distribución binomial. Posteriormente
Pasaremos analizar a partir de las 50 primeras encuestas, cuál sería la probabilidad que digan "SI" 30 estudiantes del campus universitario a la desaparición del servicio SMS.
(Número de intentos a partir de la primera mitad)
Número de éxitos que deseo obtener)
(Probabilidad de acierto que sería 0.5 al haber un acierto y un fracaso)
(Probabilidad de desacierto)
Tenemos como respuesta de probabilidad de obtener 30 "SI" en 50 encuestados.
Como vemos la probabilidad es muy pequeña debido a las pocas opciones y el número grande de intentos, pero sería de mucha utilidad, para determinar tendencias a ocurrir.
2. ¿Usted es un consumidor del servicio de SMS tradicional (de solo texto)?, si lo es, por favor indicar con qué frecuencia mediante un porcentaje lo hace dentro de un período mensual.
Valor real en porcentaje: ___________
Parámetros de Consumo
1. 80% – 100% Adictivo
2. 60% – 79% Frecuente
3. 40% – 59% Regular
4. 20% – 39% Ocasional
5. menos del 20% Casi Nunca
Media | 16.8 | |
Mediana | 9 | |
Varianza | 49.7 | |
Desviación estándar | 7.0498227 |
Tabla 1. Medidas de distribución
Tenemos los datos obtenidos desde las encuestas, y las medidas de distribución: media, mediana, varianza y distribución estándar, ahora, vamos a suponer que necesitamos hallar la probabilidad que un estuante dentro de los 100 encuestados se encuentre dentro de los parámetro de consumo Regular que es de 40% a 59%.
Donde:
Valores hallados de la curva normal.
Hemos hallado la probabilidad de que un encuestado este dentro de los parámetros de consumidor Regular, por medio del método de aplicación normal a la binomial. Como podemos observar la probabilidad es considerable, lo que nos da la pauta de decir que esta es una de las opciones que más seleccionaran los encuestados a simple vista.
1. IPhone
2. Android
3. BlackBerry
4. Otros
Tenemos en este caso 3 tipos de celulares Smartphones de 4 opciones que existen, y plantearemos que de todos los encuestados, queremos la probabilidad de que elijan solo lo Smartphones, si se quiere evaluar a 5 encuestados al azar.
Para esta pregunta hemos decidido utilizar la distribución híper geométrica como vemos, y como respuesta tenemos que la probabilidad es bajísima al solo querer que de 5 encuestados 3 al menos tengan celulares Smartphones.
4. ¿Usted posee un plan de datos actualmente?
- SI NO
Como vemos en la pregunta, las respuestas pueden ser dos lo que nos da 3 clases de distribución a utilizar que son: Binomial, binomial negativa y distribución geométrica. Para este caso empezaremos por generarnos un análisis, y elegiremos la distribución geométrica.
Las encuestas la realizamos de 5 y queremos saber la probabilidad de que a al 7mo grupo de encuestados se obtengan 3 de respuesta "NO" por primera vez.
Podemos ver que la probabilidad es demasiado baja, que al 7 grupo de encuestados existan 3 respuestas negativas por primera vez, lo que resultaría lógico ya que la probabilidad no es fija para cada grupo, lo que nos deja claro que pueden existir más formas de predecir resultados si se quiere hallar para tal número de intentos nuestro éxito por primera vez.
5. Si usted no dispone de un plan de datos, entonces ¿dejaría de utilizar un sistema tradicional de mensajería instantánea como el SMS, por un sistema de plan de datos instalado en su teléfono celular, ya sea Blackberry, Android o actualmente Iphone; y estar dispuesto a pagar el valor mensual del plan?
SI NO
Para esta última pregunta utilizaremos distribución binomial negativa, por solo haber dos resultados posibles:
Calcularemos:
Para una compañía de celulares es de interés saber, las respuestas "SI" al menos 10 de 37 que es el total de encuestados que llegaron a esta pregunta, para enviar un personal a ofrecer el servicio de plan de datos a estudiantes dentro del campus de la UPS. Sabemos que la probabilidad es 0.5 de que ambos opciones, "SI" y "NO", sean seleccionadas.
¿Cuál es la probabilidad que la respuesta "SI" se repita 20 veces?
Hemos hallado esta probabilidad, que deja en duda la participación de la compañía que desee ofrecer este servicio ya que el interés de parte de los estudiantes es bajísimo.
Conclusiones
Los estudiantes universitarios usan todo tipo de celulares que les brindan diferentes servicios y utilidades pero al querer nuestra probabilidad que cada uno tenga un Smartphone y dentro de esas utilidades, esta probabilidad generada nos dio bastante pequeña, que denotaría muchas razones, en las que se encuentran como destacadas: la economía y accesibilidad, porque los estudiantes dentro de un grupo pequeño de muestra se deciden por uno en la categoría de Otros.
Como mencionamos en el análisis de cada preguntas, para los estudiantes resulta muy complicado adquirir un celular de gama alta, como uno "Android", "IPhone" y "BlackBerry" por lo que se deciden por uno diferente dentro nuestra categoría de "Otros", de cualquier marca o diferente sistema operativo. Luego aún más remoto es que posean un plan de datos que pagar e incluso luego querer adquirir uno. Todo esto debido a la facilidad de comunicarse gracias a la tecnología que nos rodea, y la accesibilidad de las telefonías al brindar el servicio de plan de datos diarios, lo que deja el servicio de SMS muy por debajo de toda la tecnología, no por ser un mal servicio, lento o poco práctico, sino porque los diferente servicios que brinda la tecnología, ya que son más completos a la hora de comunicarse, pero no obstante la probabilidad en la primera pregunta es bajisima con respecto a "SI" que se refiere a eliminar el servicio de SMS, porque aunque no lo utilicen de manera frecuente, ellos lo ven como un servicio aún importante a utilizar, con respecto a la comunicación.
Los estudiantes que frecuentan el campus universitario con partidarios de utilizar el internet, ademas son muy afines al avance de la tecnología.
Bibliografía
[1] wikipedia, «es.wikipedia.org,» Wikimedia Commons , 24 07 14. [En línea]. Available: http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad. [Último acceso: 03 08 14].
Universidad Politécnica Salesiana.
Autor:
Mirabá Bruno,
Molina Héctor,
Bustamante Cristina
bmiraba[arroba]est.ups.edu.ec,
hmolinav[arroba]est.ups.edu.ec,
Kbustamantec[arroba]est.ups.edu.ec.