Descargar

Aplicación de distribución de probabilidad discreta


  1. Introducción
  2. Marco teorico
  3. Materiales y herramientas
  4. Conclusiones
  5. Bibliografía

Trabajo integrador probabilidad y estadística

Resumen:

El siguiente informe trata, acerca la distribución de probabilidad discreta, ya en casos aplicados, donde se analizaran los resultados del estudio planteado en el muestreo del integrador anterior.

Abstract:

The following report is, on the descriptive statistics, and in real cases, where the results of the present case were analyzed.

Objetivos

  • 1. Aplicar los conocimientos aprendidos acerca de la distribución en diferentes casos, mediante los datos obtenidos en las encuestas del trabajo integrador con respecto al primer interciclo, para verificar su utilidad en la estadística y la oportunidad de inferir resultados.

  • 2. Emitir conclusiones y comparar resultados, de los valores hallados con los posiblemente discernidos, poniendo en práctica las distribuciones.

Introducción

Continuando con el estudio de la probabilidad y estadística, ahora estudiaremos las distribuciones de probabilidad, las cuales son aplicadas en muchas ramas de la ingeniería en general.

Para este trabajo vamos a realzar un ajuste de datos a una de las distribuciones de probabilidad estudiadas, basándonos en los datos obtenidos en el primer trabajo de estadística descriptiva, en cual vamos a obtener más información acerca del uso de los SMS. Como pueden ser los porcentajes o probabilidades acerca del uso de SMS en la universidad, las personas que utilizan este servicio, las que poseen un plan de datos activo, etc.

Tenemos que realizar un análisis del los tipos de datos obtenidos en este trabajo y escoger, ya sea una o varias distribuciones de probabilidad para realizar la aplicación, y obtener las información requerida.

Marco teorico

Distribuciones de variable discreta

edu.red

Figura 1. Distribución normal

[Se denomina distribución de variable discreta a aquella cuya función de probabilidad sólo toma valores positivos en un conjunto de valores de edu.redfinito infinito numerable. A dicha función se le llama función de masa de probabilidad. En este caso la distribución de probabilidad es la suma de la función de masa, por lo que tenemos entonces que:] [1]

edu.red1)

Y, tal como corresponde a la definición de distribución de probabilidad, esta expresión representa la suma de todas las probabilidades desde edu.redhasta el valor edu.red

Distribuciones de variable discreta más importantes

Las distribuciones de variable discreta más importantes son las siguientes:

  • Distribución binomial

  • Distribución binomial negativa

  • Distribución Poisson

  • Distribución geométrica

  • Distribución hipergeométrica

  • Distribución de Bernoulli

  • Distribución Rademacher, que toma el valor 1 con probabilidad ½ y el valor -1 con probabilidad ½.

  • Distribución uniforme discreta, donde todos los elementos de un conjunto finito son equiprobables.

En esta parte daremos una breve descripción de un grupo de las distribuciones que fueron las utilizadas en este trabajo.

Distribución Binomial

[En estadística, la distribución binomial es una distribución de probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles dos resultados. A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.][1]

Para representar que una variable aleatoria X sigue una distribución binomial de parámetros n y p, se escribe:

edu.red1)

Caracteristicas Analiticas:

Su función de probabilidad es

edu.red1)

donde edu.red

siendo edu.red(1)

las combinaciones de edu.reden edu.red(edu.red elementos tomados de edu.reden edu.red

Distribución Binomial Negativa

[En estadística la distribución binomial negativa es una distribución edu.red de probabilidad discreta que incluye a ladistribución de Pascal.

El número de experimentos de Bernoulli de parámetro independientes realizados hasta la consecución del k-ésimo éxitoes una variable aleatoria que tiene una distribución binomial negativa con parámetros k y edu.red

La distribución geométrica es el caso concreto de la binomial negativa cuando k = 1.]1]

Propiedades:

Su función de probabilidad es

edu.red

Para enteros x mayores o iguales que k, donde

edu.red1)

Su media es

1)

si se piensa en el número de fracasos únicamente y

edu.red1)

si se cuentan también los k-1 éxitos.

Su varianza es

edu.red1)

En ambos casos.

Distribución Geométrica

[En teoría de probabilidad y estadística, la distribución geométrica es cualquiera de las dos distribuciones de probabilidad discretas siguientes:

  • la distribución de probabilidad del número X del ensayo de Bernoulli necesaria para obtener un éxito, contenido en el conjunto { 1, 2, 3,…} o

  • la distribución de probabilidad del número Y = X - 1 de fallos antes del primer éxito, contenido en el conjunto { 0, 1, 2, 3,… }.

Cuál de éstas es la que uno llama "la" distribución geométrica, es una cuestión de convención y conveniencia.] [1]

Propiedades:

[Si la probabilidad de éxito en cada ensayo es p, entonces la probabilidad de que x ensayos sean necesarios para obtener un éxito es

edu.red1)

Para x = 1, 2, 3,…. Equivalentemente, la probabilidad de que haya x fallos antes del primer éxito es

edu.red1)

Para x = 0, 1, 2, 3,….

En ambos casos, la secuencia de probabilidades es una progresión geométrica.

El valor esperado de una variable aleatoria X distribuida geométricamente es

edu.red1)

y dado que Y = X-1,

edu.red1)

En ambos casos, la varianza es

edu.red1)

Las funciones generatrices de probabilidad de X y la de Y son, respectivamente,

edu.red

Como su análoga continua, la distribución exponencial, la distribución geométrica carece de memoria. Esto significa que si intentamos repetir el experimento hasta el primer éxito, entonces, dado que el primer éxito todavía no ha ocurrido, la distribución de probabilidad condicional del número de ensayos adicionales no depende de cuantos fallos se hayan observado. El dado o la moneda que uno lanza no tiene "memoria" de estos fallos. La distribución geométrica es de hecho la única distribución discreta sin memoria.] [1]

[De todas estas distribuciones de probabilidad contenidas en {1, 2, 3,… } con un valor esperado dado µ, la distribución geométrica X con parámetro p = 1/µ es la de mayor entropía.] [1]

[La distribución geométrica del número y de fallos antes del primer éxito es infinitamente divisible, esto es, para cualquier entero positivo n, existen variables aleatorias independientes Y 1,…, Yn distribuidas idénticamente la suma de las cuales tiene la misma distribución que tiene Y. Estas no serán geométricamente distribuidas a menos que n = 1.] [1]

Distribución Hipergeométrica

[En teoría de la probabilidad la distribución hipergeométrica es una distribución discreta relacionada con muestreos aleatorios y sin reemplazo. Supóngase que se tiene una población de N elementos de los cuales, pertenecen a la categoría A y N-d a la B. La distribución hipergeométrica mide la probabilidad de obtener x (edu.red) elementos de la categoría A en una muestra sin reemplazo de n elementos de la población original.] [1]

Propiedades:

[La función de probabilidad de una variable aleatoria con distribución hipergeométrica puede deducirse a través de razonamientos combinatorios y es igual a

edu.red1)

donde es el tamaño de población,

 edu.red

es el tamaño de la muestra extraída,edu.red edu.redes el número de elementos en la población original que pertenecen a la categoría deseada y edu.redes el número de elementos en la muestra que pertenecen a dicha categoría. La notaciónedu.red hace referencia al coeficient binomial, es decir, el número de combinaciones posibles al seleccionar edu.redelementos de un total [1]

[El valor esperado de una variable aleatoria X que sigue la distribución hipergeométrica es

edu.red1)

y su varianza,

edu.red1)

En la fórmula anterior, definiendo

edu.red1)

y

edu.red1)

se obtiene

edu.red1)

La distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es pequeño.] [1]

Por nombrar las más resaltadas y convenientes para este trabajo.

Materiales y herramientas

Desarrollo

Hemos decidido para cada pregunta de nuestra encuentra encuesta aplicar una distribución, ya que denominaremos aciertos y fracasos según queramos los resultados a obtener.

  • 1. Con la creación de nuevas tecnologías y la factibilidad hoy en día del internet, ¿usted cree que el servicio de SMS tradicional debería desaparecer de nuestro medio?

  • SI edu.redNOedu.red

Como vemos en esta pregunta las opciones son dos, fácilmente, "SI" y "NO" pero está dirigida a 100 estudiantes dentro de nuestro campus universitario, lo que nos dejaría claro la distribución aplicada, donde la más opcionada sería la distribución binomial. Posteriormente

Pasaremos analizar a partir de las 50 primeras encuestas, cuál sería la probabilidad que digan "SI" 30 estudiantes del campus universitario a la desaparición del servicio SMS.

edu.red(Número de intentos a partir de la primera mitad)

edu.redNúmero de éxitos que deseo obtener)

edu.red(Probabilidad de acierto que sería 0.5 al haber un acierto y un fracaso)

edu.red(Probabilidad de desacierto)

Tenemos como respuesta de probabilidad de obtener 30 "SI" en 50 encuestados.

Como vemos la probabilidad es muy pequeña debido a las pocas opciones y el número grande de intentos, pero sería de mucha utilidad, para determinar tendencias a ocurrir.

  • 2. ¿Usted es un consumidor del servicio de SMS tradicional (de solo texto)?, si lo es, por favor indicar con qué frecuencia mediante un porcentaje lo hace dentro de un período mensual.

Valor real en porcentaje: ___________

Parámetros de Consumo

  • 1. 80% – 100% edu.red Adictivo

  • 2. 60% – 79% edu.red Frecuente

  • 3. 40% – 59% edu.red Regular

  • 4. 20% – 39% edu.red Ocasional

  • 5. menos del 20% edu.red Casi Nunca

Media

16.8

Mediana

9

Varianza

49.7

Desviación estándar

7.0498227

Tabla 1. Medidas de distribución

Tenemos los datos obtenidos desde las encuestas, y las medidas de distribución: media, mediana, varianza y distribución estándar, ahora, vamos a suponer que necesitamos hallar la probabilidad que un estuante dentro de los 100 encuestados se encuentre dentro de los parámetro de consumo Regular que es de 40% a 59%.

edu.red

Donde:

edu.red

edu.red

edu.red

edu.red

edu.red

edu.red

edu.red

edu.red

Valores hallados de la curva normal.

edu.red

edu.red

edu.red

edu.red

Hemos hallado la probabilidad de que un encuestado este dentro de los parámetros de consumidor Regular, por medio del método de aplicación normal a la binomial. Como podemos observar la probabilidad es considerable, lo que nos da la pauta de decir que esta es una de las opciones que más seleccionaran los encuestados a simple vista.

  • 1. IPhone

  • 2. Android

  • 3. BlackBerry

  • 4. Otros

Tenemos en este caso 3 tipos de celulares Smartphones de 4 opciones que existen, y plantearemos que de todos los encuestados, queremos la probabilidad de que elijan solo lo Smartphones, si se quiere evaluar a 5 encuestados al azar.

edu.red

edu.red

edu.red

edu.red

edu.red

edu.red

Para esta pregunta hemos decidido utilizar la distribución híper geométrica como vemos, y como respuesta tenemos que la probabilidad es bajísima al solo querer que de 5 encuestados 3 al menos tengan celulares Smartphones.

  • 4. ¿Usted posee un plan de datos actualmente?

  • SI edu.redNOedu.red

Como vemos en la pregunta, las respuestas pueden ser dos lo que nos da 3 clases de distribución a utilizar que son: Binomial, binomial negativa y distribución geométrica. Para este caso empezaremos por generarnos un análisis, y elegiremos la distribución geométrica.

Las encuestas la realizamos de 5 y queremos saber la probabilidad de que a al 7mo grupo de encuestados se obtengan 3 de respuesta "NO" por primera vez.

edu.red

edu.red

edu.red

edu.red

edu.red

Podemos ver que la probabilidad es demasiado baja, que al 7 grupo de encuestados existan 3 respuestas negativas por primera vez, lo que resultaría lógico ya que la probabilidad no es fija para cada grupo, lo que nos deja claro que pueden existir más formas de predecir resultados si se quiere hallar para tal número de intentos nuestro éxito por primera vez.

  • 5. Si usted no dispone de un plan de datos, entonces ¿dejaría de utilizar un sistema tradicional de mensajería instantánea como el SMS, por un sistema de plan de datos instalado en su teléfono celular, ya sea Blackberry, Android o actualmente Iphone; y estar dispuesto a pagar el valor mensual del plan?

SI edu.redNO edu.red

Para esta última pregunta utilizaremos distribución binomial negativa, por solo haber dos resultados posibles:

Calcularemos:

Para una compañía de celulares es de interés saber, las respuestas "SI" al menos 10 de 37 que es el total de encuestados que llegaron a esta pregunta, para enviar un personal a ofrecer el servicio de plan de datos a estudiantes dentro del campus de la UPS. Sabemos que la probabilidad es 0.5 de que ambos opciones, "SI" y "NO", sean seleccionadas.

¿Cuál es la probabilidad que la respuesta "SI" se repita 20 veces?

edu.red

edu.red

edu.red

Hemos hallado esta probabilidad, que deja en duda la participación de la compañía que desee ofrecer este servicio ya que el interés de parte de los estudiantes es bajísimo.

Conclusiones

  • Los estudiantes universitarios usan todo tipo de celulares que les brindan diferentes servicios y utilidades pero al querer nuestra probabilidad que cada uno tenga un Smartphone y dentro de esas utilidades, esta probabilidad generada nos dio bastante pequeña, que denotaría muchas razones, en las que se encuentran como destacadas: la economía y accesibilidad, porque los estudiantes dentro de un grupo pequeño de muestra se deciden por uno en la categoría de Otros.

  • Como mencionamos en el análisis de cada preguntas, para los estudiantes resulta muy complicado adquirir un celular de gama alta, como uno "Android", "IPhone" y "BlackBerry" por lo que se deciden por uno diferente dentro nuestra categoría de "Otros", de cualquier marca o diferente sistema operativo. Luego aún más remoto es que posean un plan de datos que pagar e incluso luego querer adquirir uno. Todo esto debido a la facilidad de comunicarse gracias a la tecnología que nos rodea, y la accesibilidad de las telefonías al brindar el servicio de plan de datos diarios, lo que deja el servicio de SMS muy por debajo de toda la tecnología, no por ser un mal servicio, lento o poco práctico, sino porque los diferente servicios que brinda la tecnología, ya que son más completos a la hora de comunicarse, pero no obstante la probabilidad en la primera pregunta es bajisima con respecto a "SI" que se refiere a eliminar el servicio de SMS, porque aunque no lo utilicen de manera frecuente, ellos lo ven como un servicio aún importante a utilizar, con respecto a la comunicación.

  • Los estudiantes que frecuentan el campus universitario con partidarios de utilizar el internet, ademas son muy afines al avance de la tecnología.

Bibliografía

[1] wikipedia, «es.wikipedia.org,» Wikimedia Commons , 24 07 14. [En línea]. Available: http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad. [Último acceso: 03 08 14].

Universidad Politécnica Salesiana.

 

 

Autor:

Mirabá Bruno,

Molina Héctor,

Bustamante Cristina

bmiraba[arroba]est.ups.edu.ec,

hmolinav[arroba]est.ups.edu.ec,

Kbustamantec[arroba]est.ups.edu.ec.