Descargar

Velocidad de entrega, calidad de producto y tipo de industria (página 2)

Enviado por Luis R. Cesar


Partes: 1, 2

edu.red

Es indudable que si H0 es verdadera, esta cantidad tiende a ser pequeña ya que las frecuencias observadas y las teóricas tenderán a ser iguales.

Para usar el contraste ?2 en poblaciones continuas se presenta la dificultad de que las probabilidades de que la variables tome un valor determinado, son cero, por eso los resultados muéstrales deben agruparse en intervalos, y se comparan entonces las frecuencias observadas con que los valores muéstrales caen en esos intervalos y las frecuencias teóricas.

Partiendo de lo dicho anteriormente agrupamos los datos de la variable X1 en intervalos, para la determinación de la longitud del intervalo se utilizo la siguiente formula:

Longitud del intervalo: edu.red

El valor obtenido mediante la formula anterior fue de Li = 0.798011512 y por comodidad este valor fue redondeado a 0.8. Finalmente para determinar el numero de intervalos se utilizo al formula: Ni = Rango / Li lo que nos arrojo el siguiente valor: 7.625 el mismo fue redondeado a 8.

Los intervalos obtenidos así como las frecuencias se muestran en la tabla siguiente:

edu.red

Con esta información construimos un histograma para tener una idea del tipo de distribución bajo a estudio:

Histograma variable X1 (velocidad e entrega)

edu.red

Se puede apreciar mediante este histograma que se aproxima a una distribución normal sin embargo procederemos a corroborar esta información aplicando un contraste ?2 de bondad del ajuste.

Para los cálculos de la ?2 utilizamos los valores de estadística descriptivas que se muestran a continuación:

edu.red

Contraste de Hipótesis para la prueba de la bondad de ajuste de la variable X1 (Velocidad de entrega).

Hipótesis: H0: La Velocidad de entrega esta distribuida normalmente

H1: La Velocidad de entrega no esta distribuida normalmente.

La tabla siguiente contiene toda la información necesaria para calcular la ?2.de la muestra

edu.red

En la tabla anterior las dos primeras columnas como podemos apreciar son los limites de los intervalo que hemos encontrado para agrupar nuestros datos, las dos siguientes columnas muestran la tipificación de las variable aleatoria para cada limite del intervalo ejemplo (0-3.576)/ 1,71254949 = -2.08811484 se repite el procedimiento para cada limite del intervalo y para cada intervalo, las columnas 5 y 6 son los valores de probabilidad normal para cada uno de los valores obtenidos en las columnas 3 y 4, finalmente la columna 7 represente la frecuencia esperada donde pi es la diferencia de la columna 6 menos la columna 5 por el tamaño de la muestra que en nuestro caso es 100.

Para calcular la chi cuadrado del experimento utilizamos la formula siguiente:

edu.red

Donde Nj, es la frecuencia del primer intervalo, ej Obtenido en la última columna de la tabla anterior ya sabemos de donde sale.

Calculando:

?2 = ((2 – 3,41177561)2/3,41177561) + ((3 – 7,17723614)2/7,17723614) + ((13 – 12,1853466)2/12,1853466) + ((25 – 16,6971277)2/16,6971277) + ((19 – 18,4663289)2/18,4663289) + ((16 – 16,483827)2/16,483827) + ((17 – 11,875994)2/11,875994) + ((5 – 6,90564376)2/6,90564376) = 9,96485991

?2 = 9,96485991

Seguidamente calcularemos el valor critico para el contraste planteado el cual será un ?2 con un nivel de a = 5% y grados de libertad 8 – 2 – 1 = 5 Grados de libertad, se restan dos a los grados de libertad ya que en el procedimiento se tuvieron que estimar dos parámetros la media y la varianza.

edu.red

Como la ?2 del experimento es menor que la ?2 cuadrado se acepta la hipótesis nula y se dice que la variable X1 (Velocidad de entrega) Sigue una distribución normal.

Prueba de independencia o Contraste de independencia entre las variables X7 y X8

Este es un contraste muy útil en la practica ya que nos permite determinar si existe independencia entre variables aleatorias que representan conjuntos de atributos o características de tipo cualitativo en una población determinada, para aplicar este contraste se divide la población en distintas categorías de acuerdo con ciertos criterios y se investiga si existe alguna asociación entre ellos. Una población se puede clasificar de acuerdo con un criterio A en g categorías distintas mutuamente excluyentes, y de acuerdo con un criterio B en l categorías distintas, al tomar una muestra aleatoria de tamaño n de una población cada elemento de la muestra queda clasificado en una de las categorías de cada criterio, cuando tabulamos la muestra obtenemos lo que se conoce como tabla de contingencia.

Se trata de contraste a la no relación de de las variables aleatorias, si los criterios de clasificación llamemoslos A y B son independientes debe cumplirse que:

edu.red

Si se designa a pi la probabilidad de que un elemento pertenezca a la categoría Ai, y como pj, la probabilidad de que un elemento pertenezca a la categoría Bj, y como pij la probabilidad de que pertenezca simultáneamente a Ai y Bj usando esta terminología la hipótesis nula será:

H0: pij = pi . pj

Contra la hipótesis alternativa:

H1: pij ? pi . pj

Es cierto que la probabilidades marginales pi pj no se conocen pero pueden estimarse a partir de la muestra.

Si la hipótesis H00 es verdadera (Los criterios de clasificación son independientes), las probabilidades conjuntas pij se pueden estimar por los productos de los estimadores máximo verosímiles y una ves estimadas las probabilidades conjuntas, se puede calcular la frecuencia esperada en cada celda de la tabla de contingencia, si entendemos por frecuencia esperada de la celda (i, j) el numero esperado de elementos que teóricamente esperaríamos pertenecieran simultáneamente a la categoría Ai y Bj y este numero es:

edu.red

Comparando estas frecuencias esperadas con las frecuencias muéstrales (nij) se puede contrastar la hipótesis H0, si la hipótesis es verdadera podemos esperar que las frecuencias muéstrales no difieran significativamente de las frecuencias esperadas, por lo tanto si esas diferencias son significativas rechazamos la hipótesis de independencia si no la aceptamos. El estadístico que utilizamos para determinar si las frecuencias son o no significativas es:

edu.red

Este estadístico tiende a distribuirse como una variable ?2 con (h-1) (c-1) grados de libertad.

En el caso particular que se esta analizando X7 Percepción del cliente de la calidad del producto respecto de X8 tipo de industria Los datos se agruparon según la siguiente categorización:

Malo (4=x),

Regular (74=<<em>x), y

Bueno (107=<<em>x)

Lo que nos dio la siguiente tabla de contingencia:

edu.red

Aplicaremos una ?2 cuadrado para determina si existe una relación entre estas dos variables:

Se plantean las siguientes hipótesis;

H0: la percepción del cliente y el tipo de industria son independientes

H1: la percepción del cliente y el tipo de industria no son independientes

A continuación aplicamos la ?2 cuadrado a la tabla anterior lo que nos arroja el siguiente resultado:

edu.red

Para obtener el valor de la primera celda de la tabla anterior procedemos de la siguiente manera:

Se procede de la misma manera para cada celda de la tabla de contingencia obteniendo la tabla con los valores de dichos cálculos.

Una vez realizados los cálculos tenemos un valor del experimento de 2,9091 y un valor crítico de 5.991 el cual corresponde a una ?2 con 2 grados de libertad al 5% aplicamos la regla de decisión que dice:

"No rechazar la hipótesis nula si ?2 <= 5.991 y rechazar si ?2> 5.991

Se acepta la hipótesis nula y se concluye que no existe relación entre la percepción que tienen el cliente de la calidad del producto y el tipo de industria.

 

 

 

 

 

Autor:

Luis R. Cesar

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente