Descargar

MINITAB – Manual de Entrenamiento (página 3)


Partes: 1, 2, 3

Partes: 1, , 3

 

Examinando la asociación residual

Los residuos contra las variables

Una técnica por determinar si otras variables pueden ser importantes en predecir la respuesta es la grafica de los residuales contra cada predicción potencial.

Regresión

1.- Escoja el Stat > Regresión > Regression o presione ctrl+E para regresar al cuadro de diálogo.

2.- Click Graphics.

3.- Completa el recuadro como se indica a continuación:

4.- Pulse el botón OK en cada recuadro.

Interpretando tus resultados

Cuando el plotted en contra de la descarga, los residuales no parecen completamente aleatorios. Los residuales aparecen más grandes para los valores de descarga más grandes. Esto indica que la descarga puede ser útil respondiendo a la variabilidad adicional en el golpe.

La entrada y la chispa también parecen ser relacionadas con el golpear y pueden responder a la variabilidad adicional.

Es posible para dos o más variables explicar la misma variabilidad en la respuesta. En este caso, el modelo final puede que no incluya todas las variables.

Encajando a un modelo de la regresión múltiple

Usa la regresión para analizar el modelo de la regresión múltiple con todos las cuatro predicciones.

Regresión

1.- Escoge Stat > Regresión > Regresión o presione Ctrl.+E para regresar a la Regresión en el recuadro.

2.- Presione F3 para borrar el cuadro de diálogo

3.- Completa el recuadro como se indica a continuación:

4.-Click OK.

Interpretando tus resultados

Use un α de 0.05 para todos los anαlisis.

Ecuación de regresión

La ecuación que relaciona la respuesta y la predicción es:

Knock = 23.8 – 0.296 +3.19 AFR +0.359 entrada + 0.0134 descarga

Tabla de coeficientes

Tenga el cuidado al interpretar los coeficientes de la regresión múltiple.

El p-valor para cada variable sólo indica si es significante en el modelo presente.

Por ejemplo, la chispa no es una predicción significante en el modelo presente (p = 0.363). Sin embargo, si quitas la descarga del análisis, la chispa se hace significativa, está altamente correlacionados (r = – 0.723,p = 0.005, vea página 3.49) y así explica la misma variación en el golpe.

El análisis de la regresión: el golpe contra la chispa, succión, la descarga,

Interpretando tus resultados

Cuidado con multicolinealidad

Cuando las predicciones son sumamente correlacionadas, la estimación del coeficiente de regresión puede ser inestable (Significa que varían ampliamente de un ejemplo al siguiente). Esta condición es llamada multicolinealidad, y eso hace que la evaluación sea importante en términos individuales en la dificultad del modelo.

Puedes usar la correlación para tratar de identificar las fuentes potenciales de la multicolinealidad. Si hay multicolinealidad extrema en un modelo, MINITAB mostrará un mensaje en la ventana de la sesión y quita una o más variables para reducir el problema.

Nunca quites mas de una predicción en ningún momento

Una buena forma de Escoger las predicciones de un modelo de regresión múltiple es tratar a todas las combinaciones potenciales usando el modelo de procedimientos de comparación como el mejor subconjuntos o una regresión gradual.

El análisis de la regresión: el golpe contra la chispa, succión, la descarga

Interpretando tus resultados

R²(R-Sq) y R² ajustó (R-Sq(adj))

El nuevo modelo explica 98.8% de la variabilidad en la respuesta, lo cual es una mejora sobre el R² logrando usar solamente AFR para predecir el golpe

Sin embargo R² nunca disminuirá cuando aumente la predicción al modelo, aun cuando eso no resulte un buen modelo. La estadística de R² ajustada (R-Sq(adj) = 98.2%) es ajustado para el número de condiciones en el modelo, y debe usarse cuando son comparados los modelos con diferente números las predicciones.

El R² ajustado para el modelo con sólo AFR como el predictor tenía 91.6% años. así, el modelo actual con un R² esta ajustado 98.2% se mejora.

Análisis de Variación

Las hipótesis para un modelo de la regresión múltiple es:

Ho: todo β1 (a excepciσn de β0) son iguales a cero

H1: al menos uno βi (no incluye β0 ) no es igual a cero

Porque p (0.000) es menos que α (0.05), puedes rechazar Ho.

El modelo de la regresión, con la chispa, AFR, Succión, y descarga como las predicciones, es significativamente mejor que la restricción del modelo el cual incluye no predicciones.

El análisis de la regresión: el golpe contra la chispa, succión, la descarga,

Consideraciones Finales

Conclusiones prácticas

La ecuación de la regresión para la Chispa usando ejemplar, AFR, Succión y Descarga para predecir el Golpe es:

El golpe = 23.8-0.296 Chispa + 3.19 AFR + 0.359 Succión +0.0134 Descarga.

Este modelo responde de 98.8% de la variabilidad en el Golpe.

Hay problemas del multicolieanidad con el modelo. Sin embargo, la chispa sumamente correlacionado con la Descarga.

En el próximo ejemplo, usarás los mejores Subconjuntos para procesar a todos los posibles modelos con estas cuatro predicciones y Escoger el mejor.

Consideraciones estadísticas

No puedes usar el análisis de la regresión para afirmar que los cambias en las predicciones causan cambios en la respuesta, a menos que los valores de las predicciones cambien niveles predeterminados en un experimento controlado. Si los valores de las predicciones variar al azar, otros factores pueden influir en las predicciones y la respuesta.

No deberías aplicar los resultados de regresión y los valores de respuesta que son salidas de tu rango de los ejemplos.

La precisión de medida es importante. La falta de precisión te lleva a la inexactitud estimada de los coeficientes.

Ten cuidado de no pasar por alto los factores potencialmente importantes al diseñar un estudio de regresión.

Tenga cuidado con multicolinealidad.

Cuando las variables de la predicción están sumamente correlacionadas:

  • Los coeficientes estimados de la regresión pueden ser inestables (Ellos pueden variar ampliamente de una muestra a la siguiente muestra)
  • Puede ser difícil evaluar la importancia de las condiciones individuales del modelo.

Nunca quite más de una predicción en ningún momento.

Una buena forma de Escoger las predicciones de un modelo de regresión múltiple es tratar a todas las combinaciones potenciales usando el modelo de procedimientos de comparación como el mejor sub conjuntos o una regresión gradual.

Mejores Subconjuntos de la Regresión

El ejemplo 5 Reduciendo el Golpe del Motor

Problema

Estás intentando identificar las variables importantes que efectúan el Golpe del motor. Las siguientes variables están bajo las consideraciones:

  • La elección del momento adecuado de la chispa
  • La proporción de aire-combustible (AFR)
  • La temperatura de la succión
  • La temperatura de la descarga

Recolección de datos

Los datos son recolectados al azar de 13 motores seleccionados

Herramientas

Stat > Regressions>Best subsets.

Stat>Regressions>Regressions.

Set de Datos

KNOCK.MPJ

REGRESIONES DE LOS MEJORES SUBCONJUNTOS

¿Cuál es el mejor subconjunto de regresión?

La regresión de los mejores subconjuntos evalúa todas las posibles combinaciones de las predicciones para ayudarle a determinar qué combinación hace al mejor modelo de las regresiones. MINITAB usa un criterio de R2 máximo para Escoger al mejor modelo . Otro criterio puede proporcionar a un modelo diferente.

¿Cuándo usar los mejores conjuntos de regresión?

Use la regresión de los mejores subconjuntos cuando usted tiene mucho potencial de predicciones y así varios modelos de regresión para Escoger.

¿Por qué usar el mejor subconjunto de regresión?

Los mejores subconjuntos pueden disipar las siguientes preguntas:

  • ¿ Qué combinación de tus factores es él más eficaz para predecir tu respuesta?
  • ¿Cuál es el mejor modelo de regresión posible usando de 5 a 20 predicciones?

Por ejemplo,

  • ¿Está un modelo usando 10 variables para predecir la suavidad del helado mas que uno que usa sólo temperatura y velocidad en la mezcla?

Escogiendo un modelo apropiado

Use los mejores Subconjuntos para ayudarle a Escoger a un modelo de las regresiones múltiples para el Golpe y evita los problemas siguientes:

  • Los modelos incómodos e ineficaces son el resultado de muchas predicciones.
  • Coeficientes inestables que resultan de redundante y predicciones correlacionadas.
  • Habilidad inadecuada de predicciones que resulta pocas predicciones.

Predicciones libres

Entre todas las cuatro variables en las predicciones Libre. MINITAB probará todas las posibles combinaciones de estas variables y el reporte estadístico para los mejores modelos. (Variables de entradas de las Predicciones en todos los modelos serán incluidas en cada modelo.)

Best Subsets

1.- Seleccione Stat>Regressions>Best.

2.-Completa el recuadro como se indica a continuación:

3.- Click OK

Interpretando tus resultados

Los Xs al derecho de la tabla indica qué predicciones son incluidas en cada modelo.

Variables

La columna de Vars indica el número de predicciones en el modelo.

R2 (R-Sq) y R2 ajustó (R-Sq(adj))

Al comparar a modelos:

Si el número de predicciones es el mismo, busque al modelo con el R2 más alto.

Si el número de predicciones es diferente, busque al modelo con el R2 más alto.

Cp

Busque a modelos dónde Cp es pequeño y acerca el número de parámetros en el modelo. Por ejemplo, para modelo con 3 predicciones y el interceptor, busque a un modelo con un Cp cerca de 4 La fórmula Para Cp es:

Cp = (SSEp/MSEm)-(n-2p)

Donde SSEp son las sumas de error de los cuadrados para el modelo con los parámetros de p (incluso el interceptor), MSEm el error de la media cuadrada para el modelo con toda las predicciones de m, y n es el número de observaciones.

Los mejores Subconjuntos de regresión: el Golpe contra la Chispa, AFR, la Succión, la Descarga,

La contestación es el Golpe

Interpretación tus resultados

Variabilidad

S es una estimación de la media variabilidad sobre la línea de las regresiones. Matemáticamente, S es la raíz cuadrada positiva del MSE. En general, tu quieres que S sea tan pequeño como posible.

Conclusión

Basado en éstos criterios, el modelo con AFR, la Succión, y la Descarga es el mejor. El modelo

Conteniendo todos las cuatro predicciones es comparable, pero S para este modelo es ligeramente más grande y allí no parece ser cualquier ganancia en R2 ajustado para usar el modelo. Es generalmente sabio Escoger al modelo más simple a menos que un modelo más complicado sea claramente mejor.

Los mejores Subconjuntos de regresión: el Golpe contra la Chispa, AFR, la Succión, la Descarga

La contestación es el Golpe

Evaluando el último Modelo

Usa la Regresión para evaluar al último modelo. Calcule la ecuación de regresión y confirme que todas las asunciones sobre los residuales sean conocidas.

Regression

1.- Escoge Stat > Regresión > Regresión

2.- En Response, enter knock.

3.- En Predictors, enter AFR intake exhaust

4.- Click Graphs

5.– Complete el recuadro como se indica a continuación:

6.- click OK en cada recuadro.

Interpretando tus resultados

Use una α de 0.05 para todos los anαlisis.

La ecuación de regresión

La ecuación de regresión es:

El golpe = 16.5 +3.21 AFR +O.386 Succión +0.0166 Descarga

Tabla del coeficiente

El valor de p más bajos (p < 0.05) en la tabla del coeficiente indica que todas las condiciones en el modelo son significantes.

Análisis de variación

Porque p (0.000) es menor que α (0.05) puedes rechazar H0. El modelo de la regresión que incluye AFR; las Succiones y la Descarga son significativamente buenas que el modelo restringido que no incluye ninguna predicción.

Interpretando tus resultados

Las gráficas residuales verifican que se han reunido todas las asunciones acerca de los residuales. Los residuales:

  • No parta substancialmente de la normalidad.
  • Aparece la distribución aleatoria a cero.
  • Aparece tener la variación constante por los todos valores de ajustes.
  • No exhiba un tiempo – el efecto del orden.

Consideraciones finales

Conclusiones prácticas

El mejor modelo para predecir el golpe es:

Knock= 16.5 +3.21 AFR+0.386 Intake + 0.0166 Exhaust

Consideraciones estadísticas

Antes de usar el mejor subconjunto de regresión para evaluar los modelos de regresión que son diferentes, asegúrate de que tus predicciones y respuestas son validas para todo el modelo potencial sean modelos validos de regresión.

Todos reglas y las guías también pertenecen a los modelos de la regresión múltiple también aplican cuando Escoge un modelo que usa este procedimiento.

EL ANÁLISIS DE VARIACIÓN

Objetivos:

  • Compare grupos de variables usando una prueba de varianza.
  • Compare las medias de las muestras recolectadas en diferentes niveles de un solo factor utilizando One-Way ANOVA.
  • Compare las medias de las muestras recolectadas en diferentes niveles de un solo factor usando el análisis de la media.
  • Compare las medias de las muestras recolectadas en diferentes niveles de uno o más factores utilizando Balance ANOVA.
  • Compare las medias de las muestras recolectadas en diferentes niveles en mas de un factor utilizando el Modelo Lineal General.

Contenidos

Ejemplos y ejercicios

Propósito

Pagina

ANOVA sentido único

 

136-149

Ejemplo 1

El Precalentamiento del CRT Time

Evalúe la diferencia entre los medios del grupo para un solo factor que usa un ANOVA One-Way.

 

El análisis de la media

150-154

Ejemplo 2

El Precalentamiento del CRT Time Revisited

Evalúe la diferencia entre los grupos de medias usando Análisis de la Media.

 

ANOVA equilibrado

 

155-167

Ejemplo 3

El Uso de la pintura

Emplee el blocking de variables para reducir la variación en un análisis usando Balanced ANOVA.

 

El Modelo Lineal General

 

168-185

Ejemplo 4

La Distancia de frenado

Evalúe la diferencia entre las medias del grupo para factores múltiples que usan el General el Modelo Lineal.

 

Ejercicio 4.1

Prueba de Vino

Evalúe la diferencia entre las medias del grupo para factores múltiples que usan el General el Modelo Lineal.

 

Ejercicio 4.2

El Volumen de fosfato

Evalúe la diferencia entre las medias del grupo para factores múltiples que usan el General el Modelo Lineal.

 

One Way ANOVA

Ejemplo 1

Precalentamiento del CRT Time

Ejercicio

Tu estás probando tres lotes de tubos de rayo catódico para determinar si los períodos del precalentamiento son consistentes.

Recolección de datos

Una muestra aleatoria de cuatro tubos se toma de cada lote y es probada durante el tiempo del precalentamiento.

Herramientas

Stat > ANOVA > Test for Equal Variances.

Stat > ANOVA > One-Way.

Set de datos

CRT.MPJ

Nombre

Tipo de dato

Tipo de Variable

Niveles

Tubetype

Numérico

Factor

1,2,3

Time_sec

Numérico

Respuesta

 

ANOVA One Way

¿Qué es ANOVA One-Way?

One-Way ANOVA (Análisis de varianza) procedimiento es una generalización independiente de las pruebas t. Al contrario de la prueba t. Sin embargo, One- Way ANOVA puede usarse para analizar las medias de más de dos grupos (muestras) de una vez.

La lógica básica detrás de ANOVA es:

  • La variación dentro del grupo sólo es debida al error aleatorio.
  • Por consiguiente, si la cantidad de variación de los grupos es similar dentro de los grupos (lo alto dela grafica), es probable que la media del grupo sólo difiera también debido al error aleatorio.
  • Sin embargo, si la variación dentro del grupo es relativamente grande dentro del grupo de variación ( gráfico) es probable que las diferencias entre las medias del grupo sean causadas por las diferencias por las marcadas de los niveles de factor.

¿Cuándo usar One-Way ANOVA?

Use One-Way ANOV (también llamado el solo factor ANOVA) cuando tengas respuestas continuas de datos de dos o más niveles fijos de un solo factor.

Antes de aceptar los resultados en el ANOVA, debes verificar las siguientes suposiciones acerca del residual y validar los resultados.

  • La residual debe ser independiente ( y ser la azar).
  • La residual no tiene una desviación sustancial de la distribución normal.
  • La residual debe tener constantes variaciones a través de los niveles de factor.

¿Por qué usar One Way ANOVA?

One-Way ANOVA te puede ayudar las preguntas de la respuesta como:

  • ¿Hay diferencias entre los productos de tus proveedores?
  • ¿Hay diferencias entre los tratamientos de los grupos?

Por ejemplo

  • ¿ La dureza de las muestras de plásticos de tus cuatro o proveedores son diferentes?
  • ¿La combustión es más eficaz cuándo usas el aditivo de combustible A, B o ningún aditivo de combustible?
  • ¿Las fuerzas de las muestras plásticas son de sus cuatro proveedores diferente? ¿La combustión es más eficaz cuándo usted usa el aditivo de combustible UN, combustible B aditivo, o ningún aditivo de combustible?

Validando la Variación Iguales

Usa la prueba para las Variaciones iguales para validar las suposiciones que las variaciones de todos los grupos comparados sean iguales.

Las respuestas de datos de cada grupo deben estar en la misma columna, con el nivel de factor indicado en otra columna.

Use el nivel de confianza de 95% por default.

Test for Equal Variances

1.- Abre el proyecto CRT.MPJ.

2.- Escoge Stat >ANOVA >Test for Equal Variances.

3.- Completo el cuadro de diálogo como indica a continuación>

4.- Pulse el botón OK

Interpretando sus resultados

Intervalos de Confianza

Los intervalos de confianza son útiles para comparar la σ para las diferentes poblaciones. Sin embargo, tu decisión acerca si las variaciones son iguales deben ser basado en una prueba de varianza apropiada.

Del gráfico, aparece una sigma para el tubo tipo 2, más largo que para los otros grupos.

Pruebas de las variaciones

Los resultados incluyen dos pruebas de la variación separadas.

Qué prueba uses depende de tus datos:

  • Si tus datos son continuos y normalmente distribuidos, use la Prueba de Bartlett"s. (Sí solamente se comparan dos grupos, un F-prueba reportara instantáneamente una prueba Bartlett"s).
  • Si sus datos son continuos, pero no necesariamente normalmente distribuidos, use la Prueba de Levene"s.

Conclusión

Los p-valores para ambas pruebas (p=0.100 para Bartlett"s Test; p=0.248 para Levene"s Test) es mayor que 0.05. Pero no hay bastante evidencia así ( que con un nivel de 0.05 σ) se concluye que las variaciones no son iguales.

Ejecutando One-Way ANOVA

Usa One-Way ANOVA para comparar la media del tiempo de calentamiento para diferentes tipos de tubos de rayo catódico, y crea los gráficos para visualizar los datos.

One- Way

1.- Escoge el Stat>ANOVA>One-Way.

2.- Complete el recuadro como se indica a continuación:

 

3.- Click Graphs.

4.- Selecciona Doplots of data and Boxplots of data.

5.- Click OK en cada cuadro de diálogo.

Interpretando sus resultados

Boxplots

La grafica boxplot muestra que el rango de valores en el Grupo 2 es más grande, que el de los otros grupos.

Dotplots

La grafica dotplot revela que el grupo 2 contiene una sola observación con un extraordinario valor alto. Con sólo 4 observaciones en cada grupo, tal línea de fuera tiene largos efectos en la media y una desviación de la muestra.

Tales fuera de línea como esta puede ser el resultado de una variación aleatoria, o ellos pueden indicar que algún empalme pasó en tu proceso. Tu debes investigar las líneas de fuera para determinar que causo que eso fuera posible.

Para el presente análisis, asume que todas las observaciones son válidas.

Interpretando sus resultados

El análisis de varianza

La primera fila en la tabla del análisis de varianza contiene todas las estadísticas asociadas con el factor: tybetype. La siguiente fila contiene todas las estadísticas asociadas con el error aleatorio ( error).

Los grados de libertad

Los grados de libertad (DF) se refieren al número de valores usados para calcular la suma de los cuadrados (SS) para cada fuente.

La suma de cuadrados

La suma de cuadrados (SS) es la medida de la cantidad de variabilidad que cada fuente contribuye a los datos. Note que el importe global de variabilidad en los datos (SS suman, 378.7) es igual al SS para el tubetype (114.7) más el SS para el Error (264.0).

Media cuadrada

(MS) para cada fuente es igual al SS dividió por el DF.

  • El MS para el factor es una estimación del promedio de la media junto con el grupo de variabilidad.
  • El MS para el error es una estimación del promedio dentro del grupo.

ANOVA sentido único: el time_sec contra el tubetype

Interpretando sus resultados

F-estadística

F es el radio de la variabilidad contribuida por el factor de la variabilidad contribuida por el error. Es calculado como el MS para el factor (el tubetype) dividió por el MS para el error.

Cuando las diferencias entre el nivel de factor de la media es similar a las diferencias entre las observaciones de cada nivel. F será cerrado a 1.

Si la variabilidad entre el nivel de factor de la media es mas larga que la variabilidad entre las observaciones dentro del factor, F será más grande que 1.

El P-valor

P-valor es la probabilidad que F sería tan grande como es (o más grande) si su factor no tiene los efectos. Cuando F es grande, sugiere que el nivel de factor de la media es más diferente que los esperados para la ocasión. Así que p-valor es pequeño.

Use el p – el valor de probar las hipótesis lo siguiente:

Ho( hipótesis nula) todos los factores del nivel de la son iguales.

H1(la hipótesis alternativa) todos los factores del nivel de la son diferentes.

Conclusión:

Porque P es mayor que (0.05), tu no puedes rechazar Ho. No hay suficiente evidencia para sugerir que los niveles de las medias son diferentes.

Interpretando sus resultados

95% CIs individuales Para la Media

Para cada nivelado de tu factor MINITAB despliega el intervalo de confianza., Así como lo siguiente las estadísticas:

  • N——— Número de observaciones.
  • Mean— Media de las observaciones.
  • StDev— Desviación estándar de las observaciones

Los intervalos de confianza

Los intervalos de confianza representan rangos de valores probables para la media de cada nivel. Tu puedes estar seguro en un 95% que µ ( de la población de la media) para cada nivel esta dentro del rango indicado.

Calculando los intervalos, MINITAB combina las desviaciones estándar de cada nivel con la estimación agrupada de σ ( desviación estándar de la población) también llamada desviación estándar agrupada ( Pooled StDev).

Note que hay mucho traslapo entre los intervalos para los tres los tipos de tubos diferentes. Ésta es una buena indicación de que las medias no son significativamente diferentes uno del otro

Sin embargo, la prueba de la comparación es necesaria antes de que cualquier conclusión pueda figurar.

ANOVA sentido único: el time_sec contra el tubetype

Validando las Suposiciones de la Residual

Antes de que tu puedas confiar en los resultados de un One-Way ANOVA, tu debes revisar que todas las suposiciones acerca de la residual han sido encontradas.

Usa One Way para crear unan grafica de residuales.

One-Way

1.-Escoja Stat >ANOVA > One-Way o presiona Ctrs + E para regresar al recuadro de One Way.

2.-Click Graphs.

3.- Complete el recuadro como se indica a continuación

  1. Click OK en cada cuadro de diálogo.

Interpretando sus resultados

La grafica de probabilidad normal

Usa la grafica de probabilidad normal de la residual para verificar que tu residual no este desviado sustancialmente de la distribución normal.

  • Si la residual viene de la distribución normal, los puntos seguirán una línea recta.
  • Si la residual no viene de la distribución normal, los puntos no seguirán una línea recta.

Basado en esta grafica, es razonable asumir que la residual de los datos de CRT no están desviados sustancialmente de la distribución normal.

Como notaste previamente, hay una línea de fuera en el conjunto de datos. Tu debes investigar la línea de fuera para determinar que fue lo que la hizo posible.

Alternativas

Tu también puedes usar un histolograma de la residual para evaluar la normalidad. Sin embargo la grafica de probabilidad normal es generalmente fácil de interpretar, especialmente para muestras pequeñas.

Interpretando sus resultados

Residuales contra Fits

Use la grafica de la residual versus las fits para verificar que las siguientes suposiciones han sido encontradas:

  • Variaciones constantes a través de la combinación de todos los factores.
  • No están fuera de línea los datos.

Si tú ves cualquier tipo de patrón en la grafica, una de estas suposiciones encontradas han sido violada. La tabla abajo resume los tipos de patrones que tú puedes ver

Los patrones:

Indica…

 La extensión desigual de las residuales a través de los diferentes valores ajustados.

La variación de tu residual no es constante.

Un punto está situado muy lejos del cero.

Fuera de línea.

Hay un residual extraordinariamente alto da que la apariencia de una variación no constante. Tu debes poder determinar que causo esta línea de fuera. Tal vez es apropiado volver a analizar los datos sin esta línea. Sin embargo tu solamente deberías remover la observación para estabilizarla, sin puede establecer que no era representativo de la población.

Interpretando sus resultados

La residual versus el orden

Utiliza la grafica de la residual contra el orden para verificar que la residual es independiente.

  • Si hay un efecto debido al orden de la recolección de los datos, los residuos no se esparcirán aleatoriamente cerca del cero. Tu debes ser capaz de detectar este patrón en la grafica.
  • Si hay un efecto debido al orden de la recolección de los datos, la residual esta aleatoriamente cerca del cero.

La grafica revela la misma fuera de línea identificada en la grafica de residual contra el Fitted values plot.

Ignorando la línea de fuera por un momento, hay dos valores muy bajos que ocurren uno después del otro.

Tal vez en alguna causa especial causo que la recolección de los tubos y las pruebas del tiempo de calentamiento fueran mas rápidamente que los otros tubos.

Tal vez valga la pena investigar.

Puede haber también evidencia de un aumento sistemático en el precalentamiento para los primeros cuatro tubos probados.

Consideraciones finales

Conclusiones prácticas

El análisis los tubos de rayo catódico no revelaron ninguna diferencia en el tiempo de calentamiento. Sin embargo existen problemas potenciales con el estudio:

  • Fuera de línea— Un valor aparece fuera de línea y debe ser investigado. Puede haber también evidencia de un incremento sistemático en el tiempo de calentamiento de los primeros cuatro tubos probados.
  • Los Patrones— dos tubos consecutivos tienen más corto el tiempo de calentamiento que lo normal.
  • Bajo Power— basado en una estimación de un 5.416, el power de la prueba para descubrir una diferencia de 7 segundos (a los 0.05 nivel) es solamente de 0.2642 . Esto es está menos de un 27% de oportunidad para descubrir una diferencia. De hecho en el orden tu tienes un power de 0.80, y deberías tener una diferencia de .80 segundos/

Basado en estos resultados, quizás el curso mejor de acción sería asegurar el proceso bajo control y recolectar muestras grandes y realizar la prueba nuevamente. Con una sigma reducida de 3.0 y una recolección de 6 muestras de tubos de cada lote, tu puedes detectar una diferencia de 7 segundo con un power de 0.9133

Consideraciones estadísticas

Comparando el nivel del factor múltiple con un solo ANOVA es preferible a hacer una comparación de dos niveles del tiempo con dos muestras separadas Esto es porque dirigiendo los aumentos de las pruebas extras incrementa tu posibilidad de error tipo 1 (rechazando Ho, cuando Ho es verdadera.

Las suposiciones de la independiente son criticas. Si las observaciones son afectadas sistemáticamente por otros factores que el que usted este estudiando los resultados de este ANOVA son sin sentido.

La suposición de la normalidad no es generalmente crucial especialmente en muestras grandes.

ANÁLISIS DE LA MEDIA

Ejemplo 2 CRT Revisión de tiempo de calentamiento

Problema

En el ejemplo 1 (página 4-3) realizaste una prueba de tres lotes de tubo de rayo catódico para determinar si los periodos de calentamiento son consistentes.

Colección de datos:

Una muestra al azar de los cuatro tubos es tomada de cada grupo y probadas para determinar el tiempo de calentamiento (Los datos de la muestra son tomados del ejemplo 1, Pagina 4-3).

Herramientas:

Stat > ANOVA >Analysis of Means

Set de Datos

CRT.MPJ

Nombre

Tipo de dato

Tipo de Variable

Niveles

Tubetype

Numérico

Factor

1,2,3

Time_sec

Numérico

Respuesta

 

Análisis de la media

¿Qué es un análisis de la media?

No es nada parecido que el ANOVA, el cual es usado para determinar si el nivel de la media difiere de algún otro, el análisis de la media ( ANOM) es usado para determinar si el nivel de la media es diferente de la gran media.

La gran media es la media de todas las observaciones sin tener en cuenta el nivel. Por ejemplo: si tú tienes cuatro observaciones por cada 3 niveles en el factor, la gran media es la suma de las 12 observaciones divididas entre 12.

El resultado de un análisis de la media es usualmente similar al obtenido con el ANOVA. Sin embargo:

  • El análisis de la media es generalmente más sensible que el ANOVA, cuando un nivel de la media es difiere del resto.
  • ANOVA es generalmente más sensible que el análisis de la media cuando los niveles de los grupos de la media son diferentes cada uno de los otros.

¿Cuándo usar el análisis de la media?

Usa el análisis de la media cuando tengas datos de uno o dos factores. Los datos deben de proceder de la distribución normal, Binomial o Distribución de Poisson.

¿Porqué usar el análisis de la media?

El análisis de la media te ayuda a responder preguntas tales como:

  • ¿Es un tratamiento mejor que el promedio?

Por ejemplo:

  • Entre tablas tratadas con diferentes acabados, un acabado confiere mejor que el promedio de las otras características utilizadas.

Desarrollo del análisis de la media

Use el análisis de la media para evaluar los datos. Use un ∞ de 0.05 para la prueba

Análisis de la media:

1. – Elija: Stat > ANOVA >Analysis of Means.

2.- Complete el recuadro como se indica a continuación

3.- Presione OK

Interpretando tus resultados

El análisis de la media comparado con el nivel de la media (puntos negros) con la gran media (línea central verde. La gran media es la media de las 12 observaciones.

Si un nivel de la media es mayor o menor que el valor critico representado por la línea decisiva (en rojo) esta es significativamente diferente de la gran media.

Conclusiones:

Ninguno de los niveles individuales de la media de los datos de la CRT son significativamente diferentes de la gran media.

Consideraciones finales

Consideraciones prácticas:

Diferencias no significativas fueron detectadas en medio del nivel del factor de la media y de la gran media.

Sin embargo recordemos que cuando los mismos datos fueron analizados únicamente con el procedimiento de ANOVA se observaron algunos problemas con el control del proceso. La mayor desventaja del procedimiento de Análisis de la media es que no suministra graficas de residual para ayudarte ubicar problemas en los datos.

Consideraciones estadísticas

Los resultados del análisis de la media son usualmente similares a los obtenidos con ANOVA, Sin embargo:

  • El análisis de la media es generalmente más sensible que el ANOVA, cuando un nivel de la media es diferente del resto.
  • ANOVA es generalmente más sensible que el análisis de la media cuando los niveles de los grupos de la media son diferentes cada uno de los otros.

Si bien usando ANOVA con dos factores, el diseño debe tener balance (esto es, debe tener los mismos números de observaciones por cada combinación de niveles de factor.

Si bien usando ANOVA con datos binomiales, np y n(1-p) deben los dos tener por lo menos cinco, porque ANOVA usa una aproximación normal de la binomial ( n es el tamaño de muestra que deben tener todas las muestras, y P es generalmente proporcional.

Para datos de Poisson, la media debe ser por lo menos de 5.

Balance ANOVA

Ejemplo 3 Desgaste de pintura

Problema

Estas estudiando las características que deben llevar los cuatros diferentes tipos de pintura amarilla para carreteras.

Recolección de datos:

Pruebas de restos de cada pintura que fueron aplicadas en las carreteras de Filadelfia, Pittsburg, Harrisburg y Scranton, Pensilvania.

Después de un tiempo conveniente de exposición al mal tiempo y al tráfico, el desgaste de la pintura fue medido en cada una de las cuatro localizaciones. Un alto puntaje de la media arrojo que la pintura estaba erosionada.

Herramientas:

Stat > Anova-One-way.

Graph > Chart.

Stat-ANOVA > Balanced ANOVA.

Set de Datos

PNTWEAR.MPJ

Balanced ANOVA

¿Qué es el balance ANOVA?

Balance ANOVA es similar al ANOVA, excepto que las respuestas pueden ser clasificadas en dos o más factores al mismo tiempo.

Por ejemplo: La tabla de abajo es el diseño de un estudio para evaluar si la temperatura del motor funcionando es un factor de ambos: Peso del aceite y las revoluciones por minuto del motor.

RPM

Aceite

1,000 2,000 3,000

5w30

RPM = 1,000

Aceite = 5w30

RPM = 2,000

Aceite = 5w30

RPM = 3,000

Aceite = 5w30

10w30

RPM = 1,000

Aceite =10w30

RPM = 2,000

Aceite =10w30

RPM = 3,000

Aceite = 10w30

 

La información de cada celda de la tabla representa la única combinación de RPM y aceite. Las observaciones son clasificadas en las dos variables.

¿Cuándo usar Balance ANOVA?

Usa Balance ANOVA cuando tengas respuestas continuas de datos fijos en uno o más factores. Los datos deben estar balanceados, Esto es, "deben tener los mismos números de observaciones en cada celda del diseño.

Antes de aceptar los resultados en el ANOVA, debes verificar las siguientes suposiciones acerca del residual y validar los resultados.

  • La residual debe ser independiente ( y ser la azar).
  • La residual no tiene una desviación sustancial de la distribución normal.
  • La residual debe tener constantes variaciones a través de los niveles de factor.

¿Por qué que usar Balance ANOVA?

Balance ANOVA te puede ayudar a responder preguntas tales como:

  • ¿Hay diferencias en tus productos a causa de varios factores identificados?
  • ¿Son ciertas combinaciones de los niveles de factor ideales?

Por ejemplo,

  • ¿El nivel de temperatura del motor funcionando cambia por el factor de RPM o Peso del aceite?.
  • ¿Existen ciertos cambios de maquinas en tus planta que son mas productivos que otros, o es una maquina mas productiva en ciertos cambios, pero no en otras?

Ejecutando One Way ANOVA

Para una comparación, primero ejecuta one-way ANOVA, para analizar el desgaste de la pintura como un factor del tipo de pintura solamente.

One-Way ANOVA

1.- Abre el proyecto PNTWEAR.MPJ.

2.- Escoge Stat > ANOVA-ONE WAY .

3.- En Respuesta enter PntWear.

4.- En Factor enter Paint.

5.- Click OK.

Interpretando tus resultados

Aunque la mejor pintura es la de Y-0242 (media = 14.25) y la peor de Y-1725m (media = 10.75) estas diferencias fueron no significativas "en el nivel 0.05 ∞ (p =0.115).

Graficando los datos

Información importante se pierde cuando no incluyes el factor de localización en tu análisis. Para ilustrar esto, usa el chart para crear unas barras agrupadas ilustrando el desgaste de la pintura en función de ambos tipos: de pintura y locacion.

Chart

1.- Escoge Graph > Chart.

2.- Complete el recuadro como se indica a continuación.

* Asegúrate de cambiar para cada uno de Graph a Group.

3.- Click: Options.

4.- Revisa el Group y enter Paint.

5.- Click OK en cada recuadro.

Interpretando tus resultados

La grafica muestra una gran cantidad de variabilidad en los datos asociados con Localización. En general, el menor desgaste de pintura se presenta en Philadelphia y la peor en Scranton.

Cuando tu no incluyes "Localización" en tu análisis, esta variabilidad es atribuida al error (dentro del grupo con variación). Esto disminuye tu F ratio.

Usando una segunda variable del bloque de variación de Locación.

Incluyendo locación en tu análisis quieres prevenir la variabilidad asociada con este factor, donde se les atribuye el error. Esto incrementara tu habilidad para detectar diferencias en desgaste de cada pintura.

Usa Balance ANOVA para analizar si el desgaste de pintura es un factor de ambos Pintura y Localización. Esto es llamado: Diseño aleatorio del bloque, porque el factor de interés es la pintura, y Localización es incluido solamente para reducir el error de variabilidad, Tal factor es llamado "Variable de bloque".

La respuesta debe estar en una columna con descripciones y columnas adicionales indicando los niveles de cada factor por cada observación.

Balance ANOVA

1.- Escoge Stat > ANOVA > Balance ANOVA.

2.- Complete el recuadro como se indica a continuación

3.- Click OK.

Interpretando tus resultados

En este modelo el efecto de ambos: Pintura y Localización son significantes en un nivel 0.05 ∞ (p = 0.003 y 0.007 respectivamente).

Note que el MS del error (también llamado MSE) en este modelo es solamente 1.285, comparado con el 4.190 del modelo que no incluyo localización como factor, porque el MSE es el denominador de todos los F-ratios, reduciendo el MSE, incrementa el F-Values.

Analizando el residual

Después de que confíes en los resultados de ANOVA, debes revisar, para estar seguro de todas las suposiciones acerca del residual que hayas encontrado.

Usa Balance ANOVA para crear una tabla de Residual.

Balanced ANOVA

1.- Escoge Stat > ANOVA > Balanced ANOVA y presiona Ctrl + E para regresar a Balance Analysis of Variance de los recuadros.

2.- Click Graphs.

3.- Marca las cuatro opciones bajo Residual Plots.

4.- Click OK en cada recuadro.

Interpretando tus resultados

Usa un cuadro de distribución normal y un histolograma para verificar que tu residual no este desviado considerablemente de la distribución normal.

  • Si la residual viene desde la distribución normal, los puntos tienen una línea recta en la grafica normal y en el histolograma no tiene una forma de campana recta.
  • Si el residual no viene desde una distribución normal, los puntos no continúan en línea recta en la grafica Normal y en el histolograma no tiene forma de campana.

Basado en los recuadros, es razonable asumir que la residual no esta desviada sustanciablemente de la distribución normal. (Normalmente pruebas ejecutadas del residual (no presentadas en este ejemplo) produce que p = valor menos de 0.423.)

Interpretando tus resultados

Usa las graficas de residual contra el ajuste para verificar que las siguientes suposiciones han sido encontradas:

  • Variaciones constantes a través de la combinación de todos los factores.
  • No están fuera de línea los datos.

Si tú ves cualquier tipo de patrón en la grafica, una de estas suposiciones encontradas has sido violada. La tabla abajo resume los tipos de patrones que tú puedes ver:

Los Patrones

Indican………

 La extensión desigual de las residuales a través de los diferentes valores ajustados.

La variación de tu residual no es constante.

Un punto está situado muy lejos del cero.

Fuera de línea.

 

Para los datos del desgaste de pintura, la varianza de la residual aparece bastante constante.

Interpretando tus resultados

Usa la grafica de la residual contra el orden de los datos para verificar que las residuales son independientes.

  • Si hay algún efecto debido a la recolección de los datos, la residual no será aleatoriamente dispersa cerca del cero. Tú serás capaz de detectar este patrón en la grafica.
  • Si no hay algún efecto debido al orden de la recolección de datos las residuales serán aleatoriamente dispersas cerca del cero.

No hay ningún patrón que aparezca en las residuales, por lo tanto las suposiciones de independencia son validas.

Consideraciones finales

Conclusiones prácticas:

Inicialmente un simple análisis de los tipos de pintura no revelo diferencias significativas. Sin embargo cuando Locación fue incluida en el análisis de un bloque de variable, efectos significativos de la pintura fueron revelados.

Esto ilustra una de las ventajas del modelo de Multi-Factor ANOVA:

  • Tú puedes algunas veces disminuir la cantidad de un error inexplicable de variación en la respuesta, si incluyes factores adicionales en el modelo.
  • Tú puedes algunas veces aprovechar recursos investigando dos o más factores en el mismo tiempo.
  • Con un modelo apropiado, tú puedes evaluar interacciones entre dos factores. Esta interacción ocurre cuando los efectos de un factor cambian basándose en el nivel de algún otro factor.

Consideraciones estadísticas:

Para usar Balance ANOVA tus datos deben estar balanceados.

Es importante validar las suposiciones de la residual después dibujando las conclusiones finales de los resultados de cualquier ANOVA.

Modelo Lineal General

Ejemplo 4 Distancia de frenado.

Problema:

Tú quieres conocer si la distancia que le toma a un carro para frenar en un pavimento mojado es afectada por los siguientes factores:

  • El Modelo de la llanta (Llanta).
  • La banda de rodadura (Tread).
  • Si el seguro de freno es adecuado (ABS).

Colección de datos

El mismo carro es utilizado para la recolección de los datos. La distancia requerida para frenar a una velocidad de 40 millas por hora en un pavimento mojado fue medida con cada combinación de llantas, banda de rodadura y el ABS. Corridas experimentales fueron realizadas en orden aleatorio.

Herramientas:

Stat-Table > Cross Tabulation.

Stat-ANOVA > Balanced ANOVA.

Stat-ANOVA > General Linear Model.

Set de datos

BRAKEDIS.MPJ

Nombre

Tipo de datos

Tipo de variable

Niveles

Llanta

Texto

Factor

MX,GT,LS

Banda de rodadura

Numérico

Factor

10, 1.5

ABS

Texto

Factor

Capaz

No capaz

Distancia

Numérico

Respuesta

Modelo lineal General

¿Qué es el Modelo lineal general ( GLM)?

GLM es similar al Balance ANOVA excepto que:

  • Puede ser usado en pruebas de diseño no balanceadas.
  • Puede ser usado también para comparar los niveles individuales de las medias.

¿Cuándo usar el Modelo lineal general?

Usa el GLM cuando tengas respuesta continúas de datos de niveles estables de uno o más factores. El diseño no debe ser balanceado.

Después de aceptar los resultados del ANOVA, tú debes verificar que las siguientes suposiciones acerca de la residual sean validas en tus datos:

  • La residual debe ser independiente (y de esta manera al azar).
  • La residual no debe estar desviada sustanciablemente de la distribución normal.

La residual debe tener constantes variaciones a través de todos los niveles de factor.

¿Por qué usar el Modelo lineal general?

GLM te ayuda a responder preguntas tales como:

  • ¿Hay diferencia en tu producto debido a diferentes factores identificados?
  • ¿Son ciertas combinaciones de niveles de factor ideales?

Por ejemplo,

  • ¿Es el color del plástico generalmente mejor cuando la presión es alta, o depende este de la presión?

Observando los datos en la tabla

Usa CROSS tabulación para crear una tabla con los datos para ver posibles diferencias entre doce combinaciones tratadas.

Cross tabulación

1.- Abre el proyecto BRAKEDIS.MPJ.

2.- Escoge Stat > Table-Statistics descriptive.

3.- En Classification variables enter Tire Tread ABS.

4.- En Asociated variables enter Distancia.

5.- Complete el recuadro como se indica a continuación.

6.- Click OK en cada recuadro.

Interpretando tus resultados

Principales efectos

Note que la media de la distancia de frenado cuando el ABS no es utilizado es de 90.667. Este es más largo que la distancia que requiere para frenar con ABS (74.750) la diferencia es llamada Principales efectos del ABS.

Efectos de interacción

Note que:

  • Cuando el ABS fue no utilizado, el 1.5 mm de la banda de rodadura frena mas rápidamente

( media = 90.16 ) que el 10.mm de banda de rodadura ( media =91.167).

  • Cuando el ABS fue utilizado, el 10.0 mm de banda de rodadura (media = 73.833) frena mas rápidamente que el 1.5 mm de la banda de rodadura"( media = 75.667).

Los efectos son llamados interacción del ABS by tread, porque los efectos de la banda de rodadura dependen del nivel del ABS. (Sin embargo las diferencias no son grandes. Una prueba apropiada revelara que la interacción no es significante.

Analizando tu modelo completo

Usa el balance ANOVA para analizar el modelo completo. El modelo completo contiene todos los posibles efectos e interacciones.

Anotaciones

Para indicar los términos de interacción, simplemente junta los nombre con un asterisco. De esta manera el modelo completo de frenado a distancia de los datos contiene los siguientes términos:

Como un atajo el modelo completo puede ser usado también cargando los datos en barra vertical.

Tire Tread I ABS

Las barras verticales le dicen al minitab que considere los efectos principales e interacciones contenidas en medio de los términos indicados.

Balance ANOVA

1.- Escoge Stat > ANOVA > Balanced ANOVA.

2.-Complete el recuadro como se indica a continuación

3.- Click OK.

Interpretando tus resultados

Usa el Valor de P, para la prueba de significancía de cada término. En este modelo los siguientes efectos son significantes en un 0.05 ∞.

  • Llanta (p = 0.003).
  • ABS (p = 0.000).

Porque hubo solamente dos niveles del ABS (capaz y no capaz), tú sabes que la significancía en los términos refleja diferencias significativas entre los dos niveles.

Prueba de comparación

Porque hubo tres niveles en las llantas, tu quieres realizar una comparación estadística en orden para determinar cuales niveles son diferentes entre cada uno.

El procedimiento Balanced ANOVA no permite comparaciones individuales entre niveles de la media, por eso vas a usar el Modelo lineal general para dirigir las pruebas después de eliminar las no significancías y revisar el residual.

Ajustando el modelo reducido

El paso siguiente para ajustar el modelo reducido es removiendo los términos no significantes. Usa el modelo lineal general para ajustar el modelo con solo la llanta y el ABS. (El modelo proporciona opciones para analizar las diferencias entre niveles individuales de la media).

Tú debes también crear graficas de residual, para poder validar las suposiciones de la prueba.

Modelo Lineal General

1.- Escoge Stat > ANOVA > General Linear Model.

2.- Complete el recuadro como se indica a continuación.

3.- Click Graphs.

4.- Revisa las opciones bajo Residual Plots.

5.- Click OK en cada recuadro.

Interpretando tus resultados

Como es esperado, ambos: Llanta y ABS, tengan una significancía de 0.005 ∞ del nivel en el modelo ajustado.

Interpretando tus resultados

Basado en la grafica de probabilidad normal y en el histolograma es razonable asumir que el residual no esta desviado sustanciablemente de la distribución normal.

Interpretando tus resultados

La grafica de la residual contra el ajuste, confirma que la variación de la residual es bastante constante.

La grafica de la residual contra el orden de los datos no presenta ningún patrón, de esa manera las suposiciones de independencia parecen ser validas.

No parece haber ninguno fuera de línea.

 

Graficando los principales efectos e interacciones

Comparación gráfica de la media

Ahora que tú te has establecido en un modelo, este es usado para visualizar los resultados del análisis de la media utilizando las graficas y los principales efectos e interacciones.

Aunque tú has elegido no incluir todos los términos del modelo final, es de mucha ayuda incluir todos los factores en las graficas para visualizar términos significantes y no significantes.

Principales efectos e interacciones graficas

1.- Elige Stat > ANOVA > Main Effects Plot.

2.- En Response presiona Distance.

3.- En Factors presiona Tire Tread ABS.

4.- Presiona OK.

5.- Elige Stat > ANOVA > Interactions Plot.

6.- En Response presiona Distance.

7.- En Factors presiona Tire Tread ABS.

8.- Presiona OK.

Interpretando tus resultados

La gráfica de efectos principales de llanta y ABS tienen líneas inclinadas, indicando que estos efectos son importantes.

En esta gráfica esta claro que:

  • La Llanta con la distancia mas corta de frenado fue la GT.
  • Las distancias de frenado mas cortas fueron llevadas a cabo con el sistema ABS.

La grafica de la banda de rodadura muestra una pequeña inclinación sugiriendo que los efectos no son significativos. Las bandas de rodadura producen casi idéntica frenada a distancia.

Interpretando tus resultados

Las interacciones de la grafica muestran los dos sentidos de la interacción. Los nombre de los factores a la izquierda de cada grafica son representados en el eje Y, y todos los factores llamados por debajo de cada grafica son representados en el eje X.

Las líneas de cada grafica en su mayor parte paralelas, sugieren que no hay interacción en medio de ningún término. Pero es quizás alguna evidencia de una interacción entre las llantas y la banda de rodadura pero el ANOVA índico que esto no fue significante.

Conduciendo la comparación del desgaste de pintura

Utilice el modelo lineal para probar las diferencias entre los niveles de factores significantes.

General Linear Model

1.- Elija Star > ANOVA > General Linear Model.

2.- Presione F3 para regresar a las opciones generales

3.- En Response enter Distancia.

4.- En Model enter Tire ABS.

5.- Presiona Comparison.

6.- Completa el recuadro como se indica a continuación:

7.- Presiona OK en cada recuadro

Interpretando tus resultados

Use un ∞ de 0.05 para todas las pruebas.

La primera tabla compara las llantas GT con las LS y las MX. Los resultados revelan que el promedio de distancia de frenado obtenidos con las llantas GT es significativamente mas bajo que los obtenidos con cualquier de las otras llantas LS (p = 0.0008) y MX (p = 0.0131).

La segunda tabla compara las llantas LS y MX, donde no hubo diferencias significativas (p = 0.4436)

Consideraciones finales

Conclusiones prácticas

En los términos de frenado y pavimento mojado, la mejor llanta es la GT. También es mejor tener el sistema ABS disponible, y no parece muy importante que la banda de rodadura sea de 10. mm o 1.5 mm de profundidad.

Consideraciones estadísticas

Las ventajas del procedimiento incluyen lo siguiente:

  • Puede ser usado con un modelo desbalanceado.
  • Puede ser usado para evaluar las diferencias entre niveles individuales de medias.

Es importante validar las suposiciones del residual, antes de dibujar cualquier conclusión final de los resultados del ANOVA.

Este análisis incluye factores estables significando que los niveles incluidos fueron de interés directo y no significo que fueran generalizados a otros niveles. El procedimiento del modelo lineal general puede también ser usado con factores aleatorios, los cuales son factores para que los niveles sean seleccionados aleatoriamente y sean proyectados para representar una mayor población de posibles niveles.

Un ejemplo excelente es un estudio de un gage R&R.

Todos los factores en este análisis fueron cruzados significando por ejemplo, que cada nivel de llanta puede ser probado con cada nivel de banda de rodadura. Los factores son considerados jerarquizados si todos lo niveles de un factor suceden completamente dentro de un nivel de otro.

Ejercicio 4.1 Prueba de vinos

Problema:

Tú tratas de determinar si existen diferencias significativas en la calidad de tres vinos: Matador, Conquistador y Saeta.

Colección de datos

10 jueces de vinos probaron tres vinos cada uno y cada uno califico su calidad. El orden de las pruebas fue aleatorio y cada juez pruebo los vinos en diferente orden.

Instrucciones:

1.- Use el modelo lineal General para analizar los puntajes en función del vino.

  • Incluye los jueces en el bloque de variables para reducir la variabilidad.
  • Realiza el ajuste (Fits) y el residual.
  • Incluye el pairwise comparación en el factor del vino en tus resultados.

2.- Genera los efectos principales en la gráfica de vinos.

3.- usa Stat > Regression > Residual Plots para validar las suposiciones del modelo.

Set de Datos

RIOJA.MPJ

Ejercicio 4.2 Contenido de fosfato

Problema

Tú quieres evaluar cuanto tiempo toma el uso del gravímetro contra el método spectometrico para medir el contenido fosfato que contienen dos tipos de material.

Colección de datos

Seis ingenieros tomaron muestras del contenido de fosfato de cada material usando cada método.

Los datos son de J. Neter, W. Wasserman y M.H. Kutner (1985) Aplicación lineal del modelo estadístico, segunda edición Irwin , In. Pagina 936.

Instrucciones

1.- Use el modelo lineal general para analizar el tiempo como una función del material y del método.

  • Incluye a los ingenieros en el bloque de variables para reducir la variabilidad.
  • Realiza el ajuste (Fits) y el residual.
  • Incluye el pairwise comparación y la interacción entre el método * material en tus resultados.

2.- Genera una grafica de interacción del material * método.

3.- Usa Stat > Regression > Residual Plot para validar el modelo de suposiciones.

Set de datos

PHOSPHAY.MPJ

 

Trabajo elaborado por Lic. Cecilia C. Díaz García

Lic. Angélica Esquivel Ing. Maria ValleMaestría en Administración y Liderazgo Materia Estadística para administradores Alumnas de la Universidad del Noreste de Coahuila

Partes: 1, 2, 3
 Página anterior Volver al principio del trabajoPágina siguiente