Conceptos básicos de Probabilidades y Estadística Inferencial (página 2)
Enviado por Mario Orlando Suárez Ibujes
A diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos valores, el análisis de varianza emplea la razón de las estimaciones, dividiendo la estimación intermediante entre la estimación interna
Esta razón F fue creada por Ronald Fisher (1890-1962), matemático británico, cuyas teorías estadísticas hicieron mucho más precisos los experimentos científicos. Sus proyectos estadísticos, primero utilizados en biología, rápidamente cobraron importancia y fueron aplicados a la experimentación agrícola, médica e industrial. Fisher también contribuyó a clarificar las funciones que desempeñan la mutación y la selección natural en la genética, particularmente en la población humana.
El valor estadístico de prueba resultante se debe comparar con un valor tabular de F, que indicará el valor máximo del valor estadístico de prueba que ocurría si H0 fuera verdadera, a un nivel de significación seleccionado. Antes de proceder a efectuar este cálculo, se debe considerar las características de la distribución F
i) Características de la distribución F
– Existe una distribución F diferente para cada combinación de tamaño de muestra y número de muestras. Por tanto, existe una distribución F que se aplica cuando se toman cinco muestras de seis observaciones cada una, al igual que una distribución F diferente para cinco muestras de siete observaciones cada una. A propósito de esto, el número distribuciones de muestreo diferentes es tan grande que sería poco práctico hacer una extensa tabulación de distribuciones. Por tanto, como se hizo en el caso de la distribución t, solamente se tabulan los valores que más comúnmente se utilizan. En el caso de la distribución F, los valores críticos para los niveles 0,05 y 0,01 generalmente se proporcionan para determinadas combinaciones de tamaños de muestra y número de muestras.
– La distribución es continua respecto al intervalo de 0 a + 8. La razón más pequeña es 0. La razón no puede ser negativa, ya que ambos términos de la razón F están elevados al cuadrado. Por otra parte, grandes diferencias entre los valores medios de la muestra, acompañadas de pequeñas variancias muestrales pueden dar como resultado valores extremadamente grandes de la razón F.
– La forma de cada distribución de muestreo teórico F depende del número de grados de libertad que estén asociados a ella. Tanto el numerador como el denominador tienen grados de libertad relacionados.
ii) Determinación de los grados de libertad
Los grados de libertad para el numerador y el denominador de la razón F se basan en los cálculos necesarios para derivar cada estimación de la variancia de la población. La estimación intermediante de variancia (numerador) comprende la división de la suma de las diferencias elevadas al cuadrado entre el número de medias (muestras) menos uno, o bien, k – 1. Así, k – 1 es el número de grados de libertad para el numerador.
En forma semejante, el calcular cada variancia muestral, la suma de las diferencias elevadas al cuadrado entre el valor medio de la muestra y cada valor de la misma se divide entre el número de observaciones de la muestra menos uno, o bien, n – 1. Por tanto, el promedio de las variancias muestrales se determina dividiendo la suma de las variancias de la muestra entre el número de muestras, o k. Los grados de libertad para el denominador son entonces, k(n -l).
4.3) PRUEBAS DE HIPÓTESIS PARA PROPORCIONES
Las pruebas de proporciones son adecuadas cuando los datos que se están analizando constan de cuentas o frecuencias de elementos de dos o más clases. El objetivo de estas pruebas es evaluar las afirmaciones con respecto a una proporción (o Porcentaje) de población. Las pruebas se basan en la premisa de que una proporción muestral (es decir, x ocurrencias en n observaciones, o x/n) será igual a la proporción verdadera de la población si se toman márgenes o tolerancias para la variabilidad muestral. Las pruebas suelen enfocarse en la diferencia entre un número esperado de ocurrencias, suponiendo que una afirmación es verdadera, y el número observado realmente. La diferencia se compara con la variabilidad prescrita mediante una distribución de muestreo que tiene como base el supuesto de que
es realmente verdadera.
En muchos aspectos, las pruebas de proporciones se parecen a las pruebas de medias, excepto que, en el caso de las primeras, los datos muestrales se consideran como cuentas en lugar de como mediciones. Por ejemplo, las pruebas para medias y proporciones se pueden utilizar para evaluar afirmaciones con respecto a:
1) Un parámetro de población único (prueba de una muestra)
2) La igualdad de parámetros de dos poblaciones (prueba de dos muestras), y
3) La igualdad de parámetros de más de dos poblaciones (prueba de k muestras). Además, para tamaños grandes de muestras, la distribución de muestreo adecuada para pruebas de proporciones de una y dos muestras es aproximadamente normal, justo como sucede en el caso de pruebas de medias de una y dos muestras.
A) PRUEBA DE PROPORCIONES DE UNA MUESTRA
Cuando el objetivo del muestreo es evaluar la validez de una afirmación con respecto a la proporción de una población, es adecuado utilizar una prueba de una muestra. La metodología de prueba depende de si el número de observaciones de la muestra es grande o pequeño.
Como se habrá observado anteriormente, las pruebas de grandes muestras de medias y proporciones son bastante semejantes. De este modo, los valores estadísticos de prueba miden la desviación de un valor estadístico de muestra a partir de un valor propuesto. Y ambas pruebas se basan en la distribución normal estándar para valores críticos. Quizá la única diferencia real entre las ambas radica en la forma corno se obtiene la desviación estándar de la distribución de muestreo.
Esta prueba comprende el cálculo del valor estadístico de prueba Z
La primera alternativa establece una prueba de cola derecha, la segunda, izquierda y la tercera, una prueba de dos colas.
B) PRUEBA DE PROPORCIONES DE DOS MUESTRAS
El objetivo de una prueba de dos muestras es determinar si las dos muestras independientes fueron tomadas de dos poblaciones, las cuales presentan la misma proporción de elementos con determinada característica. La prueba se concentra en la diferencia relativa (diferencia dividida entre la desviación estándar de la distribución de muestreo) entre las dos proporciones muestrales. Diferencias pequeñas denotan únicamente la variación casual producto del muestreo (se acepta H0), en tanto que grandes diferencias significan lo contrario (se rechaza H0). El valor estadístico de prueba (diferencia relativa) es comparado con un valor tabular de la distribución normal, a fin de decidir si H0 es aceptada o rechazada. Una vez más, esta prueba se asemeja considerablemente a la prueba de medias de dos muestras.
La hipótesis nula en una prueba de dos muestras es
C) PRUEBA DE PROPORCIONES DE k MUESTRAS
La finalidad de una prueba de k muestras es evaluar la aseveración que establece que todas las k muestras independientes provienen de poblaciones que presentan la misma proporción de algún elemento. De acuerdo con esto, las hipótesis nula y alternativa son
En una muestra se puede dar un conjunto de sucesos, los cuales ocurren con frecuencias observadas "o"(las que se observa directamente) y frecuencias esperadas o teóricas "e" (las que se calculan de acuerdo a las leyes de probabilidad).
Por lo tanto el valor estadístico de prueba para este caso es la prueba ji cuadrado o conocida también como chi cuadrado
Como sucede con las distribuciones t y F, la distribución ji cuadrado tiene una forma que depende del número de grados de libertad asociados a un determinado problema.
Para obtener un valor crítico (valor que deja un determinado porcentaje de área en la cola) a partir de una tabla de ji cuadrado, se debe seleccionar un nivel de significación y determinar los grados de libertad para el problema que se esté resolviendo.
D) BONDAD DE AJUSTE DE LA PRUEBA JI CUADRADO
Se emplea para determinar la calidad del ajuste mediante distribuciones teóricas (como la distribución normal o la binomial) de distribuciones empíricas (o sea las obtenidas de los datos de la muestra)
En realidad, una prueba de bondad de ajuste es una prueba de una muestra, pero en la que la población se ha dividido en k proporciones. Así pues, difiere de una prueba de proporciones de una muestra, estudiada anteriormente, la cual incluye sólo dos categorías (éxito y fracaso) en la población.
Los grados de libertad para una prueba de bondad de ajuste son (k-1) – c, en donde
k = número de categorías o clases
c = número de valores estadísticos o parámetros utilizados de la muestra que se utilizan para determinar frecuencias esperadas (número de decimales de la frecuencia esperada)
Gráficas de control de la calidad
5.1) DEFINICIÓN DE GRÁFICAS DE CONTROL.- Una herramienta ampliamente utilizada en cada enfoque al analizar el proceso de recolección secuencial de datos a lo largo del tiempo es la gráfica de control.
Las gráficas de control permiten monitorear la variación en una característica del producto o servicio a lo largo del tiempo. Las gráficas de control se utilizan para estudiar el desempeño pasado, para evaluar las condiciones presentes, o para predecir los resultados futuros. La información obtenida al analizar una gráfica de control constituye la base para el proceso de mejoramiento. Los diferentes tipos de gráficas de control nos permiten analizar diferentes tipos de variables críticas para la calidad (CPC): variables categóricas como la proporción de habitaciones de hotel no aceptables en términos de disponibilidad de comodidades y el correcto funcionamiento de todos los electrodomésticos en la habitación; variables discretas como el número de huéspedes que registraron alguna queja durante la semana; y variables continuas como el tiempo requerido para entregar el equipaje en la habitación. Además de proporcionar una exhibición visual de los datos que representan un proceso, la gráfica de control hace énfasis principalmente en separar las causas especiales de las causas comunes de la variación.
Las causas especiales de variación representan grandes fluctuaciones o patrones en los datos que no son inherentes al proceso. Estas fluctuaciones a menudo son causadas por cambios en el proceso que representan problemas para corregir u oportunidades para aprovechar. Algunas organizaciones se refieren a las causas especiales de variación como causas asignables de variación.
Las causas comunes de variación representan la variabilidad inherente que existe en un proceso. Estas fluctuaciones consisten en numerosas pequeñas causas de variabilidad que operan aleatoriamente o por casualidad, Algunas organizaciones se refieren a las causas comunes de variabilidad como causas aleatorias de variación.
La distinción entre las dos causas de variación es crucial porque las causas especiales de variación no forman parte de un proceso y son corregibles o explotables sin cambiar el sistema. Sin embargo, las causas comunes de variación se reducen tan sólo cambiando el sistema. Estos cambios sistémicos son responsabilidad de la administración.
Las gráficas de control nos permiten monitorear un proceso e identificar la presencia o ausencia de causas especiales. Al hacerlo así, las gráficas de control nos ayudan a prevenir dos tipos de errores. El primer tipo de error implica la creencia de que un valor observado representa una causa especial de variación cuando en realidad se debe a una causa común de variación del sistema. Tratar una causa común de variación como si fuera una causa especial de variación a menudo tiene como consecuencia el sobreajuste de un proceso. Este sobreajuste, conocido como manipulación, incrementa la variación del proceso. El segundo tipo de error implica tratar una causa especial de variación como si fuera una causa común de variación. Este error es el resultado de no tomar una acción correctiva inmediata cuando es necesario. Aunque ambos tipos de errores pueden ocurrir aun cuando usemos una gráfica de control, es menos probable que suceda.
Para construir una gráfica de control, se recolectan muestras de las salidas de un proceso a lo largo del tiempo. Las muestras utilizadas para construir gráficas de control se conocen como subgrupos. Para cada subgrupo (es decir, muestra), se calcula el valor de un estadístico asociado con una variable CPC. Los estadísticos utilizados comúnmente incluyen la fracción disconforme y la media y el rango de una variable numérica. Entonces se grafican los valores contra el tiempo y se agregan los límites de control a la gráfica. La forma más común de gráfica de control establece límites de control que están dentro de ±3 desviaciones estándar de la medida estadística de interés. La ecuación media del proceso ( 3 desviaciones estándar define, en general, los límites de control superior e inferior para las gráficas de control.
i) Construcción de límites de control
Media del proceso ±3 desviaciones estándar .Por lo que el Límite de control superior (LCS) = media del proceso +3 desviaciones estándar
Límite de control inferior (LIC) = media del proceso -3 desviaciones estándar
Cuando se establecen estos límites de control, se evalúa la gráfica de control tratando de encontrar un patrón que pudiera existir en los valores a lo largo del tiempo y determinando si algunos puntos caen fuera de los límites de control. Las siguientes figuras ilustran tres diferentes situaciones.
En el panel A, no existe un patrón aparente de los valores a lo largo del tiempo y no hay puntos que caigan fuera del límite de control de 3 desviaciones estándar. El proceso parece estable y contiene sólo causas comunes de variación. El panel B, por el contrario, contiene dos puntos que caen fuera de los límites de control de las 3 desviaciones estándar. Se deben investigar estos puntos para tratar de determinar las causas especiales que llevan a su ocurrencia. Aunque el panel C no tiene ningún punto fuera de los límites de control, tiene una serie de puntos consecutivos por arriba del valor promedio (la línea central), así como una serie de puntos consecutivos por debajo del valor promedio. Además, se observa claramente una tendencia global descendente. Se debe investigar esta situación para tratar de determinar qué podría haber causado ese patrón.
Detectar una tendencia no es siempre tan obvio. Hay otras dos reglas simples que nos permiten detectar un cambio en el nivel medio de un proceso:
– Ocho o más puntos consecutivos que caen por arriba de la línea central u ocho o más puntos consecutivos que caen por debajo de la línea central.
– Ocho o más puntos consecutivos se mueven hacia arriba en valor u ocho o más puntos consecutivos se mueven hacia abajo en valor.
Se dice que un proceso cuya gráfica de control indica una condición fuera de control (un punto fuera de los límites de control o la exhibición de una tendencia) está fuera de control. Un proceso fuera de control contiene tanto causas comunes de variación como causas especiales de variación. Puesto que las causas especiales de variación no forman parte del diseño del proceso, un proceso fuera de control es impredecible. Una vez que se determina que un proceso está fuera de control, se deben identificar las causas especiales de variación que están provocando las condiciones fuera de control. Si las causas especiales actúan en detrimento de la calidad del producto o servicio, se requiere elaborar planes para eliminar esta fuente de variación. Cuando una causa especial incrementa la calidad, se debería cambiar el proceso para que la causa especial se incorpore dentro del diseño del proceso. Por lo tanto, esta causa especial benéfica se vuelve una causa común fuente de variación y el proceso se mejora.
Se dice que un proceso cuya gráfica de control no indica condiciones fuera de control está bajo control. Un proceso bajo control contiene únicamente causas comunes de variación. Puesto que estas fuentes de variación son inherentes al proceso en sí mismo, un proceso bajo control es predecible. En ocasiones se dice que los procesos bajo control están en un estado de control estadístico. Cuando un proceso se encuentra bajo control, usted debe determinar si la cantidad de causa común de variación en el proceso es lo suficientemente pequeña como para satisfacer a los usuarios de los productos o servicios. Si la causa común de variación es lo suficientemente pequeña como para satisfacer al cliente, entonces se utiliza la gráfica de control para monitorear el proceso sobre una base continua para asegurarse de que el proceso permanece bajo control. Si la causa común de variación es demasiado grande, se requiere alterar el proceso en sí mismo.
5.2) GRÁFICAS DE CONTROL PARA VARIABLES
Estas gráficas de control ayudan a la detección de la variación de causa asignable (variación en el producto o proceso de producción que señala que el proceso está fuera de control y que se requieren medidas correctivas)
A) La Gráfica R
Mide la variación en el rango de las muestras. Aunque la desviación estándar es una medida que depende de la dispersión, las técnicas de control de calidad generalmente confían en el rango como un indicio de la variabilidad del proceso.
B)
Se tiene entonces:
Límite superior de control para las medias
Siendo k = número de muestras
5.3) GRÁFICAS DE CONTROL PARA ATRIBUTOS
A) Gráfica de control para la proporción de artículos disconformes: la gráfica p
Se utilizan diferentes tipos de gráficas de control para monitorear procesos y para determinar si se encuentra presente en el proceso alguna causa especial de variación. Las gráficas de atributos se utilizan para variables categóricas o discretas. En esta sección se estudiará la gráfica p, que se utiliza cuando los elementos que son muestreados se clasifican de acuerdo a si se conforman o no con los requerimientos definidos operacionalmente. Por lo tanto, la gráfica p nos ayuda a monitorear y analizar la proporción de elementos disconformes que están en las muestras repetidas (es decir, subgrupos) que se seleccionan de un proceso.
Cualquier valor negativo para el límite de control inferior significa que el límite de control inferior no existe.
Otros casos de Gráficas p
En la construcción de las gráficas p simplemente se toma nota de la proporción de artículos defectuosos en una muestra. Esta proporción, p es
B) Las Gráficas c
Estas gráficas están diseñadas para detectar el número de defectos en una sola unidad. Al desarrollar la gráficas p una unidad completa se consideraba defectuosa o no defectuosa. Sin embrago, en muchos casos, la presencia de uno o más defectos puede no producir necesariamente una unidad inaceptable. Un fabricante de muebles puede encontrar defectos menores en un sofá y sin embargo no considerarlo inaceptable. Si los defectos por cada 100 metros cuadrados de tapetes para el piso fueran pocas y menores, el fabricante puede decidir ofrecerlos en venta a pesar de estas imperfecciones. Una gráfica c se utiliza para analizar el número de imperfecciones por unidad de producción.
La gráfica c tiene que ver con el número de imperfecciones (defectos) por unidad (por sofá o por cada 100 metros cuadrados).
Los límites de control se establecen alrededor del número de defectos en la población, c. En el caso probable de que c sea desconocido, se estima mediante el número promedio de defectos en las unidades (número de defectos dividido para el número de muestras)
Una unidad puede constar de un solo artículo como un sofá, o una pieza de tapete de 100 metros cuadrados, o por ejemplo puede contener, un envío de 50 páginas impresas en las cuales se detectaron errores tipográficos. La unidad debe ser consistente en tamaño, número o área. Anteriormente se definió la desviación estándar del número de ocurrencias como la raíz cuadrada del número promedio de defecto. Así:
Desviación estándar para el número de defectos
Nota: Los ejemplos ilustrativos resueltos de cada tema se los puede obtener de las siguientes referencias bibliográficas
Referencias bibliográficas
SUÁREZ, Mario (2012), Interaprendizaje de Probabilidades y Estadística Inferencial con Excel, Winstats y Graph, Ibarra, Ecuador.
SUÁREZ, Mario, y TAPIA, Fausto (2012), Interaprendizaje de Estadística Básica, Universidad Técnica de Norte Ibarra, Ecuador.
SUÁREZ, Mario, (2012), Interaprendizaje de Probabilidades y Estadística Inferencial con Excel, Winstats y Graph. http://repositorio.utn.edu.ec/handle/123456789/940
SUÁREZ Mario, (2011), Análisis Combinatorio, http://repositorio.utn.edu.ec/handle/123456789/761
SUÁREZ, Mario, (2011), Distribución Binomial, http://repositorio.utn.edu.ec/handle/123456789/771
SUÁREZ, Mario, (2011), Cálculo del tamaño de la muestra, http://repositorio.utn.edu.ec/handle/123456789/765
SUÁREZ, Mario, (2012), Gráficas de control de la calidad para variables, www.monografias.com/trabajos91
http://repositorio.utn.edu.ec/handle/123456789/24
http://www.monografias.com/usuario/perfiles/mario_suarez_7/monografias
https://docentesinnovadores.net/Usuarios/Ver/29591
http://es.scribd.com/mariosuarezibujes
Autor:
Mario Orlando Suárez Ibujes
Página anterior | Volver al principio del trabajo | Página siguiente |