Descargar

Análisis de los métodos estadísticos a la solución de problemas técnico

Enviado por yuriel.laffita


     

    Indice1. Introducción 2. Desarrollo 3. Diseño de experimento 4. Series Cronológicas 5. Conclusiones 6. Bibliografía

    1. Introducción

    Podemos decir que en estos tiempos en el entorno empresarial cubano se hace muy poco uso y quizás nulo de las técnicas y métodos estadísticos que resultan de vital importancia en la solución de disímiles problemas que se dan a diario en nuestras empresas, mientras el mundo de la informática se desarrolla cada vez más y son muchos los programas que han surgido entre los que se encuentran varios de análisis estadísticos. Nuestro trabajo se desarrolló con el fin de conocer la situación del peso de las gallinas pertenecientes a la Unidad Económica Básica "Frank País" de Moa en función de la cantidad de pienzo y agua que consumen, así como la influencia de los alimentos que ingerimos a diario y los distintos horarios del día en los valores de presión arterial.

    2. Desarrollo

    Regresión Lineal Simple Y Múltiple Problema 1. En la Unidad Económica Básica "Frank País" de Moa se desea conocer el peso promedio que alcanzarán las gallinas en el próximo trimestre. A final de cada trimestre estas gallinas son distribuidas a la población y se inicia nuevamente el ciclo de crecimiento. Se conoce la cantidad de pienzo y agua consumida por estas juega un papel determinante en el peso de las mismas. En el actual trimestre se realizó un estudio donde se obtuvieron los datos para 35 gallinas. (Ver anexo 1). (Los datos recopilados no son reales).

    Análisis de la Regresión Simple. Variables:

    • Variable dependiente: Y. Peso de las gallinas en libras (lb.).
    • Variable independiente: X. Cantidad de pienzo consumida en kilogramos (Kg.)

    Dócima de la pendiente. Planteamiento de las hipótesis:

    Si se acepta H0 : la variable no es significativa.(No existe relación lineal entre Y y X ).

    Si se rechaza H0 la variable es significativa (Existe relación lineal entre Y y X ).

    F. variación

    S.C

    G.L

    C.M

    F

    P

    Regresión

    153,198

    1

    153,198

    90,58

    0,0000

    Residuos

    55,815

    33

    1,69136

    Total

    209,013

    34

     

    El coeficiente de correlación = 0,856131(las variables se encuentran relacionadas linealmente en un 85,6131%). R2 = 73,2959 (Se ha eliminado un 73,2959 % de los errores con la regresión). El error estándar = 1,30052 Como el valor de probabilidad es 0,0000<0,05 se RH0 lo que quiere decir que el pienzo es determinante en el peso de las gallinas.

    La ecuación determinada para esta estimación es:

    Dócima de la falta de ajuste.

    (El modelo lineal proporciona un buen ajuste).

    (El modelo lineal no proporciona un buen ajuste).

     

    El modelo que mejor ajusta es el Square Root-X

    F. variación

    S.C

    G.L

    C.M

    F

    P

    F.A

    36,1583

    24

    1,5066

    0,69

    0,7771

    E.P

    19,6567

    9

    2,18407

    Como el valor de probabilidad 0,7771>0,10 se AH0 por lo que el modelo proporciona un buen ajuste.

    Análisis de la Regresión múltiple: Variables:

    • Variable dependiente: Y. Peso de las gallinas en libras (lb.).
    • Variable independiente: X1 .cantidad de pienzo consumida en kilogramos (Kg.).
    • Variable independiente: X2 .cantidad de agua consumida en litros (L.).

    Dócima de la pendiente

    F. variación

    S.C

    G.L

    C.M

    F

    P

    Regresión

    177,586

    2

    88,7929

    90,41

    0,0000

    Residuos

    31,4272

    32

    0,982099

    Total

    209,013

    34

    R2 = 84,964 % R2 ajustada =84,0243 % Error estándar =0,991009 Error medio absoluto = 0,742858 Estadístico de Durbin Watson = 1,76054. Como la probabilidad es menor que 0,05 entonces se RH0, lo que indica que algunas de estas variables son útiles para hacer estimaciones del peso de las gallinas (Y).

    Método paso a paso.(paso alante ) Con este método podemos determinar cuáles variables del modelo son significativas. Estadígrafo para entrar = 4,14911 Estadígrafo para remover = 4,14911 En el paso número cero tenemos cero variables en el modelo con 34 G.L para el error y un coeficiente de determinación de 0,00 %. En el paso número uno adicionamos la variable X1 con un estadígrafo para entrar de 87,4949 y como este valor es mayor que 4,14911 esta variable queda en el modelo con 33 G.L para el error y un coeficiente de determinación de 72,61 %. En el paso número dos adicionamos la variable X2 con un estadígrafo para entrar de 26,2859 y como este valor es mayor que 4,14911 esta variable queda en el modelo con 32 G.L para el error y un coeficiente de determinación de 84,96 %. Como podemos observar, tanto el pienzo como el agua que consumen las gallinas son significativas en el peso de las mismas.

    El modelo tiene la siguiente ecuación:

    Verificación de supuestos: Normalidad: Si aproximadamente el 95 % de los residuos están en el intervalo de , entonces no hay razón para rechazar el supuesto de normalidad.

    El intervalo es (-1,982018; 1,982018) Se cumple el supuesto de normalidad ya que el 94,29 % de los errores aleatorios se encuentran dentro del intervalo indicado.

    Homocedasticidad:

    (Hay Homocedasticidad)

    Algún difiere (No hay Homocedasticidad)

    n =35 c = 3 p =3 S.C Residual G.1 = 22, 2067 S.C Residual G.2 = 24,306

    F = 1, 0945345

    1,0945345<2,57693

    Se acepta H0 por lo que se cumple el supuesto de Homocedasticidad. No autocorrelación:

    (No hay autocorrelación).

    (Hay autocorrelación)

    n =35

    dl =1,343 dv =1,584 RH0 AH0 RH0 0 1,343 1,584 2,416 2,657 4 d =1,76054. Se encuentra en la región de aceptación por lo que se cumple este supuesto. No multicolinialidad:

    (No hay multicolinialidad)

    (Si hay multicolinialidad)

    R.C:

    R.C:

    > 4,13927

    Se RH0 por lo no se cumple el supuesto de no multicolinialidad. Haciendo un pronóstico del peso que debería alcanzar una gallina para un consumo de pienzo de 10,6 Kg. y 9 L de agua obtuvimos un valor de 10,5669 con un error estándar 1,04204.

    3. Diseño de experimento

    Problema 2. En un estudio realizado por el ministerio de salud pública se obtuvo que la mayor parte de la población cubana que padece de Hipertensión Arterial se concentra en las provincias orientales. Según criterios médicos una de las causas fundamentales de tal enfermedad es el régimen alimenticio que llevan las personas. Se pudo observar además que los alimentos que se consumen no provocan el mismo efecto en la presión para los distintos horarios del día. Es interés de todos conocer cuáles son los alimento que podemos consumir en mayor o menor medida, los horarios en que son menores y mayores los valores de tensión arterial, así como la mejor y la peor combinación de estos factores. Para darle respuestas a estas interrogantes se tomaron muestras de valores de presión por 6 días en diferentes horarios del día de una persona. (Ver anexo 2).

    Análisis de varianza para datos tipo III

    F. variación

    S.C

    G.L

    C.M

    F

    P

    P. Efectos

    A: Factor A.

    1733,33

    2

    866,667

    39,00

    0,0024

    B: Factor H.

    1200,0

    2

    600

    27,00

    0,0048

    C: Réplic.

    5,55556

    1

    5,55556

    0,25

    0,6433

    Interacción

    AB

    266,667

    4

    66,6667

    3,00

    0,1562

    AC

    311,111

    2

    155,556

    7,00

    0,0494

    BC

    44,4444

    2

    22,2222

    1,00

    0,4444

    Residuos

    88,8889

    4

    22,2222

    Total

    3650,0

    17

    Analizando el P-value del factor A. se obtuvo que para se rechaza H0 lo que significa que hay diferencias significativas entre los alimentos que se consumen, por lo que la variable es significativa en la inestabilidad de la presión. Haciendo el mismo análisis para el factor H. se obtuvo que para se rechaza H0 lo que significa que hay diferencias significativas entre los horarios del día en que se toma la presión, por lo que la variable es significativa en la inestabilidad de la presión. Haciendo el análisis para las réplicas se obtuvo que para se acepta H0 lo que significa que la variable no es significativa en la inestabilidad de la presión. En las interacciones tenemos que solo es significativa la interacción del factor A con las réplicas. Para obtener en cuáles horarios y en cuáles alimentos están estas diferencias significativas se uso del método de Duncan obteniéndose: Pruebas de rangos múltiples para los datos por el Factor A.

    Método de Duncan con 95 %

    Factor A.

    Conteo

    Media LS

    Grupos Homogéneos

    Verduras

    Harina

    Sal

    6

    6

    6

    118,333

    135,0

    141,667

    X

    X

    X

    Contraste Diferencia

    Harina-sal

    Harina-verduras

    Sal-verduras

    -6,66667

    *16,6667

    *23,3333

    De aquí se deduce que existe homogeneidad entre los alimentos harina y sal y existen diferencias significativas entre harina-verduras y sal-verduras.

    Pruebas de rangos múltiples para los datos por el Factor H.

    Método de Duncan con 95 %

    Factor H.

    Conteo

    Media LS

    Grupos Homogéneos

    Meridiano

    Noche

    mañana

    6

    6

    6

    121,667

    131,667

    141,667

    X

    X

    X

    Contraste Diferencia

    Mañana-meridiano

    Mañana-noche

    Meridiano-noche

    *20,0

    *10,0

    *-10,0

    De aquí se obtiene que existen diferencias significativas entre los tres horarios. Para el Factor A. Chequeo de varianza. Prueba C. de Cochran`s: 0,565217 P-value = 0,279372 Prueba de Bartlett`s: 1,15598 P-value = 0,368475 En la prueba de Cochran`s P-value > 0,05 En la prueba de Bartlett`s P-value > 0,05 Se cumple el supuesto de igualdad de varianza.

    Para el Factor H. Chequeo de varianza Prueba C. de Cochran`s: 0,442177 P-value = 0,749976 Prueba de Bartlett`s: 1,17879 P-value = 0,322074 En la prueba de Cochran`s P-value > 0,05 En la prueba de Bartlett`s P-value > 0,05 Se cumple el supuesto de igualdad de varianza.

    Para el Factor Combi. Pruebas de rangos múltiples para los datos por el Facto Combi.

    Método de Duncan con 95 %

    Factor Combi.

    Conteo

    Media

    Grupos Homogéneos

    8

    9

    7

    5

    2

    6

    3

    4

    1

    2

    2

    2

    2

    2

    2

    2

    2

    2

    115,0

    115,0

    125,0

    125,0

    125,0

    135,0

    145,0

    145,0

    155,0

    X

    X

    XX

    XX

    XX

    XX

    XX

    XX

    X

    Con el experimento anterior llegamos a la conclusión de que los alimentos que debemos consumir en mayor proporción son las verduras y los que menos debemos consumir son aquellos que contengan alto contenido de sal. El horario del día en que la presión alcanza menores valores es el meridiano y mayores valores por la mañana. La mejor combinación es verduras-meridiano y la peor sal-mañana.

    4. Series Cronológicas

    Analizando el problema anterior pero con datos correspondientes a cuatro semanas se desea analizar el comportamiento de la presión en cada semana así podría comportarse en los próximos días. (Ver anexo 3).

    1. Tt = B0Media: 139,6429 Varianza: 153,4439 Modelo híbrido.

    2. Serie de tendencia constante estacional con período 7.

      B0 =139,643 p = 7 n = 28 E (1) =1,074 E (2) = 0,967 E (3) = 1,074 E (4) = 0,967 E (5) = 0,859 E (6) = 0,985 E (7) = 1,074 Varianza: 63,7500 Desv. Típica: 7,9844

    3. Estimación y chequeo.
    4. Diseño de pronóstico.

    Horizonte (K): 2 N = 28 m = 28 n = 14 Función de pronóstico:

    E (1) = 1,060 E (2) = 0,971 E (3) = 1,065 E (4) = 0,975 E (5) = 0,851 E (6) = 0,953 E (7) = 1,094

    Media de los errores: – 5,361 Suma de cuadrados: 980,298 Cuadrado Medio: 75,405 Raíz del Cuadrado Medio: 8,683752

    Cálculo del intervalo de confianza para un nivel de confianza de 95 %. Pronóstico para T = 30: 132,7373 Intervalo de confianza para el pronóstico (115,09; 150,38) Desviación Estándar (1,25 DAP):9,0026 Valor del DAP: 7,20 Coeficiente de alisamiento del DPA: 0,250

    5. Conclusiones

    Consideramos que en dicho trabajo hemos cumplido con los objetivos propuestos debido a que se puso en práctica los conocimientos adquiridos en clases, con la aplicación de métodos estadísticos en la resolución de problemas, con el uso de paquetes de programas profesionales. Obtuvimos como resultados que en el peso de las gallinas juega un papel importante la cantidad de pienzo y agua consumida; que los alimentos que ingerimos a diario, los diferentes horarios del día y la combinación de estos factores influyen significativamente en los valores de presión arterial.

    Recomendaciones Exhortamos que se continúen realizando estos trabajos investigativos debido a que nos permite elevar nuestros conocimientos y llevarlos a la práctica, logrando formar profesionales más integrales, los cuales en futuro pueden rescatar aquellas técnicas estadísticas que se han perdido. Recomendamos además que la hora de seleccionar los alimentos a ingerir tengamos presentes, cuáles son aquellos más beneficiosos y los que resulten más perjudiciales; que preferentemente predominen en nuestras mesas las verduras y que en aquellos horarios tiende a alcanzar mayores valores evitemos consumir alimento que contribuyen a elevar la misma.

    6. Bibliografía

    • García Francis, Ramón y Coautores: Problemas Resueltos y Propuestos de Estadística Matemática II. Editorial Pueblo y Educación. La Habana, 1986.
    • Guyon Dalmau, Luis y Coautores: Estadística Matemática II. Ediciones Avenida del Bosque Nr. 168. La Habana, 1986 (Dos tomos).
    • López Planes, Reinaldo: Diseño Estadístico de experimento.
    • Probabilidades y Estadística para Ingenieros. Segunda parte. Cuarta Edición

    Anexo 1.

    Datos del problema 1.

    N.

    Y

    (Peso en lb.)

    X1

    (Cant. Pienzo en Kg.)

    X2

    (Cant. Agua en L.)

    1

    5

    8

    6

    2

    8

    9,5

    7,4

    3

    10

    11

    8,4

    4

    9

    10

    7,9

    5

    12

    13

    8

    6

    5,6

    8,5

    7

    7

    7,3

    8

    8

    8

    6,2

    7

    6

    9

    5,5

    9

    4

    10

    3

    6

    5

    11

    8,5

    7

    7

    12

    7

    6,5

    6

    13

    4

    6,2

    5

    14

    4,5

    7

    5,6

    15

    5,8

    9

    6,2

    16

    7,6

    8

    6,9

    17

    3,9

    5,7

    3,8

    18

    9,2

    11

    7,5

    19

    10,6

    11,5

    8,3

    20

    8,8

    8,4

    6,9

    21

    7,9

    9

    5,8

    22

    9,6

    10

    8,5

    23

    6,8

    8,k9

    5,9

    24

    4,7

    7,2

    5,2

    25

    8,6

    9

    8

    26

    13,5

    15

    9

    27

    3,5

    6,9

    6

    28

    4,29

    6,82

    5,76

    29

    8,54

    7,89

    7,28

    30

    9,08

    8,76

    8,45

    31

    10,22

    9,56

    8,98

    32

    5,63

    7,31

    5,82

    33

    6,58

    8,02

    7,21

    34

    7,91

    7,79

    6,88

    35

    8,33

    9,01

    8,32

    Anexo 2.

    Datos del problema 2. para diseño de experimento.

    Factor A.

    (Alimentos)

    Factor H.

    (Horarios)

    Valores de presión máxima.

    Réplica 1.

    Réplica 2.

    Sal

    Mañana

    160

    150

    Sal

    Meridano

    130

    120

    Sal

    Noche

    150

    140

    Harina

    Mañana

    140

    150

    Harina

    Meridiano

    120

    130

    Harina

    Noche

    130

    140

    Verduras

    Mañana

    120

    130

    Verduras

    Meridiano

    110

    120

    Verduras

    Noche

    120

    110

    Anexo 3.

    Datos del problema 2. para series cronológicas.

    Nr. de días.

    Semana 1.

    Semana 2.

    Semana 3.

    Semana 4.

    1

    150

    160

    150

    140

    2

    140

    130

    140

    130

    3

    160

    150

    150

    140

    4

    130

    140

    140

    130

    5

    120

    130

    120

    110

    6

    140

    150

    130

    130

    7

    150

    160

    140

    150

     

    Resumen El presente trabajo se ha realizado con el objetivo de poner en práctica los conocimientos adquiridos en la asignatura de estadística ii, en vista a seleccionar problemas existentes en las empresas y otros que se dan en nuestra sociedad. Para darle cumplimiento a estos objetivos hemos utilizados los métodos y técnicas estadísticas ya estudiados, como son: regresión simple, regresión múltiple, método paso a paso, análisis de varianza, diseño de experimento, análisis de series, entre otros.

    Sumary The present work has been carried out with the objective of putting into practice the knowledge acquired in the subject of Statistic II, in view to select existent problems in the companies and others that are given in our society. To give execution to these objectives we have already used the methods and statistical techniques studied, like they are: simple regression, multiple regression, method step to step, variance analysis, design of experiments, series analysis, among others.

     

     

     

     

     

    Autor:

    Yuriel Noa Góngora

    Curso 2002-2003