Aplicación de un procedimiento para evaluar la sensibilidad de un experimento
Enviado por reinaldoqr
Indice1. Introducción 2. Conclusiones. 3. Referencias bibliográficas.
El análisis de la varianza (anava) y las comparaciones múltiples de medias son técnicas estadísticas de uso muy frecuente en la experimentación agropecuaria, aunque en ocasiones el no rechazo de una hipótesis nula en el anava no se investiga lo suficiente pudiéndose llegar a conclusiones no bien respaldadas estadísticamente. Supóngase la hipótesis nula Ho: m 1 = m 2 = ….= m t en un experimento que compara t tra-tamientos, si Ho es verdadera la razón Fc = CM(trat) / CM(e) en el anava tendrá una dis-tribución F con p y q grados de libertad y la regla de decisión sería rechazar Ho si Fc > Fα , donde Fα es el valor tabulado de F. Siguiendo este criterio se pudiera rechazar Ho siendo ésta falsa con lo que se cometería el denominado "Error Tipo I" cuya probabilidad se enuncia por P(Error I ) = P(F > Fα ) = α (o nivel de significaciσn). Cuando Ho se rechaza entonces la razσn CM(trat) / CM(e) sigue una distribución conocida en estadística como "F no central " ( F¢ ), con sus grados de libertad pero con parámetro de no centralidad λ > 0; también puede ocurrir que no se rechace Ho siendo no verdadera con lo que se estaría incurriendo en el llamado "Error Tipo II" cuya probabilidad de ocu-rrencia se expresa por P( Error II ) = P( F¢ < Fα ) = b ). Estos tipos de errores tienen una relación muy estrecha con el tamaño del experimento en el momento de su diseño, de hecho la única forma de minimizar ambos es con el aumento del número de réplicas (Monteiro da Silva, 1993). Minimizar β equivale en estadística a maximizar la diferencia (1 – β ), la cual se conoce como Poder o Potencia de la Prueba que es la probabilidad de rechazar Ho cuando debe ser rechazada y que se expresa por P(1- β) = P(F¢ p,q,λ > Fα,p,q), (Martνnez Garza, 1988). Es importante conocer la P( Error II ) = b en la distribución F no central y en consecuencia la potencia de la prueba (1-b ), que es la probabilidad de detectar una diferencia que sí existe y por tanto indicador de la sensibilidad del experimento (Kempthorne, 1975; Santizo, 1976). La función de Potencia es la probabilidad de tomar una decisión correcta sobre la hipótesis alternativa (Ha) y es de sumo valor determinarla en muchos casos, ya que permitiría a los especialistas conocer la verdadera precisión con que han trabajado y tomar las medidas técnicas y económicas para futuros trabajos (Torres y Seguí, 2001); estos autores presentaron un procedimiento práctico para la determinación a posteriori de la función de potencia basándose en la aproximación de Patnaik (1949), debido a la dificultad en calcular la distribución F no central ( F¢ ), no obstante el GLM del SPSS permite calcular el parámetro de no centralidad y la Potencia de Prueba a posteriori para cualquier modelo de anava. El objetivo de este trabajo es argumentar y mostrar la aplicación de otro procedimiento similar que permita al investigador evaluar la sensibilidad de un experimento (Poder de la prueba) para cualquier nivel α, en forma prαctica y utilizando herramientas de cσmputo que facilitan el mismo.
Materiales y metodos.Partiremos del teorema 4.23 (Graybill, 1961); suponiendo u distribuida como F' (p,q,λ); entonces la variable aleatoria v = u/k se distribuirá aproximadamente como F (r,q) donde k = ( p + 2λ)/ p y r = ( p + 2λ)² /( p + 4λ ). Utilizando la Ec. 4.8 ( Pag. 80) β*(λ) = ∫Fα f( u; p,q,λ) du la cual es aproximadamente ∫(1/k)Fα g( v; r,q ) dv donde Fα es tal que ∫Fα f(u;p,q,λ=0) du = α donde p : grados de libertad del numerador originalmente. q : grados de libertad del denominador. r : grados de libertad del numerador (para aproximación).λ : parαmetro de no centralidad. Β*(λ): Potencia de la dσcima (1 – β). α : Nivel de significaciσn.F¢ (p,q,λ) : F no central con parαmetro λ > 0 F (r,q) : F central.
La anterior aproximación de F(r,q) con F’(p,q,l ) se conoce como aproximación de Patnaik (1949) y se describe también en Scheffé (1959). Para ilustrar el procedimiento se utilizó un experimento desarrollado en el CIAP de la UCLV donde se estudiaron los efectos de 9 tratamientos ( niveles de caliza fosfatada ) en Caña con cuatro repeticiones en un DBA; las variables analizadas fueron el rendimiento (t/há) y Brix observado (%); los procesa-mientos y cálculos de probabilidad se realizaron con el paquete Estadístico Statgraphics ver. 4.1 de (1999) . Los resultados para (1-b ) se comprobaron con los del GLM del SPPS.
Resultados y discusión. Los anteriores conceptos nos llevan a que (1/k) Fa (p,q) » F¢ (l ; r,q), que utilizaremos para calcular la potencia de la dócima (1-b ) = P(F¢ (l ; r,q )> Fa , p,q). El parámetro de no cen-tralidad se calculó por la expresión l = r å (t – ` t )²/ 2s ² = SC (trat) / 2 CM(e) según (Graybill, 1961; Kempthorne, 1975), donde se tomó del Anava s ² = CM(e). Si l = SC(trat) / 2CM(e), y k = (p + 2l ) /p. observemos que en el Anava Fc = CM(trat) / CM(e) = SC(trat)/p /CM(e) y que 2l = SC(trat) / CM(e), entonces k = (p + SC(trat)/ p | CM(e) = 1+ Fc, por lo que F¢ (l ; r,q) = Fa / ( 1 + Fc), quedando resuelta la (1– β) = P{ F¢ (l ; r,q) > Fa / ( 1 + Fc )}para cualquier α dado y donde su soluciσn se obtendrα de for-ma inmediata con el Statgraphics o cualquier otra herramienta de cómputo estadístico. Aplicando estos resultados al anava ( Anexo 1) se calcularon los parámetros de no centralidad (l ) y los valores de (1 – b ) que aparecen en la tabla 1.
Tabla 1. Indicadores calculados en el experimento con 9 tratamientos de caliza fosfatada. Variables estudiadas. Indicadores Rendimiento Brix Observado ( t/há) ( % ) ___________________________________________________ Parámetro de No Centralidad ( l ) 12.70 7.71 Significación de Tratamientos ( a ) 0.0134 0.1024 Poder de Prueba (1– b ) 0.8956 0.6594 (0.7267) (0.7898) P( Error II ) = b 10.44 % 34.16 % (27.33 %) (22.02 %) ______________________________________________________ ( ): Valores calculados cuando se utilizó a = p-value.
En ambas variables la Potencia de Prueba coincide exactamente con los resultados que presentó el GLM del SPSS cuando se le incluyó esa opción, por lo que de disponerse de este paquete estadístico se evitará el procedimiento aquí descrito, y la evaluación de la potencia y/o P(Error II) se convierte en algo tan sencillo como un rutinario anava. En el Brix la potencia observada fue relativamente baja( 0.7898) aún con un p-value = 0.1024, y cuando se calculó con un a = 0.05 se redujo a 0.6594 { P(Error II) = 34.2 %)} , en este sentido Araya (1995) señala la utilidad práctica de estimar la probabilidad b (y en consecuencia 1- b ) que permita al investigador analizar los alcances de una posible aceptación de la hipótesis nula Ho, y de cometerse el error de tomar como un absoluto los resultados de una prueba con probabilidad a (en nuestro caso p-value = 0.1024) y no calcular la probabilidad de que esa hipótesis sea falsa ( en nuestro caso b =34.2 %); la sensibilidad del experimento en esta variable fue insuficiente para diferenciar los tratamientos. En el rendimiento el análisis será más cuidadoso ya que alcanzó resultados significativos (p-value = 0.0134), pero la potencia de prueba a ese nivel fue de solo 0.7267 ( un b = 27,3 %) lo que explica que en esta variable no se declararon como significativas diferencias del orden de 13 t/há y de 16 a 17 cuando las comparaciones de medias se realizaron para los niveles α = 0.05 y 0.0134 (p-value) respectivamente ( anexo 1 ), lo que es un resultado poco confiable que no debe considerarse como definitivo. Hay que tener en cuentas que cuando se compara un nϊmero relativamente alto de tratamientos, se incrementa la probabilidad de declarar diferencias no reales con algunos de los mιtodos de comparaciones de medias aspecto que debe considerar también en el análisis el investigador. Monteiro da Silva, 1993, señala que una probabilidad global de que por lo menos un error de tipo I sea cometido aumenta con el número de hipótesis probadas. Estos resultados implican medidas a tomar para futuros experimentos similares ya que un cálculo aproximado del número de réplicas necesario para detectar diferencias de 13 t/há tomando los estimadores de variabilidad de este experimento, para la comparación entre 7 y 9 tratamientos serían no menos de 8 réplicas para una potencia de prueba del 90 % ( según método de Cochran y Cox, 1975).
Se mostró la aplicación de un procedimiento que permite evaluar la sensibilidad de un experimento con simples operaciones y cálculos probabilísticas con herramientas de cómputo que simplifican los mismos. El GLM del SPSS ofreció los mismos resultados en la potencia observada, por lo que su empleo puede sustituír el procedimiento mostrado. Se comprobó que fueron relativamente bajos los valores de potencias de prueba en las variables estudiadas y en consecuencia las altas probabilidades de errores que pueden cometerse al interpretar los resultados.
3. Referencias bibliográficas.
Araya M.; Rigoberto. 1995. Cálculo del Error Tipo II. Banco Central de Costa Rica. Dirección Económica. DIE – NT – 02- 95. Graybill, Franklin. A.; 1961. An Introduction to linear Statistical models. Volume I. McGraw-Hill Book Company, Inc. USA. Págs. 80,88,89. Kempthorne, O.; 1975. The Design and Analysis of Experiments. Krieger. N.Y. USA. Pág. 225. Martínez Garza, A.; 1988. Diseños experimentales. Métodos y elementos de teoría. Editorial Trillas. México. Pags. 705, 706. Monteiro Da Silva, M.J.; 1993. Os Métodos de comparacao múltipla na análisis estatística. Comunicacoes. Instituto de Investigacao Científica Tropical. No. 14. Patnaik, P.B. ; 1949. The noncentral c ² and F- distributions and their approximations. Biometrika, 36:202. (Citado por Scheffé, 1959; Graybill, 1961 y Torres y Seguí, 2001.). Santizo, J.A.; 1976. Est-621. Diseños Experimentales I. Otoño 1976 XII. El Poder de la Prueba del Análisis de Varianza. Material mimeografiado. CEC. Chapingo. México. Scheffé, H.; 1959. The Analysis of Variance. John Wiley d Sons, Inc. USA. Pags. 38,39,417. Torres, Verena y Yolanda Seguí. 2001. Procedimiento práctico para la determinación de la función de potencia a posteriori . Rev. Cubana de ciencia agrícola. Tomo 35. No. 4. Pags. 319 – 322.
Anexo 1. Resultados del Anava con 9 tratamientos y cálculos de los parámetros para evaluar la Potencia de la Dócima. Rendimiento en t/há Brix Observado (%) Causas de Var. SC GL CM Fc P-Value. SC GL CM Fc P-Value Tratamientos 1769.4 8 221.2 3.17 0.0134 3,70 8 0.463 1.93 0.1024 Réplicas 738.5 3 246.2 – – – 3 – – – Error Exp. 1672.9 24 69.7 – – – 24 0.240 – – Cálculos para la variable Brix Observado ( % ).λ = 3.70 / 2( 0.240) = 7.71 k = 1 + 1.93 = 2.93 r = (8 + 2(7.71))²/(8 + 4(7.71)) ≈ 14 ( 1-β) = P(F( λ; 14, 24) > 0.8020) = 0.6594 si utilizamos (1/k)(Fα) = 0.8020 donde α =0.05. ó (1-β)= P(F (λ; 14, 24)> 0.6587) = 0.7898 si utilizamos (1/k)(Fc) = 0.6587 . Cálculos para la variable Rendimiento ( t/há).λ = 1769.4 / 2(69.7) = 12.7 k = 1+3.17 = 4.17 r = (8 + 2(12.7))² / ( 8 + 4(12.7)) ≈ 19 ( 1 – β ) = P ( F( λ; 19, 24) > 0.7602 ) = 0.7267 si utilizamos (1/k)(Fc) = 0.7602 ó P ( F (λ; 19, 24 ) > 0.5659 ) = 0.8956 si utilizamos (1/k)(Fα ) = 0.5659 donde α = 0.05.El cálculo de Fα y (1-β) se realizσ con el Mσdulo de Probability Distributions (F- Variance Ratio) del STATGRAPHICS, aunque puede ser también con la Dist. F del Excel. Resultados de las comparaciones de medias por Duncan para α = 0.05.y 0.0134.Tratamientos (1) (6) (5) (4) (7) (2) (8) (9) (3) EE(ў)Medias 62.35 62.53 64.53 64.66 66.36 72.66 76.83 79.41 80.68 ± 4.17 CV(%) 15.4 13.3 6.7 13.9 8.2 13.7 10.3 11.3 11.1 α = 0.05 d d cd cd bcd abcd abc ab a α = 0.0134 b b ab ab ab ab ab ab a Material de apoyo al tema en la maestria de agricultura sostenible del CIAP de la UCLV. Cuba.
Autor:
Reinaldo J. Quiñones Ramos
Profesor de Biometria y Diseño Exp. Fac. Ciencias Agropecuarias. UCLV.