17 JACMEN Estimación de proporciones Sucede algo similar a lo que sucedía en el caso (dicotómico) de dos categorías: Si la población de donde se extrae la muestra es grande, comparada con la muestra, no hay diferencias apreciables entre las varianzas en los dos modelos lo que las permite afirmar que las estimaciones puntuales correspondientes a proporciones de cada categoría están dadas por i ?ˆ ??pi ?? xi n i ??1,2, ,k Sin embargo la construcción de los intervalos de confianza para cada proporción es un problema aún más complicado que en caso dicotómico. Frecuentemente se construyen estos intervalos aplicando erróneamente el caso de dos categorías: una categoría formada por los elementos de Ai y la otra categoría formada por los demás elementos de la población. Esta técnica, implementada en varios paquetes estadísticos es incorrecta debido a que construye intervalos que no son independientes entre sí ya que hay elementos comunes en todo par deintervalos.
Quesenberry y Hurst (1964), Goodman (1965) y Fitzpatrick (1987) proporcionaron fórmulas que permiten construir los IC para las proporciones.
W.May y W. Johnson proporcionaron un macro en SAS para la construcción de tales intervalos. Cfr: A SAS® macro for constructing simultaneous confidence intervals for multinomial proportions by Warren L. May and William D.Johnson.
(DOI: http://dx.doi.org/10.1016/S0169-2607(97)01809-9)
w? ?k ?1,??. 18 JACMEN Estimación de proporciones La fórmula propuesta por Quesenberry y Hurst es relativamente fácil de implementar y está dada por: Donde 2 ? En el apéndice se encuentra un programa en Matlab para su aplicación, realizando los cambios que sean necesarios de acuerdo con la información en cadacaso.
Goodman, basado en argumentos2similares a los de Bonferroni para intervalos simultáneos, propuso usar k
Existe igualmente un paquete en R, denominado CoinMinD, con el mismo propósito. Su uso está dado por:
QH(Frec, alfa) Donde Frec es el vector de frecuencias y alfa el valor de ? que define el nivel de confianza de los intervalos
EJEMPLO:
Supóngase que en un país se presentan cuatro candidatos a la presidencia de la república . Se hace una encuesta que se aplica a 2954 votantes. Se obtuvieron 546 votos a favor del candidato A, 658 a favor de B, 935 a favor de C y 815 a favor de D. Para realizar las estimaciones correspondientes a un 95% de confianza, adecuamos el programa No 2 del apéndice con la siguienteinformación:
% w es el valor Ji2 con k-1 GL al nivel1-alfa % Toma de información: w = 7.81; n = [546 658 935 815]; k = 4;
19 JACMEN Estimación de proporciones
se obtienen los siguientes resultados:
L= Que se interpretan así: Como se ve, realmente hay un “empate técnico” entre los candidatos C y D, ya que sus IC se alcanzan a traslapar, lo que indica que las proporciones correspondientes a ellos dos no difieren significativamente.
Aquí debemos llamar la atención sobre el mal uso que se hace de los llamados “empates técnicos” presentados en medios de comunicación no científicos: en primer lugar tales empates son determinados según el error máximo de estimación estipulado para la muestra la que generalmente se diseña con las fórmulas de aproximación normal del caso binomial, lo cual no es correcto. En segundo lugar aplican el mismo nivel de error para comparar las estimaciones de las proporciones en cada par de categorías como si este error fuese el mismo para todos los pares lo que tampoco es cierto.
El mismo ejemplo ya propuesto se resuelve en R de la siguiente manera:
Lo primero que debe hacerse es instalar el paquete CoinMinD en R, para lo cual puede usarse el comando Install.packages(“CoinMinD”)
O simplemente usar la opción de instalación de paquetes que presenta el programa. 0.1848 0.2227 0.3165 0.2759 0.1657 0.2021 0.2931 0.2535 0.2056 0.2449 0.3409 0.2994
20 JACMEN Estimación de proporciones Una vez que se tenga instalado el programa, cada vez que se quiera usar la función QH de estimación, se debe cargar la librería correspondiente, como se muestra en el código siguiente: library(CoinMinD) Frec <- c(546, 658, 935,815) QH(Frec, 0.05) La ejecución de este código produce: Original Intervals Lower Limit [1] 0.1657099 0.2020948 0.2931078 0.2535218 Upper Limit [1] 0.2056215 0.2448659 0.3409004 0.2994549 Adjusted Intervals Lower Limit [1] 0.1657099 0.2020948 0.2931078 0.2535218 Upper Limit [1] 0.2056215 0.2448659 0.3409004 0.2994549 Volume [1] 3.75e-06 Donde se ven los límites de los intervalos en forma original y corregidos más el volumen del hipercubo encerrado por ellos. Este volumen podría interpretarse como una estimación de la totalidad de individuos que son de interés para el estudio dentro de toda la población
21 JACMEN Estimación de proporciones
APENDICE:
PROGRAMA No 1 Método ZL
El siguiente programa en Matlab permite construir el IC del 95% de confianza según el método ZL de D. Habtzgui, C.K. Midha y A.Das:
% Intervalo de confianza para una proporciónbinomial % Método ZL de Zhou, Li y Yang. ProgramóJ.A.Clavijo clear clc % Introduzca la siguienteinformación: % x es número de éxitos en lamuestra % n es el tamaño demuestra n = input(' Ingrese el tamaño de muestra:'); x = input('Ingrese el número de éxitos en la muestra:'); % inicio decalculos if(x==0) x=0.5; n = n+1; end if(x==n) x=n+0.5; n = n+1; end p = x/n; gam =(1-2*p)/sqrt(p*(1-p)); gsup =sqrt(n)*inv(-gam/6)*((1-(gam/2)*(-1.96/sqrt(n)-(1/6)*(gam/n)))^(1/3)-1); ginf =sqrt(n)*inv(-gam/6)*((1-(gam/2)*(1.96/sqrt(n)-(1/6)*(gam/n)))^(1/3)-1); a =exp(log(p/(1-p))-inv(sqrt(n*p*(1-p)))*ginf); b =exp(log(p/(1-p))-inv(sqrt(n*p*(1-p)))*gsup); Li = a/(1+a); Ls = b/(1+b); % intervalo: disp('Intervalo del 95% de confianza para laproporción:') [Li Ls]
22 JACMEN Estimación de proporciones PROGRAMA No 2 – Fórmula de Qusenberry yHurst El siguiente programa en Matlab proporciona las estimaciones puntuales y los IC para cada proporción. Se deben introducir el valor de w y las frecuencias observadas en cadacategoría. % PROGRAMA MATLAB PARA CONSTRUIR ICMULTINOMIALES % FORMULA DE QUESSENBERRY YHURST
% w es el valor Ji2 con k-1 GL al nivel1-alfa % Toma de información: w = 9.49; n = [218 639 545 483 515]; k = 5; % Inicio decalculos N = sum(n); d = 2*(N+w); for i=1:k p(i) = n(i)/N; a(i) = (w+2*n(i))/d; b(i) = sqrt(w^2 +4*n(i)*w*(1-n(i)/N))/d; end for i = 1:k li(i) = a(i) – b(i); ls(i) = a(i) + b(i); end L = [p' li' ls']; L
23 JACMEN Estimación de proporciones REFERENCIAS: 1. Clopper and Pearson. The use of Confidence or Fiducial Limits ilustrated in the case of Binomials. Biometrika 26(1934), 404 – 413 2. J. Neyman. On the problem of Confidence Limits.. The Annals of MathematicalStatistics 6(1935) 3. Blyth C.R. 1986. Approximate Binomial Confidence Limits. Journal of the American Statistical Asociation, JASA. 81(395), 843 – 855 4. Hsiuging Wang. Exact Coeficients of Simultaneous CI for Multinomial Proportions. Journal of Multivariate Analysis. 99(2008), 896 – 911 5. J.T. Morisette and S. Khorram; Exact binomial CI for Proportions. Photogrammetric Engineering & Remot Sensing. Abril 1988 6. L.Brown, T. Cai and A. DasGupta; Interval estimation for a Binomial Proportion. Statistical Science, 2001. Vol 16, No 2. 101 – 133 7. X.H. Zhou, C.M. Li y Z. Yang; Improving Interval estimation of Binomial Proportions. Philosophical Transactions of the Royal Society. A(2008)366, 2405 –2418 8. A.M. Pires et C. Amado; Interval estimators for a binomial Proportion: Comparison of Twenty Methods. Statistical Journal. Vol 6 No 2, June 2008. 165 –197 9. C.R. Blyth and D.W. Hutchinson; Table of Neyman-Shortest unbiased Confidence Intervals for the Binomial Parameter. Biometrika(1960), 47 3 and 4, p. 381 10. F. Scholz. Confidence Bounds & Intervals for Parameters Relating to the Binomial, Negative Binomial, Poisson and Hypergeometric Distributions. Sl. 2008. 11. D. Habtzghi, C.K. Midha and A. Das; Modified Clopper-Pearson Confidence Interval for Binomial Proportion. Journal of Statistical Theory and Applications. Vol 13 No 4, December 2014, 296 – 310 12. E. Cepeda et al.; Intervalos de confianza e Intervalos de credibilidad para una Proporción. Revista Colombiana de Estadística. Diciembre 2008. Vol 31 No 2.211-228 13. A. Agresti and B.A. Coull; Aproximate is better than “Exact” for Interval estimation of Binomial Proportions. American Statistician. Vol 52 No 2, may 1998. 119-126 14. C.P. Quesenberry & D.C. Hurst; Large Sample Simultaneous Confidence Intervals for Multinomial Proportions. 1964. Technometrics 6, 191-195
Página anterior | Volver al principio del trabajo | Página siguiente |