Descargar

Estimadores robustos (página 2)

Enviado por mmarcelino


Partes: 1, 2
la determinación de cinco arcos de meridianos. En 1793 Pierre Simón Laplace presentó un desarrollo analítico del criterio de la suma absoluta de los residuales debe ser un mínimo, con la condición de que la suma de los residuales negativos es igual a la suma de los residuales positivos. LA NORMA L8 : “el máximo residual absoluto es mínimo”.

? V max ? = minimo La Norma L8 está asociada a la Media de los valores extremos y se conoce como el principio MÍNIMAX ( minimizar el máximo error residual absoluto ). En 1749 Leonhard Euler y Johann Heinrich Lamber en 1760, trabajando de manera independiente, son los primeros en usar el principio MÍNIMAX para resolver un sistema redundante de ecuaciones lineales. En 1786 Laplace da un algoritmo de solución. En 1854 PAFNUTIL L’VOVICH SCHEBYSHEV, matemático Ruso, en su estudio de la Norma L8 para la aproximación de polinomios, invirtió mas de 40 años , dando métodos de solución, por eso a la Norma L8 se le conoce como la Norma de Schebyshev. Los Estimadores Robustos no tiene asociados ninguna distribución y ninguna Norma Optima. Los principales objetivos de usar los estimadores Robustos se pueden resumir así : (1) Construir una medida de seguridad en contra de una insospechada cantidad de errores groseros. (2) Poner un límite a la influencia de la contaminación escondida y a los cuestionados errores groseros ( los que se salen de una tolerancia ). (3) Aislar de manera clara los errores groseros para un tratamiento separado si estos es requerido o deseado. (4) Seguir siendo cercanamente el sentido estricto del modelo Paramétrico. Hay tres métodos para construir Estimadores Robustos : Estimadores de máxima verosimlitud o bien conocidos también como MAXIMUM LIKELIHOOD. Estimadores basados en Test de Rangos. Estimadores de combinación lineal de estadísticos de Orden. En esta presentación se considerán solamente los estimadores Robustos de de Orden, existen más de 70 Estimadores Robustos, de los cuales sólo se mencionarán algunos. ESTIMACION NO PARAMETRICA ROBUSTA DE TENDENCIA CENTRAL.- Los estimadores no paramétricos de tendencia central son los llamados estimadores de orden o estadísticos de orden, puesto que las observaciones o valores de la variable aleatoria X deben ser ordenados en orden creciente : X1 , X2 , X3 , . . . . . . ., Xn

Debe cumplirse que : X1 < X2 < X3 < . . . . . < Xn-1 < Xn

De los diversos estimadores no paramétricos o robustos existentes, sólo se indicarán algunos de ellos.

3.- MEDIANA DE HODGES – LEHMANN Este estimador fue desarrollado por JOSEPH L. HODGES y ERICH L. LEHMANN en 1960, muy usado en trabajos de investigación de alto nivel. El estimador , que es un algoritmo muy sencillo, es la mediana de los promedios de todos los pares sucesivos de observaciones de una muestra de n observaciones ordenadas en orden creciente o decreciente : Sea la serie ordenada en orden de menor a mayor ( orden creciente ) :

edu.red

X1 ; X2 ; X3 ; . . . . . . . ; Xn

Promedios sucesivos :

Y1 = ( X1 + X2 ) / 2 ; Y2 = ( X2 + X3 ) / 2 ; . . . ; Yn-1 = ( Xn-1 + Xn ) / 2

Obteniéndose una nueva serie ordenada : Y1 ; Y2 ; Y3 ; . . . . . ; Yn-1

Siendo la mediana de Hodges – Lehmann la mediana de esta nueva serie . Ejemplo : Sean Xi : 13.5 14.2 14.5 14.7 15.0 Serie de promedios : 13.85 14.35 14.60 14.85 Hallamos la mediana de la serie de promedios, que es una serie par : Xmed = ½ ( X n/2 + X n/2 + 1 ) = ½ ( X4/2 + X4/2 +1 ) = ½ ( X2 + X3 ) X med = ½ ( 14.35 + 14.60 ) = 14.475 ˜ 14. 48

Por lo tanto : X = 14.48 H – L

El Estimador de TAKASHI, presentado en 1969 por TAKASHI YAMAGAWA toma la mediana sucesiva de las observaciones o mediciones y luego a esa nueva serie originada le aplica la Media Aritmética.

4.- ESTIMADOR B.E.S. El estimador B.E.S. ( Best Easy Systematic ) es un promedio de la mediana y los cuartiles inferior y superior . Es un promedio de los cuartiles inferior, medio ( pués la mediana es el cuartil medio ) y superior. PARA SERIE PAR :

Xbes = ¼ ( X¼n** + X½n + X( ½n +1) + X(¾n +1)* )

PARA SERIE IMPAR :

Xbes = ¼ ( X¼n** + 2 x X½(n+1) + X (¾n+1)* )

* * redondeado al entero superior más próximo ( por exceso ) * redondeado al entero inferior más próximo ( por defecto ) Ejemplo : Xi : 13.5 14.2 14.5 14.7 15.0 Obsérvese que es una serie IMPAR :

Xn/4** = X5/4** = X2 se aproxima al entero superior

X(n+1)/2 = X(5+1)/2 = X3

X(3/4n+1)* = X (3/4×5 +1 )* = X(15/4+1) = X (3+1) = X4

Por lo tanto : Xbes = ¼ ( X2 + 2 x X3 + X4 ) = ¼ ( 14.2 + 2 x 14.5 + 14.7 )

edu.red

Xbes = ¼ ( 57.9 ) = 14.475

5.- MEDIA ARITMÉTICA MÚLTIPLE SUCESIVA. Dada una serie simple de observaciones ordenadas en orden creciente, se forman las medias sucesivas de pares de observaciones consecutivas. Ejemplo : 13.5 13.85 14.2 14.35 14.10 14.2875 14.5

14.7 14.60 14.475

14.725 14.6000 14.444 14.85 15.0

Por lo tanto : Xmm = 14.444

6.- TRIMEDIA DE TUKEY Es un estimador no paramétrico o estimador robusto desarrollado por JOHN TUKEY en 1960 y es un promedio pesado del primero, segundo y tercer cuartil; es decir, el cuartil inferior ( 25 % ), cuartil medio o mediana ( 50 % ) y cuartil superior ( 75 % ). Xtt = ¼ Q1 + ½ Q2 + ¼ Q3 PARA SERIE SIMPLE IMPAR

Q1 = X ¼(n+1)

Q2 = X½(n+1)

Q3 = X(¾n+1)

Ejemplo : PARA SERIE SIMPLE PAR

Q1 = X¼n

Q2 = ½ ( X½n + X½n+1 )

Q3 = X¾n i Xi Por lo tanto : 1 2 3 4 5 13.5 14.2 14.5 14.7 15.0 Q1 = X¼(n+1) = X ¼(5+1) = X1 = 13.5

Q2 = X½(n+1) = X½(5+1) = X3 = 14.5

Q3 = X(¾n+1) = X¾(5+1) = X4 = 14.7 Xtt = ¼ x 13.5 + ½ x 14.5 + ¼ x 14.7 = 14.30 Un estimador que usa los cuartiles Q1, Q2 y Q3 se puede escribir asi : E = a x Q1 + ß x Q2 + ? x Q3 Cumpliendo que a + ß + ? = 1

Siendo : Q1 = primer cuartil Q2 = segundo cuartil Q3 = tercer cuartil Por lo tanto podemos derivar varios estimadores, como por ejemplo los siguientes : E1 = ( 1/3 ) Q1 + ( 1/3 ) Q2 + ( 1/3 ) Q3

edu.red

E2 = ¼ Q1 + ½ Q2 + ¼ Q3 ( usado por TUKEY ) E3 = ( 1/8 ) Q1 + ¾ Q2 + ( 1/8 ) Q3

E4 = ( 1/10 ) Q1 + ( 4/5 ) Q2 + ( 1/10 ) Q3 Es obvio que el valor representativo de la variable nunca está ubicado en los extremos de la serie, por lo que darle pesos 1/3 a cada cuartil es incorrecto. Si empleamos E3 obtenemos : E3 = ( 1/8 ) x 13.5 + ¾ x 14.5 + ( 1/8 ) x 14.7 = 14.40 Si empleamos E4 obtenemos :

E4 = ( 1/10 ) x 13.5 + ( 4/5 ) x 14.5 + ( 1/10 ) x 14.7 = 14.42

7.- ESTIMADOR ALFA-MEDIA EQUILIBRADA Serie simple ordenada en orden creciente : S Xj Xa = —————- 0 = a = 2 n – 2 x na

Si a = 1 se elimina una observación en cada extremo. Si a = 2 se eliminan dos observaciones en cada extremo. En este estimador se elimina un número igual de observaciones en cada extremo de la serie. Ejemplo : Xi : 13.5 14.2 14.5 14.7 15.0 Para a = 1 : se eliminan un elemento en cada extremo de la serie. Entonces la serie se reduce a los elementos siguientes : 14.2 14.5 14.7 resultando como valor representativo de la serie : 14.2 + 14.5 + 14.7 43.4 Xa=1 = ————————————— = ———– = 14.467 5 – 2×1 3 8.- ESTIMADOR DE HUBER Este estimador fue desarrollado por PETER J. HUBER en el año 1964 y en su trabajo “Robust Estimation ” del año 1968 presenta en detalles la teoría de la estimación robusta de un parámetro de tendencia central o posición central o puntual de una distribución normal “contaminada” y presenta los tres métodos para construir estimadores que robustos. El Estimador HUBER se desarrolló en base a las funciones : S ( Vi )² = mínima si se cumple | V | = K x s S K x s ( 2 x ? V ? – K x s ) = mínima si cumple con | V | = K x s generalmente K adopta valores de 2 ó 3. Muchos recomiendan usar el valor 3, pués K x s representa la tolerancia de la medición y s representa la exactitud de la observación o medición obtenida. Es un proceso iterativo. El Estimador de HUBER usa como función de Peso P lo siguiente : P = 1 si | V | = K x s

edu.red

si si (f)

K x s P = ————— | V | = K x s | V|

Ejemplo : Consideremos las mediciones Xi : 10 ; 11 ; 11 ; 12 ; 100 A simple vista la observación 100 aparenta ser un error grosero. Consideremos una exactitud de las observaciones s = 5 unidades y usando como constante K = 2 se tiene que K x s = 10 y se procede a utilizar el proceso iterativo para la estimación. Recordemos que la media aritmética de una serie simple de igual exactitud, lo que significa pesos iguales a la unidad, esta dada por : S Xi Xma = ————- n

Y para una serie de elementos con diferentes exactitudes o pesos :

S ( Pi x Xi ) Xma = —————– S Pi

144 (a) Cálculo de la media aritmética : Xma = ———— = 28.8 5 (b) Cálculo de los residuales : Vi = Xi – Xma obteniéndose : 18.8; 17.8; 17.8; 16.8; 71.2

(c) Como todos los residuales Vi son mayores que K x s = 10 se procede al cálculo de los Pesos correspondiente a cada observación usando :

Kx s P = ————— | V| | V | = K x s por lo tanto los Pesos son : Observación 1 2 3 4 5 Peso 0.53 0.56 0.56 0.60 0.14 (d) Con estos nuevos pesos calculamos la media aritmética ponderada :

0.53×10 + 0.56×11 + 0.56×11 + 0.60×12 + 0.14×100 Xma = ————————————————————————- = 16.24 0.53 + 0.56 + 0.56 + 0.60 + 0.14

(e) Con esta nueva media aritmética calculamos los nuevos residuales :

6.24 ; 5.24 ; 5.24 ; 4.24 ; 83.76

Se calculan los nuevos pesos tomando en cuenta que si V= 10 tendrá un peso de UNO y si es = 10 se le calcula el peso tal como se indicó antes. Observación 1 2 Peso 1 1

edu.red

X – P

3 4 5 1 1 0.12 (g) Calculamos la nueva media aritmética ponderada obteniéndose :

1×10 + 1×11 + 1×11 x 1×12 + 0.12×100 Xma = ———————————————————- = 13.59 1 + 1 + 1 + 1 + 0.12

(h) Reiterando nuevamente el proceso, se calculan los residuales :

3.59 ; 2.59 ; 2.59 ; 1.59 ; 86.41

(h) Calculamos los pesos correspondientes a estos nuevos valores : Observación 1 2 3 4 5 Peso 1 1 1 1 0.12 En vista que son los mismos pesos anteriores, se terminan las iteraciones obteniéndose : = 13.59 ˜ 13.6 HUBER

9.- EL METODO DANES Este método fue propuesto por TORBEN KRARUP en 1967 y desde entonces ha sido usado como un método standard de computación en el Instituto Danés de Geodesia para sus cálculos Geodésicos. Durante los últimos años ha sido usado para otras tareas en la Universidad de Aalborg. El método Danés puede ser interpretado como un método iterativo, como lo es el estimador de HUBER, para resolver un problema de programación lineal, particularmente si los Pesos para las mediciones con errores groseros ( los denominados “outliers”) son reducidos a cero. La rata de convergencia del método depende de las condiciones del problema y del porcentaje de errores groseros. Este porcentaje fue encontrado a ser del 1 % para los cálculos geodésicos. La estimación de acorde con el Método Danés toma lugar de acuerdo con el siguiente algoritmo iterativo :

CASO DE MEDICIONES DE IGUAL EXACTITUD : (1) Si los residuales l V l = K x s les corresponde un peso P = 1 (2) Si los residuales l V l = K x s les corresponde un peso dado por la expresión siguiente :

P = e V² ————- (Kx s )² Siendo : e = 2.718282 . . . ( base de los logaritmos Neperianos ) K = constante que adopta el valor de 2 ó 3 s = exactitud adoptada para el grupo de mediciones.

CASO DE MEDICIONES DE DIFERENTES EXACTITUDES :

= P x F(V )

edu.red

a +1 a a Kx a siendo : F ( Va ) = 1 para residuales ? V ? = ———– P

Y para V = K x a se tiene lo siguiente :

Vx P ————- (Kx s ) F(Va) = e

Siendo P el peso de la observación en consideración. Variantes del método Danés permiten obtener eficientes resultados en otras categorías diferentes de problemas, mediante el uso de funciones especificas para los pesos, tales como en los Ajustes o Compensación de Bloques Fotogramétricos por el método de Haces de Rayos ( JUHL, 1980 ), en redes de nivelación ( JENSEN y MARK 1980 ) y en intersecciones ( JOHANSEN y KJAERSGAARD, 1980 ). Ejemplo : Dadas las cinco mediciones : 10 ; 11 ; 11; 12 ; 100 Hallar la mejor estimación usando el Método Danés. Se calcula la media aritmética de la serie de observaciones :

10 + 11 + 11 + 12 + 100 Xma = ———————————– = 28.8 5

Con esta media aritmética se calculan los residuales :

Vi = Xi – Xma Obteniéndose : 18.8 ; 17.8 ; 17.8 ; 16.8 ; 71.2 Usando un s = 5 y un valor de K = 2 se obtiene que K x s = 10, con lo cual todas las observaciones o mediciones con residuales mayores que 10 se les asigna un peso dado por : V² – ———- (Kx s )² P = e Por lo tanto : – ( 18.8 ² ) / ( 10 ) ² – 3.5344 P1 = ( 2.718282 )

– ( 17.8 ² ) / ( 10 ) ² P2 = ( 2.718282 )

– ( 17.8 ² ) / ( 10 ) ² P3 = ( 2.718282 )

– ( 16.8 ² ) / ( 10 ) ² P4 = ( 2.718282 ) = ( 2.718282 )

– 3.1684 = ( 2.718282 )

– 3.1684 = ( 2.718282 )

– 2.8224 = ( 2.718282 ) ˜ 0.03

˜ 0.04

˜ 0.03

˜ 0.06 – ( 71.2 ² ) / ( 10 ) ² – 50.6944 P5 = ( 2.718282 ) = ( 2.718282 ) ˜ 0.00

edu.red

1

Con estos nuevos pesos se calcula la media aritmética ponderada :

0.03 x 10 + 0.04 x 11 + 0.04 x 11 + 0.06 x 12 + 0.00 x 100 Xma = ——————————————————————————– 0.03 + 0.04 + 0.04 + 0.06 + 0.00 Obteniéndose : Xma = 11.176 ˜ 11.2 Con esta nueva media aritmética se calculan los nuevos residuales :

1.2 ; 0.2 ; 0.2 ; 0.8 ; 88.8

y calculando los nuevos pesos en base a estos residuales, tomando en cuenta que para residuales menores de 10 el peso es la unidad y para residuales mayores de 10 se calcula el peso tal como se indico. Por lo tanto :

P1 = P2 = P3 = P4 = 1 – ( 88.8 ² ) / ( 10 ) ² – 78.8544 P5 = ( 2.718282 ) = ( 2.718282 ) ˜ 0.00 Con estos nuevos residuales se calcula la media aritmética ponderada :

1 x 10 + 1 x 11 + 1 x 11 + 1 x 12 + 0.00 x 100 Xma = —————————————————————– = 11.0 1 + 1 + 1 + 1 + 0.00

Reiterando el procedimiento obtenemos los nuevos residuales :

; 0 ; 0 ; 1 ; 89

Resultando como nuevos pesos : P1 = P2 = P3 = P4 = 1 y P5 ˜ 0.00

Con lo cual la nueva media aritmética ponderada es Xma = 11.0 lo aue permite concluir que el valor representativo de la muestra es:

Xma = 11.0

10.- EJEMPLOS ILUSTRATIVOS DE APLICACIONES

Ejemplo Ilustrativo No. 1 : Consideremos el caso de dos estudiantes A y B que cursaron las mismas asignaturas y cuyas calificaciones son las siguientes : ASIGNATURAS CALIFICACIONES A B Matemáticas Física Química Biología Historia 10 10 10 10 20 20 20 20 20 10 ¿ Cual es la calificación que representaría al Estudiante A y B ? Si aplicamos las estimadores paramétricos de la media aritmética, la mediana y la media de los extremos, por ejemplo, se obtiene :

edu.red

1

ESTIMADOR ESTUDIANTE APLICADO

Media Aritmética

Mediana

Media de los Extremos A

12

10

15 B

18

20

15 De estos resultados observamos que la media aritmética parece que no representa mejor las calificaciones, mientras que la mediana ofrece una mejor representación; mientras que la media de los extremos califica de igual tanto al buen estudiante como al mal estudiante ( ¿ que tal ? ). Obsérvese que no hay consistencia entre las tres estimaciones realizadas. Obsérvese que la muestra es pequeña y no podemos eliminar la calificación que se sale de la mayoría; tampoco podemos asumir alegremente que es una distribución normal o una distribución leptocúrtica o rectangular. Aplicando los ESTIMADORES ROBUSTOS se obtienen los valores siguientes : ESTIMADOR ESTUDIANTE APLICADO

Mediana de Hodges-Lehmann

Estimador BES

Media Aritmética Sucesiva

Trimedia de TUKEY

a – Media Equilibrada

Estimador de HUBER ( * )

Método Danés ( * ) A

10

10

10.625

10

10

10.498

10 B

20

20

19.375

20

20

19.501

20 ( * ) Se utilizó s = 1 y valor de K = 2

Obsérvese la consistencia que presentan los ESTIMADORES ROBUSTOS. Ejemplo ilustrativo No.2 : Consideremos las observaciones de un ángulo medido 8 veces : No. 2 3 4 5 6 7 8 Angulo

345 ° 45 ` 43.7 “ 54.9 “ 55.2 “ 55.5 “ 56.7 “ 56.7 “ 57.8 “ 58.4 “ Aplicando los estimadores paramétrico de media aritmética, mediana y media de los extremos se obtienen los resultados siguientes : Media Aritmética : 345 ° 45 ` 54.9 “

edu.red

Mediana :

Media de los Extremos : 345 ° 45 ` 56.1 “

345 ° 45 ` 51.1 “ Aplicando los ESTIMADORES ROBUSTOS se obtienen : Mediana de HODGES-LEHMANN :

Estimador BES :

Media Aritmética Sucesiva :

Trimedia de TUKEY :

a – Media Equilibrada : 345 ° 45 ` 56.1 “

345 ° 45 ` 56.3 “

345 ° 45 ` 56.0 “

345 ° 45 ` 56.0 “

345 ° 45 ` 56.1 “ CONCLUSIONES Los ESTIMADORES ROBUSTOS de Tendencia Central o POSICIÓN ofrecen la ventaja de que evitan el “uso y abuso” que se ha hecho de la media aritmética, puesto que “a todo” le aplicamos a la media aritmética. Por otra parte nos elimina el uso arbitrario del rechazo de observaciones por que se alejan de la mayoría de las observaciones, cuando se presentan casos que se hace necesario no eliminarlas. Por último asumir una distribución normal para la población de donde se extrae la muestra ( lo cual implica usar la media aritmética como estimador ) no es conveniente, porque el número de observaciones es muy pequeño. Por último, se deben actualizar los cursos de ESTADÍSTICA, donde se incluya el estudio de estos Estimadores, de los cuales sólo se ha hecho una breve presentación de ellos y de manera sencilla y clara.

BIBLIOGRAFÍA – NONPARAMETRIC METHODS IN STATISTICS Por : J. Fraser Editorial John Wiley & Sons 1957 – ROBUST ESTIMATION, A CONDENSED PARTIAL SURVEY Por : F. R. Hampel Z. Wahschein Lichtkeitstheorie 1973 – NONPARAMETRIC STATISTICAL METHOD Por : M. Hollander D. A. Wolfe Editorial John Wiley & Sons 1973 – ELEMENTS OF NONPARAMETRIC STATISTICS Por : G. E. Noether Editorial John Wiley & Sons 1976 – PRACTICAL NONPARAMETRIC STATISTICS Por : W. J. Conover Editorial John Wiley & Sons 1980 – ROBUST STATISTICS Por : P. J. Huber Editorial John Wiley & Sons 1981 – ROBUST STATISTICS

edu.red

Por : F. R. Hampel, Rousseeuw, Ronchetti y Stahel Editorial John Wiley & Sons 1986 Autor: Manuel Marcelino Lunar González Agrimensor. ( Universidad del Zulia, Maracaibo, Venezuela ) Ingeniero Geodesta ( Universidad del Zulia, Mcbo, Venezuela ) Postgrado en Fotogrametría ( International Institute for Aerial Survey and Earth Sciences [ I.T.C.], Holanda ) Postgrado en Ciencias de la Ingeniería y Estudios de Agrimensura ( Universidad de New Brunswick. Canadá ) Profesor Titular Jubilado de la Universidad del Zulia, Venezuela.

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente