Protocolo EMECAM: Análisis del efecto a corto plazo de la contaminación atmosférica sobre la mortalidad (página 2)
Enviado por Jos� Mar�a Ten�as Burillo
Modelo de análisis
La serie de datos diarios de mortalidad puede considerarse como distribuida aproximadamente como una distribución Poisson con sobredispersión4 (es decir la varianza es mayor que la media) y, habitualmente, con autocorrelación. La sobredispersión y la estructura de autocorrelación suelen ser consecuencia de factores exógenos, como la temperatura o la estructura estacional, más que de factores propios del número de defunciones. Así, para cada una de las series de mortalidad, cada centro construyó un modelo de regresión de Poisson para explicar las fluctuaciones de la mortalidad. El modelo de regresión de Poisson se construye como:
Donde E(Y) es el número esperado de defunciones diario; a es la constante del modelo; g el efecto de cada contaminante o de sus retardos o de los promedios de los últimos días; C es el contaminante y b el efecto de cada una de las covariables Xi a controlar.
Para especificar el modelo de Poisson anterior se sigue una estrategia parecida a la metodología APHEA3. En primer lugar se identifica un modelo basal para cada una de las causas de muertes, a partir de las posibles variables de confusión entre la relación de la mortalidad y la contaminación. A diferencia de APHEA, este modelo basal se identifica directamente usando la regresión de Poisson con el programa EGRET5. Una vez identificado el modelo basal, se procede a extender este modelo a cada uno de los contaminantes y sus retardos. Finalmente, se intenta controlar la autocorrelación residual incluyendo términos autoregresivos de la mortalidad.
Tal como se ha mencionado, se procede a mostrar el método de análisis utilizando como ejemplo la serie de datos de mortalidad por todas las causas en el período 1992-1996. En la figura 1 se muestra esta serie, junto con la de humos negros, apreciándose una aparente correlación entre ambos.
Figura 1 Defunciones diarias por todas las causas menos externas en la ciudad de Valencia 1992-1996 y media diaria de humos negros
Identificación del modelo basal
Para la construcción del modelo basal se introducen progresivamente las variables estructurales y meteorológicas. Las variables en el modelo se incluyen utilizando un criterio estadístico conservador, consistente en la mejoría de la lejanía (deviance), determinada por una significación del cociente de verosimilitudes de p<0.10. A continuación se muestra como se ha construido el modelo.
Estacionalidad
El control de la estacionalidad se lleva a cabo introduciendo términos sinusoidales del tipo:
siendo k un valor de 1 al 6 y t=1,2, el número de días transcurridos desde el 1 de enero de 1992. Este tipo de términos permite recoger desde ciclos anuales (k=1) hasta ciclos bimestrales (k=6). Para seleccionar los términos sinusoidales del modelo se decide incluirlos sucesivamente por parejas de seno y coseno, empezando por k=1. Para incluir una pareja se exige una mejora en la lejanía de p<0.10. De este modo se incluyen los términos de orden 1, 2, 3, 4 y 5. En la figura 2 se observa como queda la serie tras ajustar los términos sinusoidales.
Figura 2 Ajuste de variables sinusoidales para las defunciones diarias por todas las causas menos externas en la ciudad de Valencia 1992-1996.
Modelo ajustado con términos sinusoidales de orden k= 1, 2,3,4 y 5.
Temperatura
La relación de la temperatura con la mortalidad diaria no tiene por qué ser lineal. Además, el efecto puede ser retardado, ya que la temperatura de un día no tiene necesariamente que estar relacionada con la mortalidad del mismo día, sino que puede estarlo con la mortalidad de los días siguientes. Por ello, se calculan los retardos hasta orden 7 de la temperatura media diaria. Así mismo, se calcula la temperatura media diaria al cuadrado y sus correspondientes retardos hasta orden 7. Con ello no es necesario asumir la relación lineal entre la temperatura y la mortalidad, lo que permite otra forma funcional además de controlar el efecto retardado de la relación. Para decidir qué términos se incluyen en el modelo, con el fin de obtener el más parsimonioso posible, se sigue la siguiente estrategia:
En primer lugar se calcula el "score test" obtenido al ampliar el modelo con términos sinusoidales para cada una de las variables de temperatura mencionadas. El "score test" contrasta, si el coeficiente de regresión de cada una de las variables de temperatura es igual a cero al añadir esta variable al modelo ajustado hasta el momento, sin necesidad de ajustar cada uno de los modelo generados al añadir la variable de temperatura6. Aquella variable para la que se obtiene una mayor puntuación (significación) en el "score test" se selecciona y se ajusta junto con los términos sinusoidales elegidos. Si el modelo mejora su lejanía en una p<0.1 se procede a extenderlo con un nuevo término de temperatura y se evalúa de nuevo el "score test", introduciendo la variable que tiene mejor puntuación. De este modo se sigue un proceso iterativo hasta que la inclusión de un nuevo término no mejore significativamente el modelo, considerando mejora significativa la de la lejanía del modelo con p<0.1. Al efectuar este proceso en el ejemplo, se incluyen los retardos de orden 1, 2 y 7 de la temperatura media y el retardo de orden 1 de la variable temperatura media al cuadrado.
Humedad
En el caso de la humedad relativa, se efectúa un proceso semejante al seguido con las temperaturas. Se calculan los retardos de orden 1 a 7, tanto para la humedad como para su cuadrado. Se sigue el proceso iterativo de ampliación del modelo utilizando el "score test" y añadiendo al modelo la variable de humedad de mayor puntuación, hasta que añadir una no mejore el modelo significativamente. Al efectuar el proceso se incluye la humedad del día y los retardos de orden 4 para la humedad y la humedad al cuadrado.
En la figura 3 se observa la serie de mortalidad estudiada tras ajustar los términos sinusoidales y las variables de temperatura y humedad.
Figura 3 Ajuste de variables sinusoidales, de temperatura y humedad para las defunciones diarias por todas las causas menos externas en la ciudad de Valencia 1992-1996
Modelo ajustado con términos sinusoidales
y de orden k= 1, 2,3,4 y 5., retardos 1,2 y 7 de la temperatura media y retardo 7 de la temperatura media al cuadrado, humedad y retardos 4 de la humedad y la humedad al cuadrado. Al ajuste se le ha añadido 20 para poder visualizar el ajuste.
Años de estudio
Debido a que el proyecto EMECAM tiene por objeto evaluar la asociación diaria entre mortalidad y contaminación y no otros tipos de relación temporal, y con el fin de controlar posibles diferencias por año se crea una variable indicador para cada año, excepto para el primero, que es seleccionado como referencia, siendo en el ejemplo el año 1992. Estas variables toman el valor 1 cuando las observaciones corresponden a ese mismo año y 0 cuando corresponden a otros años. Se incluyen en el modelo de forma conjunta (en bloque) y sólo si se produce una mejora de la lejanía en p<0.1. En el ejemplo han sido incluidas.
Tendencia
Además de la estacionalidad y diferencias anuales, puede haber una tendencia secular en la serie que no necesariamente tiene que ser lineal. Con el fin de controlarla se crean dos variables. Una es el número de días transcurridos desde el primer día de la serie (tendencia) y otra su cuadrado. Se añade al modelo la variable que entre las dos mejore la lejanía. En nuestro caso ambas variables mejoran el modelo.
Días de la semana
Tanto la mortalidad como la contaminación tienen un patrón semanal. Por ello se crean 6 variables indicadoras, una para cada día de la semana a excepción del lunes tomado como referencia, que valen 1 si la observación es de ese día y 0 en otro caso. Al estar relacionadas con las dos variables de interés se decidió que estas variables debían mantenerse en el modelo independientemente de su significación estadística.
Días festivos
Además del día de la semana hay que tener en cuenta si un día fue o no festivo, por la disminución de la contaminación. Esta variables sólo se incluyen si mejoran la lejanía en p<0.1, lo que no ha ocurrido en el ejemplo.
Gripe
La gripe también se relaciona con ambas variables de interés. Con el fin de controlarla se calcula el número de gripes diarias como el número de gripes semanales divido por siete. Se obtienen los retardos de hasta orden 15, para disponer de variación en los datos. Se procede del mismo modo que en el caso de la temperatura y humedad. Se calcula el "score test" para cada una de las variables incluyendo progresivamente aquellos retardos con mayor puntuación en el test y que mejoren la lejanía en p<0.10. En el ejemplo se han incluido los términos de la gripe del día y los retardos 2 y 8.
Reevaluación del modelo
Una vez incluidas las variables seleccionadas según el proceso anterior, se reevalúa el modelo, para observar si alguna pareja de términos sinusoidales o variables meteorológicas tienen el nivel de significación del contraste de Wald por encima de p=0.10. En ese caso se eliminarían del modelo la variable o pareja de variables que al excluirlas no produjeran una modificación significativa de la lejanía del modelo (p<0.1). En el ejemplo todas las variables se mantuvieron en el modelo. Así en la tabla 1 se muestra el modelo basal finalmente ajustado y en la figura 4 se muestra el resultado del ajuste y los residuos.
Figura 4 Ajuste del modelo Poisson para las defunciones diarias por todas las causas menos externas en la ciudad de Valencia 1992-1996.
Tabla 1 Ajuste del modelo basal de regresión de Poisson para las defunciones diarias por todas las causas menos externas en la ciudad de Valencia 1992-1996.
Selección de las variables de contaminación atmosférica
Una vez identificado el modelo basal se introducen en él cada uno de los contaminantes por separado y cada uno de sus retardos hasta orden 5. En un primer momento, el análisis se efectúa diferenciado para cada contaminante y cada retraso. En el caso del ejemplo se ha efectuado el análisis con la variable humos negros, observando una relación significativa (p=0.045) con el primer retardo de humos negros
Autocorrelación residual
Con el fin de controlar la posible autocorrelación seriada existente, se añaden los retardos de la mortalidad hasta orden 7 en bloque, eliminándose sucesivamente aquellos que no son significativos, utilizando el contraste de verosimilitudes. De este modo se elige el retardo de la mortalidad correspondiente. Para el ejemplo con el retardo de orden 1 de humos negros se tiene que añadir el término autoregresivo de orden 3 de la mortalidad.
Análisis por semestres
Con el fin de analizar si la relación de la contaminación con la mortalidad es diferente según la época del año, se agrupan los meses en dos grupos, el semestre frío de noviembre a abril ambos inclusive, y el semestre cálido de mayo a octubre ambos inclusive. Para ver el efecto por semestres, no se lleva a cabo un análisis estratificado, dada la disminución de los efectivos y el problema de usar variables con retardo. Por ello, se incluyen términos de interacción con la contaminación. Así se crean dos variables indicadoras. La primera "frío" vale 1 cuando el semestre es el frío y 0 en el otro caso. La segunda "cálido" toma el valor 1 cuando el semestre es el cálido y 0 en caso contrario.
Para obtener el efecto del contaminante en los meses fríos se incluyen en el modelo la variable cálido y su interacción con el contaminante. De este modo el coeficiente que acompaña al efecto principal del contaminante corresponde al efecto cuando la variable cálido es 0, es decir el efecto en los meses fríos. El intervalo de confianza de la estimación se obtiene directamente a partir del error estándar. En el ejemplo, el coeficiente que acompaña al primer retardo de los humos al incluir la interacción con la variable cálido es 0.0005541 y su error estándar es 0.000389 y un nivel de significación de p=0.155.
Análogamente, para obtener el efecto del contaminante en los meses cálidos se incluye en el modelo la variable frío y su interacción con el contaminante. Se observa el coeficiente que acompaña a la variable del contaminante sin interacción, siendo el efecto en los meses cálidos y obteniéndose el intervalo de confianza directamente a partir del error estándar. En el ejemplo el coeficiente correspondiente al primer retardo de los humos negros al incluir la interacción con la variable frío es 0.001336, con un error estándar de 0.000722 y con una significación de p=0.064.
Grupo EMECAM
F Ballester, S Pérez-Hoyos, JM Tenías, R Molina, J González-Aracil (Valencia, Centro coordinador); M Saez, MA Barceló, C Saurina, A Tobias (Barcelona); E. Alonso, K. Cambra (Bilbao); M Taracido, JM Barros, I Castro, A Figueiras, A Montes, E Smyth (Vigo); JM Ordóñez, E Aranguez, I Galán, AM Gandarillas (Madrid); I Aguinaga, MY Floristan, F Guillén, MS Laborda, MA Martínez, MT Martínez, PJ Oviedo (Pamplona); A Daponte, R Garrido de la Sierra, JL Gurucelain, P. Gutiérrez, JA Maldonado, JL Martín, JM Mayoral, R Ocaña, J Serrano (Granada); JB Bellido, A Arnedo, F González (Castellón); JJ Guillén, Ll Cirera, L García, E Jiménez, MJ Martínez, S Moreno, C Navarro (Cartagena); MJ Pérez, A Alonso, JJ Estíbalez, MA García-Calabuig, (Vitoria); A Cañada, C Fernández, F Fernández, V García, I Huerta, V Rogríguez (Asturias); F Arribas, M Navarro, C Martos, MJ Rabanaque, E Muniesa, JM Abad, JI Urraca (Zaragoza); y J Sunyer como asesor del proyecto.
BIBLIOGRAFIA
1.- Ballester F, Sáez M, Alonso ME, Taracido M, Ordóñez JM, Aguinaga I et al. El proyecto EMECAM: Estudio Multicéntrico Español sobre la relación entre la contaminación atmosférica y la mortalidad. Antecedentes, participantes, objetivos y material y métodos. Rev Esp Salud Publica 1999;165-175.
2 – Sáez M, Pérez-Hoyos S, Tobias A, Saurina C, Barceló MA, Ballester F Métodos de series temporales en los estudios epidemiológicos sobre contaminación atmosférica. Rev Esp Salud Publica 1999; 133-143.
3.- Katsouyanni K, Schwartz J, Spix C, Touloumi G, Zmirou D, Sanobetti et al. Short term effects of air pollution on health: A European approach using epidemiologic time series data: The APHEA protocol. J Epidemiol Community Health 1996;50 (Suppl 1):S12-S18.
4.- Schwartz J, Spix C, Touloumi G, Bachárová L, Barumamdzadeh T, leTertre et al. Methodological issues in studies of air pollution and daily counts of deaths or hospital admissions. J Epidemiol Community Health 1996;50(Suppl 1):S3-S11.
5.- Egret User Manual. Seattle Washington: Statistics and Epidemiology Research Corporation; 1991.
6.- Breslow NE, Day NE. Statistical Methods for Cancer Research Vol II. The design and analysis of cohort studies. Lyon.: IARC; 1987
Santiago Pérez-Hoyos (1), Marc Sáez Zafra, (2), Mª Antonia Barceló (2), Coldo Cambra (3), Adolfo Figueiras Guzmán (4), José Mª Ordóñez (5), Francisco Guillén Grima (6), Ricardo Ocaña (7), Juan Bellido (8), Lluis Cirera Suárez (9), Andrés Alonso López (10), Valentín Rodríguez (11), Tomás Alcalá Nalvaiz (12), Ferran Ballester Díez (1) por el Grupo EMECAM.
(1) Institut Valencià d'Estudis en Salut Pública (IVESP). Generalitat Valenciana. (2) Universitat de Girona. Departament d'Economia (3) Departamento de Sanidad del Gobierno Vasco. (4) Universidad de Santiago. Facultad de Medicina. (5) Dirección General de Prevención y Promoción de Salud. Comunidad de Madrid. (6) Area de Sanidad y Medioambiente. Ayuntamiento de Pamplona. (7) Escuela Andaluza de Salud Publica. (8) Centro Salud Pública Area 2. Castelló. Conselleria de Sanitat (9) Centro Area Cartagena. Consejería de Sanidad de la Comunidad de Murcia. (10) Departamento de Salud y Consumo. Ayuntamiento de Vitoria-Gasteiz. (11) Dirección Regional de Salud Pública. Asturias. (12) Dirección General de Salud Pública. Aragón.
Correspondencia: Santiago Pérez Hoyos. Institut Valencià dEstudis en Salut Pública (IVESP). C/ Joan de Garay, 21. 46017 València (*) Este trabajo cuenta con una beca del Fondo de Investigaciones Sanitarias (Expediente núm 97/0051).
Página anterior | Volver al principio del trabajo | Página siguiente |