Descargar

Introducción a los modelos multivariables (página 3)


Partes: 1, 2, 3, 4

El valor nulo de una HR es 1, al igual que para la odds ratio. Cuando el intervalo de confianza al 95% incluya la hipótesis nula (HR=1), sabremos que las diferencias en la incidencia de cáncer de piel no serán significativamente diferentes entre las categorías comparadas. Esto no ocurre en ninguno de los 3 HR estimados en el ejemplo, ya que sus IC 95% son:

Carga Solar moderada: 1,40 – 44,97

Carga solar intensa: 2,90 – 97,27

Fototipo moreno (se broncea): 0,05 – 0,34

12.4.5. Diferencias entre Hazard ratio y riesgo relativo

En muchos sitios se habla de la Hazard Ratio como si fuera un riesgo relativo y se interpreta con expresiones como "tales pacientes tienen un riesgo X veces superior de morir que tales otros ajustando por las demás variables del modelo". Esto es básicamente aceptable, pero debe matizarse, ya que el análisis de supervivencia con regresión de Cox no compara riesgos propiamente dichos (proporciones) sino tasas instantáneas, es decir "la rapidez con la cual se pasa de un estado a otro ajustando por las demás variables del modelo". Por lo tanto, la "Hazard Ratio" expresa cuantas veces es más rápida la ocurrencia de la muerte u otro fenómeno en grupo que en otro. Viene a ser como un cociente entre dos velocidades.

Una Hazard Ratio de 2 significa que se multiplica por 2 la velocidad con que ocurre una enfermedad (o el acontecimiento que sea) en los sujetos que están expuestos al factor de riesgo. Una Hazard Ratio de 1 significa que el efecto del factor es nulo. Un valor de 0,5 significa que esa exposición en vez de aumentar el riesgo lo reduce a la mitad. Si la exposición fuese cuantitativa habría que elevar edu.redpero multiplicándolo por el incremento en unidades de la variable independiente cuya Hazard Ratio queramos estimar, tal como hacíamos en el ejemplo de regresión logística con la edad.

12.5. Otros métodos multivariantes

12.5.1. Regresión de Poisson (modelos log-lineales)

Se observaron 33 casos de una enfermedad en 600 personas-mes. Su distribución por edad y sexo es la que muestra la tabla 12.15. En esa tabla cada fila no corresponde a una persona sino a un grupo de personas definido por su edad y sexo.

Tabla 12.15. Formato que suelen tener los datos cuando se aplica una regresión de Poisson. La parte sombreada corresponde a los cálculos hechos "a mano"

sexo

casos

pers_mes

age20_40

agegt40

DI

RR hombres

RR 20-40

RR >40

1

4

100

0

0

0,04

2

1

6

100

1

0

0,06

2

1,5

1

12

100

0

1

0,12

2

3

0

2

100

0

0

0,02

0

3

100

1

0

0,03

1,5

0

6

100

0

1

0,06

3

Hombres: Sexo=1. Mujeres: Sexo =0. Pers_mes: personas-meses de seguimiento (1 persona seguida 10 meses constituye 10 personas-meses.

Casos: número de casos nuevos de una enfermedad que se han producido en cada categoría.

La variable "age20_40"es una variable dummy que vale 1 para quienes entre 20 y 40 años y 0 en caso contrario. La variable "agegt40"es una variable dummy que vale 1 para quienes más de 40 años y 0 en caso contrario. La referencia sería quienes tienen menos de 20 años.

DI= densidad de incidencia (tasa que expresa el número de casos por cada persona-mes). Así, entre los hombres de <20 años la DI es de 4 casos nuevos por cada 100 personas-mes (0,04 meses-1).

RR = riesgo relativo (en realidad es una razón de tasas). Se calcula un riesgo relativo para los hombres comparados con las mujeres, otro para los de 20-40 años comparados con quienes tienen menos de 20 años y otro para los que tienen más de 40 años comparados también con quienes tienen menos de 20 años.

El modelo de Poisson se expresa así:

edu.red

Donde ln(DI) es el logaritmo neperiano de la densidad de incidencia (casos/personas-mes), bi son los coeficientes y xi son las variables independientes o predictoras. Se cumple que

Riesgo Relativo ( Razón de Densidad de Incidencia = Exp (bi).

Si se usa Stata para aplicar a la base de datos de la tabla 12.15 un modelo de Poisson (se recomienda usar Stata en vez de SPSS para esta finalidad), se obtendrá:

edu.red

Interpretación:

Stata produce en primer lugar las estimaciones de los coeficientes bi. Puede comprobarse que utilizando estos coeficientes como exponentes del número e se obtienen los riesgos relativos (RR, pero propiamente son razones de tasas o de densidad de incidencia):

Exp (0,6931472) = 2,000 (RR de hombres comparados con mujeres)

Exp (0,4054651) = 1,500 (RR de quienes tienen 20 a 40 años comparados con los de <20)

Exp (1,098612) = 3,000 (RR de quienes tienen >40 años comparados con los de <20)

Como en otros modelos de regresión, cada coficiente viene seguido de su respectivo error estándar (Std. Err.). Diviendo el coeficiente por su error estándar se obtiene un valor z que sigue una distribución normal (empieza a ser significativo al 5% a dos colas cuando z>1,96). La siguiente columna de Stata (P>|z|) corresponde al valor p de significación estadística a dos colas. Por último se presentan los intervalos de confianza al 95% para los coeficientes.

El modelo de Poisson, como todo modelo de regresión sirve para hacer predicciones de riesgos (tasas en este caso) absolutos. Para predecir la tasa (DI) de un varón de más de 40 años, se utilizaría la ecuación:

edu.red

Puede observarse que lo observado coincide con lo predicho por el modelo.

12.5.2. Análisis factorial (análisis de componentes principales)

En este análisis no hay una variable dependiente y muchas independientes que se usen para explicarla o predecirla. En cambio, el análisis factorial pretende extraer de una base de datos con muchas variables un pequeño grupo de factores (se les llama "componentes principales") que consigan proporcionar de manera resumida gran parte de la información contenida en todas las variables iniciales. Es, por tanto, una técnica de reducción de variables. En principio, los factores o componentes principales que se obtienen con esta técnica no están correlacionados entre sí y extraen la estructura latente o subyacente de las variables de la base de datos. La figura 12.11 es un esquema del análisis factorial.

Figura 12.11. Ejemplo de análisis factorial (componentes principales)

edu.red

12.5.2. Análisis de cluster

Al igual que el análisis factorial es una técnica descriptiva que trata de sintentizar los datos, pero en vez de resumir el número de variables (columna) lo que tiende es a formar grupos homogéneos de sujetos (vendría ser reducir las filas). Este análisis facilita la clasificación de los sujetos en función de una serie de variables. Coloca en el mismo grupo a quienes tienen unos valores parecidos de esas variables. Un cluster es, por tanto, un grupo de sujetos que están próximos entre sí en el espacio multidimensional definido por las variables consideradas para su clasificación.

El proceso se inicia con la definición de un número grande clusters, tantos como sujetos existen en la base de datos y poco a poco se les va agrupando en función de la proximidad entre ellos, al principio en muchos grupos con pocos individuos cada uno, pero que son muy parecidos entre sí, hasta llegar al máximo nivel que es el de un solo grupo que continene a todos los sujetos. Al método gráfico de representar esta progresiva agrupación se le llama dendograma. En un eje del dendograma se sitúan los sujetos y en el otro las distancias (proximidades) entre cada cluster y otro.

12.5.3. MANOVA y ANCOVA

El MANOVA o análisis multivariante de la varianza no sólo puede tener en cuenta muchas variables independientes, sino que usa además varias variables dependientes, que de algún modo miden la misma respuesta desde distintos puntos de vista. Por ejemplo, si se desean ver predictores de adiposidad, en vez de usar como respuesta o variable dependiente solamente el índice de masa corporal (IMC), se puede decidir usar 3 variables de respuesta: IMC, índice cintura-cadera y grosor de pliegues cutáneos. El MANOVA permite manejar a la vez, en un solo análisis varias variables dependientes. Lógicamente también valorará una serie de predictores o variables independientes (en el ejemplo: edad, actividad física, hábitos alimentarios, variantes genéticas, etc.).

El ANCOVA es un análisis de la varianza que permite usar como variables independientes no sólo factores (variables cualitativas) sino también variables numéricas o cuantitativas. Es equivalente a una regresión lineal cuando ésta se programa adecuadamente.

Referencias

Altman DG, Deeks JJ, Sackett DL (1998). Odds ratios should be avoided when events are common. BMJ 1998;317:1318.

Altman DG, Goodman SN (1994). Transfer of technology from statistical journals to the biomedical literature. Past trends and future predictions. JAMA 1994;272:129-32.

Bautista LE (1995). "Razón relativa" y "tasa relativa" como traducciones de odds ratio y de hazard ratio. Bol Ofic Sanit Panam 1995;119:278-80.

Bland JM, Altman DG (2000). Statistics notes. The odds ratio. BMJ 2000;320:1468.

Cox DR (1972). Regression model and life tables. J Roy Statist Soc B 1972;34:187-220.

de Irala-Estévez J, Fernández-Créhuet R (1996). Apuntes de Epidemiología General. Pamplona: Newbook, 1996.

de Irala-Estévez J, Fernández Crehuet R, Serrano del Castillo A (1997). Abnormally wide confidence intervals in logistic regression: interpretation of statistical program results. Rev Panam Salud Pública-Pan Am J Public Health 1997; 2:268-71.

de Irala-Estévez J, Díaz Molina C, Fernández-Créhuet R (1999). Regresión logística aplicada en Ciencias de la Salud. Pamplona: Newbook, 1999.

de Irala J, Martinez-Gonzalez MA, Guillen Grima F (2001). ¿Qué es una variable de confusión? Med Clin (Barc). 2001;117:377-85. Fé errata: Med Clin (Barc) 2001;117:775.

de Irala J, Martínez-González MA, Seguí-Gómez M (2004). Epidemiología aplicada. Barcelona: Ariel. 2004.

España A, Martínez-González MA, García-Granero M, Sánchez-Carpintero I, Rábago G, Herreros J. A prospective study of incident non-melanoma skin cancer in heart transplant recipients. J Invest Dermatol 2000;115:1158-60.

Estruch R, Martínez-González MA, Corella D, et al (2006). Effects of a Mediterranean-Style Diet on Classical and Novel Risk Factors for Coronary Heart Disease: The PREDIMED Study, a Multicenter, Randomized, Controlled, Feeding Trial. Ann Intern Med 2006.

Greenland S (1995). Dose-response and trend analysis in epidemiology: alternatives to categorical analysis. Epidemiology 1995;6:356-65.

Greenland S, Pearl J, Robins JM (1999). Causal diagrams for epidemiologic research. Epidemiology 1999;10:37-48.

Greenland S, Morgenstern H (2001). Confounding in health research. Annu Rev Public Health. 2001;22:189-212.

Hernan MA, Hernandez-Diaz S, Werler MM, Mitchell AA (2002). Causal knowledge as a prerequisite for confounding evaluation: an application to birth defects epidemiology. Am J Epidemiol. 2002;155:176-84.

Hosmer DW, Lemeshow SA (1989). Applied logistic regression. N. York: Wiley, 1989.

Joffe M, Mindell J (2006). Complex causal process diagrams for analyzing the health impacts of policy interventions. Am J Public Health. 2006;96:473-9.

Lachenbruch PA (1997). The odds ratio. Control Clin Trials 1997;18:381-2.

Lumley T, Diehr P, Emerson S, Chen L (2002). The importance of the normality assumption in large public health data sets. Annu Rev Public Health 2002;23:151-69.

Martín-Moreno JM (1990). Oportunidad relativa: reflexiones en torno a la traducción del término "odds ratio". Gac Sanit 1990;4:37.

Martínez-González MA, De Irala-Estévez J, Guillén-Grima F (1999). ¿Qué es una odds ratio? Med Clin (Barc.) 1999;112:416-22.

Martínez-González MA (2006). The SUN cohort study (Seguimiento University of Navarra). Public Health Nutrition 2006;9(1A);127–131

McNutt LA, Hafner JP, Xue X (1999). Correcting the odds ratio in cohort studies of common outcomes. JAMA 1999;282:529.

Rothman KJ, Greenland S (1998). Precision and validity in epidemiologic studies. En Rothman KJ, Greenland S (eds). Modern Epidemiology. 2nd ed. Philadelphia: Lippincott-Raven, 1998;115-34.

Sangro B, Herraiz M, Martínez-González MA, Bilbao I, Herrero I, Beloqui O, Betes M, de la Peña A, Cienfuegos JA, Quiroga J, Prieto J (1998). Prognosis of hepatocellular carcinoma in relation to treatment: a multivariate analysis of 178 patients from a single European institution. Surgery 1998;124:575-83.

Zhang J, Yu KF (1998). What's the relative risk? A method of correcting the odds ratio in cohort studies of common outcomes. JAMA 1998;280:1690-1.

Enviado por:

Ing.+Lic. Yunior Andrés Castillo S.

"NO A LA CULTURA DEL SECRETO, SI A LA LIBERTAD DE INFORMACION"®

www.monografias.com/usuario/perfiles/ing_lic_yunior_andra_s_castillo_s/monografias

Santiago de los Caballeros,

República Dominicana,

2015.

"DIOS, JUAN PABLO DUARTE Y JUAN BOSCH – POR SIEMPRE"®

Partes: 1, 2, 3, 4
 Página anterior Volver al principio del trabajoPágina siguiente