Descargar

Funciones para la estimación de características de enfermedades, modeladas como cadenas binomiales, con el MATHEMATICA

Enviado por sebrango


    1. Resumen
    2. Desarrollo
    3. Períodos infecciosos de duración fija
    4. Funciones en el MATHEMATICA
    5. Ejemplo de aplicación
    6. Conclusiones
    7. Bibliografía

    Resumen

    Los avances de la computación han contribuido notablemente al fortalecimiento de la potencia de las matemáticas como herramienta. La modelación matemática en la epidemiología se ha beneficiado notablemente con estos avances.

    El presente trabajo tiene como objetivo elaborar dos funciones en el software MATHEMATICA que permitan la estimación del período de latencia e infeccioso, así como de la razón instantánea de propagación de la enfermedad en el tiempo para grupos familiares de dos en enfermedades modeladas por cadenas binomiales de modo que sean útiles para epidemiólogos, estadísticos e investigadores. Se muestra un ejemplo de cómo pueden ser utilizados estas funciones en epidemias reales.

    Palabras claves: Cadenas binomiales, Epidemias, MATHEMATICA.

    Introducción

    Los datos de los tamaños de epidemias pueden ser obtenidos incluso cuando hay muy poca información acerca de los puntos en el tiempo en los que los casos mostraron sus síntomas. La clasificación de epidemias en varias cadenas requiere al menos de un conocimiento vago de los datos en los que los síntomas se mostraron. Sin embargo, los análisis basados en datos de tamaño de epidemia o los datos de cadena no proporcionan información acerca de la razón de propagación de la enfermedad en el tiempo. En este trabajo se hace un intento por utilizar los datos en los tiempos a los que los síntomas son mostrados para hacer inferencia acerca de características del tiempo de la enfermedad, tales como las duraciones de los períodos de latencia e infeccioso así como la razón instantánea de propagación de la enfermedad en el tiempo.

    El presente trabajo tiene como objetivo elaborar dos funciones en el software MATHEMATICA que permitan la estimación del período de latencia e infeccioso, así como de la razón instantánea de propagación de la enfermedad en el tiempo para grupos familiares de dos en enfermedades modeladas por cadenas binomiales de modo que sean útiles para epidemiólogos, estadísticos e investigadores. Se muestra un ejemplo de cómo pueden ser utilizados estas funciones en epidemias reales.

    Desarrollo

    El método de inferencia sobre características del período de latencia es menos trivial porque el tiempo preciso al cual el contacto infeccioso ocurre no es observable.

    Para explicar como puede ser hecha una inferencia sobre la razón de infección y características del período de latencia se considerarán los grupos familiares de tamaño dos. Se asume que las epidemias observadas pueden ser clasificadas en las cadenas

    2 – dos casos introductorios

    1 – un caso introductorio, ningún caso secundario

    1® 1 – un caso introductorio, un caso secundario

    Los datos de un grupo familiar afectado con dos casos introductorios no contienen información sobre, porque representa una razón de infección dentro de los grupos familiares. Si la duración del período de latencia tiene la función de densidad

    , , (1.1)

    Un grupo familiar con dos casos introductorios y observaciones correspondientes (U1, W1)=(u1, w1), (U2, W2)=(u2, w2) hace una contribución

    (1.2)

    a la función de verosimilitud. Aquí Y es la duración del período infeccioso en el que están las observaciones y . Las funciones y representan las funciones de densidad de X y Y. La integral es la densidad de U2- U1 evaluada en u2 – u1.

    Considere ahora grupos familiares afectados de tamaño dos con un caso introductorio y ningún caso secundario. Un grupo familiar con un caso introductorio y ningún caso secundario, brindando la observación (U, W) = (u, w) hace una contribución de

    (1.3)

    a la función de verosimilitud. El término exponencial representa la probabilidad de que el susceptible restante escape de la infección cuando está expuesto a un infectado que es infeccioso por una duración de (w – u) unidades de tiempo.

    Finalmente consideremos grupos familiares afectados de tamaño dos que tienen la cadena observada 1® 1. Un grupo familiar con cadena 1® 1 y períodos infecciosos (u1, w1) y (u2, w2) hace una contribución

    (1.4)

    a la función de verosimilitud.

    La parte de la función de verosimilitud relevante para la inferencia de o los parámetros de la distribución de X están dados por

    donde denota el producto de tales términos sobre todos los grupos familiares del tipo de cadena c. Esta función de verosimilitud es una función de y de algunos parámetros de la distribución , y puede ser usada para hacer inferencia sobre estos parámetros. Para utilizar esta función de verosimilitud es necesario estipular una familia de distribuciones para . Claramente es conveniente elegir tal que el cálculo de las integrales en la anterior función de verosimilitud no presente dificultades. Se sugieren tres posibilidades diferentes aquí. Cada una de estas guía a una función de verosimilitud la que es maximizada con ayuda de la computadora.

    Elección de la función de densidad

    Una posibilidad es asumir que X tiene una distribución exponencial cambiada dada por (1.1). Con esta elección uno sustituye

    y

    ,

    =

    ,

    en la expresión para la función de verosimilitud. Aquí denota el mínimo de a y b, mientras el mayor de a y b.

    Otra posibilidad es asumir que X tiene una distribución normal con media y varianza . Con esta elección uno aproxima términos de la forma por

    ,

    que es razonable cuando es pequeño. También se utiliza

    en la expresión para la función de verosimilitud, donde es la función de distribución para la distribución normal estándar y .

    Con estas tres elecciones para la distribución de la duración del período de latencia parecería tener suficiente alcance para satisfacer la mayoría de las aplicaciones. La construcción de la función de verosimilitud se convierte rápidamente más complicada cuando el tamaño del grupo familiar crece.

    Períodos infecciosos de duración fija

    Considere la situación que Y, la duración del período infeccioso, es una constante. Las contribuciones de verosimilitud para epidemias 2, 1 y 1® 1 en grupos familiares de dos son expresadas por

    , y

    respectivamente.

    Para el propósito de estimación máximo verosímil se debe especificar una familia paramétricas para X, la duración del período de latencia. Específicamente, se asume que la distribución de X es aproximada por una distribución normal con media y varianza . Las contribuciones de verosimilitud debidas a las cadenas de tipo 2, 1 y 1® 1 en grupos familiares de dos están dadas por

    ,

    y

    ,

    respectivamente. Aquí , mientras es la función de distribución, de la normal estándar.

    Funciones en el MATHEMATICA

    La cantidad de cálculos asociados a la estimación de cualquiera de las características de las enfermedades es bastante voluminosa, pero utilizando una computadora esto se reduce a unos minutos. Para lograr este objetivo se elaboraron dos funciones en el software MATHEMATICA que permiten la estimación del período de latencia e infeccioso, así como de la razón instantánea de propagación de la enfermedad en el tiempo para grupos familiares de dos en enfermedades modeladas por cadenas binomiales.

    A continuación aparece la sintaxis y la salida de cada una de las dos funciones:

    Ehousexpof2[l,, ,,,,,,,,,,,,,,]: Las estimaciones máximo verosímiles de y las frecuencias ajustadas de las cadenas de tipo 1, 2 y para grupos familiares de dos cuando el período de latencia tiene función de densidad , y período infeccioso constante dados las frecuencias observadas de cadena l, en forma de lista donde el primer elemento es las frecuencias observadas de la cadena 1 y los otros elementos son listas de la forma {día, casos observado} ({o1,{d0, o0},…{dn, on}}) y , ,, dos estimaciones iniciales para y el rango de y así sucesivamente para todos los parámetros.

    Enormalhouseof2[l,x0,y0,z0, ]: Las estimaciones máximo verosímiles de y las frecuencias ajustadas de las cadenas de tipo 1, 2 y para grupos familiares de dos cuando el período de latencia tiene distribución y período infeccioso constante dadas las frecuencias observadas de cadena l, en forma de lista donde el primer elemento es las frecuencias observadas de la cadena 1 y los otros elementos son listas de la forma {día, casos observado} ({o1,{d0,o0},…{dn,on}}), la estimación inicial de (x0), la estimación inicial de (y0) y la estimación inicial de .

    Ejemplo de aplicación

    Como una ilustración de los métodos de análisis descritos en este capítulo se aplican algunos de ellos a los datos de Hope Simpson de sarampión de grupos familiares de dos (Área de Cincester 1946-1952). Estos datos son tomados de Bailey (1975) y relacionan 264 grupos familiares que constan de dos niños menores de 15 años. Hubo 45 grupos familiares con un caso simple y las duraciones de tiempo, en días, entre casos para los 219 grupos familiares con dos casos están especificadas en la Tabla 1. Las epidemias con dos casos consisten de cadenas 2 y 1® 1. En la misión de identificar la cadena uno es ayudado algunas veces por contactos de seguimiento. Aquí, un poco arbitrariamente, se toman epidemias con un intervalo de tiempo observado entre la detección de casos menores que 6 para cadenas de tipo 2. En esta forma tenemos, aparte de las 45 cadenas de tipo 1, 32 cadenas de tipo 2 y 187 cadenas de tipo 1® 1.

    Analice ahora estos datos asumiendo que la duración del período infeccioso es una constante denotada por, mientras la duración del período de latencia es una variable aleatoria con función de densidad dada por

    , .

    El parámetro representa el período de latencia posible más corto. Bajo estas suposiciones que los infectados son retirados inmediatamente con la muestra de los síntomas y su retiro es precedido por un período infeccioso de duración, uno también puede ver a como el intervalo de tiempo posible más corto entre los casos de una epidemia 1® 1. Los datos y las suposiciones presentes implican que.

    La función de verosimilitud construida en esta forma va a ser maximizada con respecto a y con el uso de una función en el software MATHEMATICA. Es útil tener algunas estimaciones iniciales sensibles. Un valor inicial para es 3.0, el valor medio de su rango de valores. Considerando solo la parte de la función de verosimilitud contribuida por la cadena de tipo 2, se obtiene una estimación máximo verosímil "parcial" de . De acuerdo con esto 0.5 parece un valor de comienzo sensible para. La distribución condicional del número de cadenas de tipo 1 dado que hay 232 grupos familiares afectados con un caso introductorio es binomial con parámetro . Por lo que una estimación rápida de está dada igualando a. Con un supuesto sensible como días esto sugiere una estimación inicial de 0.8 para . Tales métodos rápidos son suficientes para determinar estimaciones iniciales ya que las mejorías iterativas a ser estimadas son realizadas en una computadora.

    Las estimaciones máximo verosímiles obtenidas a través del MATHEMATICA fueron

    ,,,.

    A continuación aparece la función del MATHEMATICA y su salida

    De este modo la duración media del período de latencia es estimada por días, mientras la desviación estándar de la duración del período de latencia es estimada por días. La duración del período infeccioso es estimada por 6.2 días y la razón de infección operando durante el período infeccioso es 0.24. No es tan fácil apreciar la significación de y puede ser más fácil interpretarla en términos de la probabilidad de que el segundo susceptible escape de la infección dado que hay un caso introductorio. Bajo las suposiciones presentes esta probabilidad está dada por y es estimada por .

    Supongamos que la duración del período de latencia tiene una distribución normal con media y desviación estándar.

    Las estimaciones máximo verosímiles obtenidas a través del MATHEMATICA fueron:

    y

    A continuación aparece la función del MATHEMATICA y su salida

    Para propósitos prácticos, se estima que el período de latencia medio para el sarampión es de 8 días con una desviación estándar de 2 días, mientras el período infeccioso medio es aproximadamente 6 días. La probabilidad de que el segundo susceptible de un grupo familiar de dos susceptibles escape de la infección por el solo caso introductorio es estimada por 0.2.

    Tabla #1 Frecuencias observadas y ajustadas de intervalos de tiempo entre la detección de dos casos de sarampión.

    Intervalo observado

    Frecuencia observada

    Frecuencia ajustada

    Intervalo observado

    Frecuencia observada

    Frecuencia ajustada

    0

    5

    5.95064

    11

    38

    22.7455

    1

    13

    8.78736

    12

    26

    19.8494

    2

    5

    5.82308

    13

    12

    13.1535

    3

    4

    3.85875

    14

    15

    8.71638

    4

    3

    2.55706

    15

    6

    5.77604

    5

    2

    1.69447

    16

    3

    3.82758

    6

    4

    3.74534

    17

    1

    2.5364

    7

    11

    18.4505

    18

    3

    1.68079

    8

    5

    24.7706

    19

    0

    1.1138

    9

    25

    26.2686

    20

    0

    0.738075

    10

    37

    25.1481

    21

    1

    0.489096

    Conclusiones

    • Existe modelos en los que se hacen inferencias acerca de los períodos de latencia e infeccioso. Su aplicación consecuente exige la necesidad de implementar técnicas computacionales que puedan ser utilizadas por epidemiólogos.
    • Se elaboraron funciones en el software MATHEMATICA que permite la estimación del período de latencia e infeccioso, así como de la razón instantánea de propagación de la enfermedad en el tiempo para grupos familiares de dos en enfermedades modeladas por cadenas binomiales, de modo que sean útiles para epidemiólogos, estadísticos e investigadores.

    Bibliografía

    Bailey, N.T.J. (1954) "A statistical method of estimating the periods of incubation and infection of an infectious disease". Nature, 174, p 139-140.

    Bailey, N.T.J. (1975) "The mathematical theory of infectious diseases and it’s applications", Charles Griffin 7 Company Limited.

    Becker, N.G. (1989) "Analysis of infectious disease data", New York: Chapman and Hall

    Grau, R. (1997) "Estadística aplicada a las investigaciones de salud". Notas. Curso corto impartido en el Centro de Estadística Aplicada Modelación y Simulación-SAMOS, Univ. Paris 1, Panteon Sorbona, Francia.

    Grau, R. (1998) "Modelación Matemática de Epidemias". Notas. Curso impartido en la Escuela Internacional de Verano sobre Informática. Santa Clara Cuba.

    Wolfram, r.(1996) "Mathematica 3.0. Standard Add-on Packages". Wolfram Research. Cambridge University Press

    Wolfram, r.(1996) "The Mathematica book". Wolfram Research. Cambridge University Press.

     

     

     

    Autor:

    MSc. Carlos Rafael Sebrango Rodríguez

    Centro Universitario Sancti Spíritus.

    Licenciado en Matemática, 1993, Universidad de la Habana, Cuba.

    Master en Matemática Aplicada, mención Matemática Aplicada, 2001, Universidad Central "Martha Abreu" de Las Villas