Descargar

Aprendiendo sobre el genoma humano: Un año después . . .

Enviado por marcosdedonato


    1. Resumen
    2. ¿Qué hemos aprendido?
    3. ¿Cuántos genes tenemos?
    4. ADN repetitivo: ¿Útil o inútil?
    5. Estructura de los genes
    6. Comparándonos a otros organismos
    7. ¿Debemos patentar el ADN?
    8. ¿Quién ganó la carrera?
    9. Proyectos futuros
    10. Bibliografía

    RESUMEN

    El genoma humano contiene una cantidad extraordinaria de información acerca del desarrollo, la fisiología, anomalías y evolución de la especie. Este artículo pretende discutir sobre el análisis de la secuencia publicada en febrero de este año y sobre algunos temas polémicos al respecto. La comparación del genoma con otros genomas secuenciados ha demostrado una gran similitud. De esta comparación se observa que el número de genes estimados en los humanos (entre 30 a 40 mil) es mucho menor al esperado. Además existe mucha similitud entre la estructura de los genes y las proteínas. Sin embargo, los humanos parecen tener en promedio exones más pequeños e intrones mucho más grandes. Por su parte, las proteínas no parecen tener muchos más dominios nuevos sino mas bien muchas nuevas combinaciones de dominios ancestrales. Los elementos transponibles y retroelementos parecen estar inactivos. La tasa de mutación en la meiosis de los machos es el doble que en las hembras y la tasa de recombinación en los machos es menor que en las hembras. La tasa de recombinación tiende a ser mucho mayor en regiones distales de los cromosomas y en aquellos más pequeños comparados con los cromosomas grandes.

    Palabras Claves: proyecto genoma, genética humana.

    Artículo publicado en la revista de divulgación Fontus, Nº 8: 169-202 (2001), de la Asociación de Profesores de la Universidad de Oriente, Cumaná, Venezuela.

    ABSTRACT

    The human genome contains an extraordinary amount of information about the development, fisiology, anomalies and evolution of the species. This article tries to discuss about the sequence analysis published in February of this year and about some controversial related issues. The comparison of the genome with those of other species already sequenced have shown a great similarity. From this comparison it is clear that the estimated number of human genes (from 30 to 40 thousands) is a lot lower than expected. There is great similarity on the structure of the genes and the proteins. However, humans seem to have on average smaller exons and larger introns. The proteins do not showed a many new domains but new rearrangements of ancestral domains. The transposable elements and retroelements seem to be inactive. The mutation rate in the male meiosis is twice as much as in the female meiosis and the recombination rate in the males is lower than in the females. The recombination rate tend to be higher in distal regions of the chromosome and in the small chromosomes compared to the large ones.

    Key Words: genome project, human genetics.

    INTRODUCCIÓN

    El Proyecto Genoma Humano es quizás el desarrollo científico más significativo de los últimos treinta años, comparable al de la caminata del hombre en la luna a finales de los sesenta. A principios de este año se comenzó a publicar los resultados de los primeros análisis de la secuencia humana, comenzando con los artículos aparecidos en las revistas científicas Nature y Science en la primera semana de febrero.

    Este artículo pretende hacer un análisis de los aspectos más resaltantes de esa información y discutir sobre las polémicas suscitadas con la publicación de la secuencia humana. Asimismo, éste representa una continuación del artículo publicado en un número anterior de Fontus (De Donato, 2000) y se recomienda su lectura, sobre todo para aquellas personas no especializados en el área de Genética.

    ¿QUÉ HEMOS APRENDIDO?

    Durante el siglo pasado se inició la búsqueda del conocimiento para entender la naturaleza y contenido del material hereditario, comenzando con el redescubrimiento de las leyes de Mendel de la herencia. La consecución de hechos y descubrimientos se pueden dividir en cuatro fases que se corresponden aproximadamente a los cuatro cuartos del siglo XX. Primero se estableció la base celular de la herencia (los cromosomas), después se definió la base molecular de la herencia (la doble hélice del ADN), luego se conoció como es el flujo de información de la herencia, con el descubrimiento de los mecanismos moleculares de la célula y su aplicación in vitro y en el último cuarto de siglo se descifraron, primero genes y después genomas completos, dando inicio al campo de la genómica. Actualmente se han secuenciado 711 tipos de virus y viroides, 264 plásmidos que se encuentran en diversas especies, 207 organelos, 52 bacterias, un hongo, una planta y tres animales, incluyendo el hombre (se puede obtener una lista en la página de NCBI, http://www.ncbi.nlm.nih.gov:80/PMGifs/ Genomes).

    Todavía falta mucho por hacer para completar la secuenciación del genoma humano, pero con la gran mayoría de la información disponible libremente, se ha podido tener una perspectiva global del genoma de nuestra especie. Aunque muchos detalles van a cambiar al finalizar la secuenciación, los aspectos más resaltantes de lo que hemos aprendido se puede resumir en (International Human Genome Sequencing Consortium, IHGSC, 2001):

    1. La distribución de los diferentes elementos del genoma es heterogénea, incluyendo genes, elementos transponibles, contenido de GC, islas CpG y tasas de recombinación.

    2. Aunque el genoma humano sólo cuenta con cerca del doble de los genomas del gusano (Caenorhabditis elegans) y la mosca de la fruta (Drosophila melanogaster), nuestros genes son mucho más complejos, con más sitios alternativos de procesamiento que producen un mayor número de tipos de proteínas.

    3. Las proteínas humanas no sólo poseen más dominios que son específicos de los vertebrados sino que también tienen complejos rearreglos de dominios preexistentes.

    4. Cientos de genes humanos parecen haber resultado de una transferencia horizontal desde bacterias y unas docenas parecen haberse derivado de elementos transponibles.

    5. Los elementos transponibles y retroelementos parecen estar inactivos en el genoma humano.

    6. La tasa de mutación en la meiosis de los machos es el doble que en las hembras.

    7. Las tasas de recombinación tienden a ser mucho mayor en regiones distales (cerca de los telómeros) y en los cromosomas más cortos, en un patrón que promueve la ocurrencia de al menos un entrecruzamiento por brazo cromosómico en cada meiosis.

    ¿CUÁNTOS GENES TENEMOS?

    Estimados recientes han colocado el número de genes humanos entre 30 y 40 mil (Ewing & Green, 2000; IHGSC, 2001; Venter et al., 2001). De estos genes, más de 10.000 han sido catalogados en el libro "Online Mendilian Inheritance in Man" (OMIM) (McKusick, 1998) el cual contiene todos las enfermedades genéticas en humanos y los genes mutantes que las causan. Toda esta información está disponible vía Internet (Tabla 1). La integración de la información de esta base de datos con la secuencia humana ha permitido la localización de muchos de estos genes. Para el resto de los genes, es necesario el uso de recursos de bioinformática y del análisis de la información de los genes conocidos hasta ahora.

    Teniendo en cuenta que se han secuenciado unos 45 genomas de procariotas (bacterias) y cinco genomas de eucariotas (organismos superiores), es lógico pensar que el análisis de secuencias y la identificación de genes es algo sencillo. Sin embargo, a pesar de lo que conocemos ahora, los genomas más grandes son mucho más difíciles de analizar y sus genes son mucho más complejos, dificultando su identificación.

    Se utilizan muchos métodos para predecir la presencia de genes, los cuales están basados en señales específicas en la secuencia que permiten su expresión de manera apropiada. Desafortunadamente, estos métodos tienden a producir falsos positivos, lo que induce a una sobreestimación del número de genes. Además, estos métodos no funcionan bien en secuencias no terminadas, como lo es la mayoría de la secuencia humana.

    Por otra parte, la información de secuencias expresadas (EST y ADNc) y proteínas en humanos y otros organismos proveen una forma más precisa para el descubrimiento de los genes (Birney et al. 2001). Por ejemplo, los algoritmos matemáticos más efectivos integran métodos de predicción de genes con comparación de secuencias, entre los que podemos mencionar GeneWise, Genomescan y Genie. En el caso de los humanos, la herramienta más útil para encontrar genes son las secuencias de otros genomas de vertebrados. Es por esto que en el futuro, cuando los resultados de otros proyectos de secuenciación como el del chimpancé, el ratón, el pez zebra y el pez Tetraodon nigroviridis, servirán para analizar aún mejor el genoma humano.

    Comparando el número de genes para la especie humana con las otras especies que han sido secuenciadas, éste parece ser bien bajo. A menos que el genoma humano contenga muchos genes que no pueden ser encontrados por técnicas convencionales, los humanos no le deben su complejidad a un número mucho mayor de genes.

    La gran mayoría de nuestros genes provienen un pasado evolutivamente distante, donde sólo el 7,35 % de las familias de genes que poseemos son específicos para los vertebrados (IHGSC, 2001). De modo que la mayoría de las funciones celulares básicas han aparecido en la evolución sólo una vez, y de ahí se han modificado y adaptado en cada especie.

    En los vertebrados, la aparición de nuevos genes está asociada a dos tipos de funciones: aquellos que son específicos de sus habilidades (tal como complejidad neuronal, factores de coagulación y de respuesta inmune adquirida) y aquellos que aumentan sus capacidades generales (tal como genes para la señalización intra y extracelular, desarrollo, muerte celular programada y control de la transcripción de genes).

    ADN REPETITIVO: ¿ÚTIL O INÚTIL?

    Una observación bien intrigante al principio de la era de la Biología Molecular, fue que el tamaño de los genomas no se correlacionaba con la complejidad del organismo. Por ejemplo, el hombre tiene un genoma que es unas 200 veces más grande que el genoma de la levadura (S. cerevisiae), pero 200 veces más pequeño que el de Amoeba dubia (Gregory & Hebert, 1999). Esto se conoce como la paradoja del valor C (contenido de ADN) y fué explicado cuando se conoció que los genomas podían contener una gran cantidad de secuencia repetitiva que no posee ninguna función aparente.

    Tabla 2. Organización estimada de los distintos tipos de secuencias del Genoma Humano (Datos tomados de IHGSC, 2001).

    Tipo de Secuencia

    Número

    Porcentaje del Genoma

    ADN No Repetitivo

     

    47%

    Transcrito

    30-40.000

    28%

    Codificante

    30-40.000

    1.4%

    ARN no mensajero

    750

    5%

    No Transcrito

    19%

    ADN Repetitivo

     

    53%

    LINEs

    850.000

    21%

    SINEs

    1.500.000

    13%

    Elementos Retrovilares

    450.000

    8%

    Transposones ancestrales

    300.000

    3%

    Repeticiones en Bloque

    ?

    8%

    El tamaño total estimado del genoma humano es de 3.200 Mb (Megabases, millones de bases). De estas bases, 250 Mb corresponden a ADN heterocromático (tabla 2), el cual contiene una gran cantidad de ADN repetitivo que no posee función conocida o es parte de las regiones centroméricas y teloméricas. De todo el resto, sólo el 28 % es transcrito a ARN mensajero para luego ser procesado y dejar sólo un 1.4 % que codifica para las proteínas de todo el cuerpo (IHGSC, 2001; Venter et al., 2001). Además, existen unos 740 genes que codifican sólo ARN con diferentes funciones en la célula, y se espera que muchos más serán encontrados en corto tiempo.

    En el hombre, el ADN repetitivo comprende aproximadamente el 53% de toda la secuencia y la mayoría se derivan de elementos transponibles (Smit, 1999). En sentido general, las repeticiones pueden agruparse en 5 clases (IHGSC, 2001):

    1. Repeticiones derivadas de transposones (secuencias de ADN que pueden cambiar su posición en el genoma), referidas como repeticiones interdispersa.

    2. Copias retropuestas de genes celulares inactivos total o parcialmente, referidas como seudogenes procesados.

    3. Repeticiones simples, que consisten de secuencias simples que se repiten una tras otra en segmentos relativamente cortos.

    4. Segmentos duplicados, donde pequeños (10 – 300 kb) segmentos han sido copiados en otra parte del genoma.

    5. Bloques de ADN repetitivo localizado en regiones específicas, tales como centrómeros, telómeros (extremos de los cromosomas), grupos de genes ribosomales y otros.

    El ADN repetitivo generalmente es descrito como basura y se descarta por no ser informativo. Sin embargo, él representa una fuente extraordinaria de información acerca de diversos procesos biológicos. Las repeticiones constituyen un record paleontológico que posee pistas claves de eventos y fuerzas evolutivas que operan en la naturaleza. Cuando tienen un rol pasivo, pueden ser usados para estudiar los procesos de mutación y selección. Cuando su rol es activo, el ADN repetitivo ha producido cambios en el genoma, causando re-arreglos importantes en el orden de los segmentos, creando nuevos genes o modificando y reordenando genes existentes.

    Al comparar el ADN repetitivo humano con el de otras especies nos damos cuenta de que la porción eucromática (segmento de cromosomas que contiene la mayoría de los genes, en contraste con la heterocromática que contiene casi exclusivamente ADN repetitivo) contiene una mayor densidad de copias de elementos transponibles que los segmentos eucromáticos de las otras especies.

     Para ver el gráfico seleccione la opción "Descargar" del menú superior 

     Además, el genoma humano está lleno de copias de transposones ancestrales y sólo un 6% se estima que está activo. En las otras especies, sin embargo, los transposones son de origen reciente y entre un 25 a 87% está activamente moviéndose en el genoma (IHGSC, 2001). Por último, en el genoma humano, 2 tipos de repeticiones (LINE1 y Alu) representan el 60% de todas las secuencias repetitivas dispersas, mientras que en los otros genomas no existe dominancia de tipos específicos de repeticiones.

    ESTRUCTURA DE LOS GENES

    Los genes de los organismos superiores (eucariontes) no se presentan de manera continua, como en las bacterias (procariontes), sino que poseen secuencias internas (intrones) que no codifican para las proteínas (Figura 1). De modo que en los eucariontes, una vez transcrito el ADN en ARN, existe una fase de procesamiento de este último, donde las secuencias internas son eliminadas (además de otras modificaciones que sufre el ARN), quedando las secuencias codificantes o exones de manera continua y listas para codificar a las proteínas.

    En el pasado, los intentos de estudiar la estructura general de los genes humanos no habían arrojado resultados exactos debido al pequeño número de genes disponibles. En la tabla 3 se resumen algunas de las características estructurales de los genes humanos deducidas del análisis de unos 1.800 genes que están completamente caracterizados desde el punto de vista del ADN y el ARN lo que representaría una muestra de cerca del 5% del total.

    Existe una considerable variación en el tamaño general de los genes y los intrones. Muchos genes tienen un tamaño mayor al de 100.000 bp de largo. Por ejemplo, el gen de la distrofina que causa la enfermedad de distrofia muscular de Duchene (DMD) tiene un tamaño de 2.4 Mb (IHGSC, 2001). La variación del tamaño de los exones es mucho menor aunque existen algunos casos extremos. Por ejemplo, el gen titin tiene la secuencia codificante más larga conocida hasta ahora, unos 80.780 bp, además de el número más grande de exones, 178, y el exón más largo, 17.106 bp (Labeit & Kolmerer, 1995).

    Otra característica de los genes humanos, y puede que en general para otras especies, es la distribución diferencial a lo largo del genoma y su relación con la alta proporción de las bases Guanina y Citosina (GC).

    Tabla 3. Características estructurales de los genes humanos de una muestra de 1.800 genes (Modificado de IHGSC, 2001).

    Característica

    Moda

    Promedio

    Tamaño Exones Internos

    122 bp

    145 bp

    Número Exones

    7

    8.8

    Tamaño Intrones

    1.023 bp

    3.365 bp

    Tamaño Secuencia

    Codificante

    1.100 bp

    1.340 bp

    Tamaño Proteína

    367 aa

    447 aa

    Tamaño Gen

    14.000 bp

    27.000 bp

    Las secuencias que contienen genes poseen una mayor proporción de GC que las secuencias no génicas. En el genoma humano se observa que la densidad de genes se incrementa más de diez veces cuando la proporción de GC pasa de 30% a 50% (IHGSC, 2001). En general se observa que los intrones más grandes contienen una proporción baja de GC, mientras que el tamaño de los exones no se ve afectado por la proporción de GC. También es clara la asociación de una baja proporción de GC en el ADN repetitivo.

    El análisis de las secuencias codificantes, a través de la comparación de los genes con los ARN mensajeros ha mostrado el alto número de genes que presentan procesamiento alternativo. Durante el procesamiento del ARN mensajero en los eucariontes, los intrones son eliminados y sólo el ADN codificante (exones) es traducido a la proteína. Sin embargo, se ha determinado que muchos de los genes utilizan procesamiento alternativo que permite producir dos o más tipos de proteínas de un solo gen. Un análisis del número de secuencias transcritas producidas de los genes del cromosoma 22 demuestra que existen en promedio 2,6 tipos por gen (IHGSC, 2001). Un análisis similar en el cromosoma 19 demuestra un promedio de 3,2. Estos valores seguramente aumentarán a medida que se estudien más tipos distintos de ARN mensajero. En el hombre, este número parece ser mayor que en otras especies, posiblemente explicando la mayor complejidad de nuestra especie.

    COMPARÁNDONOS A OTROS ORGANISMOS

    La comparación del genoma humano con los de moscas (D. melanogaster) y gusanos (C. elegans) han llevado a la conclusión de que las diferencias físicas y de comportamiento entre especies no están relacionadas de manera simple al número de genes.

    El tamaño típico de las secuencias codificantes, y por ende las proteínas, tiene un tamaño similar en las tres especies (1.311 bp en el gusano, 1.497 bp en la mosca y 1.340 en el humano). De la misma forma, la mayoría de los exones internos son aproximadamente del mismo tamaño en estas especies, entre unos 50 a 200 bp, pero en el gusano y la mosca el rango de variación es mayor, resultando en un mayor tamaño promedio de exones para estas dos especies (cerca de 200 bp versus 145 bp en humanos).

    Por el contrario, el tamaño de los intrones difiere bastante de los del gusano y mosca. En estas dos especies, la mayoría de los intrones varía entre 50 a 2.000 bp, con un tamaño promedio de 267 bp para el gusano y 487 bp para la mosca. En los humanos, la moda se encuentra alrededor de 1.000 bp y un rango muy amplio que produce un promedio de más de 3.300 bp por intrón (IHGSC, 2001). Esto produce un incremento en el tamaño de los genes en humanos comparados con moscas y gusanos.

    Algunos genes humanos parecen provenir directamente de bacterias, más que evolucionados desde las ellas. Esto podría implicar que las bacterias son capaces de transferir genes a vertebrados (Baltimore, 2001).

    Por otra parte, más del 90% de los dominios (unidades estructurales) que se encuentran en las proteínas humanas están también presentes en la mosca y el gusano (Rubin, 2001). Pareciera que la evolución de los vertebrados ha requerido la invención de pocos dominios nuevos, y que la nueva arquitectura se basara en el uso diferencial de segmentos bastante antiguos evolutivamente. Sin embargo, los dominios en las proteínas humanas han sido mezclados en muchas nuevas combinaciones que han producido casi el doble de re-arreglos diferentes en nuestro genoma.

    A nivel de las proteínas, el 60% de las que existen en nuestro genoma muestran cierto grado de similitud a proteínas de otras especies. Aproximadamente un tercio de las proteínas de humanos, moscas, gusanos y levaduras no muestran similitud a proteínas de otras especies (Rubin, 2001). Estas proteínas puede que retengan funciones similares en cada genoma y que sus secuencias divergieran, o que puedan haber adquirido nuevas funciones específicas para cada especie.

    ¿DEBEMOS PATENTAR EL ADN?

    Se argumenta que el sistema de patentes ha sido una fuerza que ha ayudado al desarrollo de muchos descubrimientos y ha generado productos clínicamente útiles (Bobrow & Thomas, 2001). Además se argumenta que las inversiones de alto riesgo o de sumas muy elevadas sólo pueden ser hechas respaldadas por un sistema de patentes que permita el retorno de los recursos invertidos a corto o mediano plazo y una ganancia acorde con la inversión. Pero la interrogante se presenta ahora con el Proyecto Genoma Humano: ¿Puede tener el mismo efecto positivo en el área de la Genómica? y más aún, ¿Puede este sistema mantener una influencia positiva para el progreso de la ciencia y el beneficio de la mayoría? Las respuestas a estas preguntas son muy inciertas, aún en opiniones de sectores parcializados a extremos de privatización o libre acceso a la información.

    Muchos miles de patentes con derechos sobre secuencias de ADN humano han sido otorgadas, incluyendo secuencias de ADN genómico, ADN complementario, marcadores de secuencias expresadas (ESTs), mutaciones y polimorfismos de nucleótido simple (SNPs). La pregunta que podemos hacer ahora es ¿servirán estas patentes para desarrollar nuevos productos con aplicaciones clínicas o son meras oportunidades de obtener un posible beneficio algún día? Algunas secuencias han sido usadas para generar pruebas diagnósticas para la fibrosis cística y el cáncer de mama.

    Sin embargo, el otorgar derechos exclusivos de genes que producen enfermedades a un único beneficiario ha generado un amplio debate, que va hasta el cuestionamiento de las secuencias de ADN como parte de una invención. Si tomamos en cuenta que el ADN genómico se encuentra en todos los seres humanos, su secuencia no representa una invención (el espíritu de la patente) sino quizás un descubrimiento. Además, se puede difícilmente respaldar la idea que la secuenciación de un segmento de ADN particular es una inversión que debe ser respaldada por una patente si se sabe que hoy en día un laboratorio modesto puede secuenciar unas 150.000 bases al día a un costo de unos 20 Bs por base (2,7 centavos de dólar).

    Es necesario resaltar que el sistema de patentes en ésta área está destinado a producir un caos legal si no se toman las medidas necesarias para regular la patentabilidad de la información. Por ejemplo, los componentes de las unidades genéticas funcionales del cuerpo humano (exones, SNPs, mutaciones, dominios de proteínas, ARN mensajeros y regiones de control) son todas parte integral del mecanismo biológico que actúa en la célula. Si la secuencia de ADN de todos estos componentes son identificados y luego tratados como invenciones separadas, cualquier producto con uso clínico es probable que cruce las barreras legales de varias de las patentes (Bobrow & Thomas, 2001).

    Este es un debate que debe llevarse a varios niveles de discusión, tales como la ONU, los poderes legislativos de las naciones y del público en general. El aspecto principal de la discusión debe ser la reformulación del sistema de patentes de modo que ajuste su capacidad de definir la invencionalidad y utilidad requerida para su patentabilidad. Además debe definirse muy bien el camino a seguir con respecto a los diversos Patrimonios de la Humanidad, entre los que se encuentra el Genoma Humano.

    ¿QUIÉN GANÓ LA CARRERA?

    La declaración conjunta de la publicación del primer borrador de la secuencia humana en julio del año pasado, por parte de los sectores público (International Human Genome Sequence Consortium) y privado (Celera Genomics), en presencia del presidente de los Estados Unidos de América parecía determinar un empate entre los dos esfuerzos. Sin embargo, la publicación de un análisis de las secuencias por ambas partes (IHGSC, 2001; Venter et al., 2001) en febrero de este año reinició el debate de quien posee más méritos por descifrar la mayor parte del Genoma Humano.

    La compañía Celera Genomics fue fundada con el objetivo de producir la secuencia completa del genoma humano en un período más corto y con una inversión mucho más pequeña que la iniciativa pública. El objetivo inicial fue de generar la secuencia con una cobertura de 10X. Sin embargo, los datos presentados por Celera muestran una cobertura de 5,1 veces del genoma, más el uso de otras 2,9 veces del genoma proveniente de la iniciativa pública que está disponible libremente a través de Internet. La compañía justifica el uso de secuencias públicas porque con ello se ahorraron unos 60 millones de dólares.

    Los miembros del proyecto público argumentan que la información tomada por Celera no fue al azar, sino más bien cuidadosamente escogida para cubrir todo el genoma, aprovechando al máximo la información generada por el sector público. Ellos sostienen que en realidad Celera utilizó el equivalente al 7,5X de la secuencia del genoma humano (Butler, 2001). En este sentido, John Sulston, antiguo director de uno de los centros más importantes del IHGSC comenta que:

    " Por tres años al proyecto público se le dijo que éramos ineficientes, lentos y no teníamos razón al proceder de manera cautelosa, y que el Whole Genome Shotgun [enfoque metodológico empleado por Celera Genomics] obviaba la necesidad de todos estos pasos que representaban un derroche. A la final, se transpira que nosotros somos los que hemos garantizado que exista una secuencia del genoma humano. Nosotros salvamos el día".

    PROYECTOS FUTUROS

    Aunque se han hecho grandes progresos en la secuenciación del genoma humano, todavía falta mucho por hacer. Ahora se está avanzando hacia varias direcciones que permitirán el uso y aplicación de toda la información que se ha generado y se seguirá generando en los próximos años. Entre los proyectos que se contempla terminar a corto o mediano plazo se encuentran:

    1. Terminación de la secuencia del genoma humano. Se estima que se producirá una secuencia terminada, de lo que existe hoy en día, a mediados del este año y la mayoría de los huecos deberían ser cerrados para el 2003.

    2. Desarrollo del índice integrado de genes (IGI) y proteínas (IPI). El análisis de las secuencias del genoma, así como de la información de otras fuentes producirá un listado detallado de todos los genes y proteínas que contienen las células humanas.

    3. Identificación a gran escala de regiones reguladoras. Para entender cómo la célula regula los genes es necesario conocer las secuencias responsables de las funciones celulares definidas por regulación específica de los genes de los distintos tipos celulares.

    4. Secuenciación adicional de genomas de otras especies. Existen proyectos que han comenzado a secuenciar los genomas del ratón, el pez zebra, los peces Tetraodon nigroviridis y Takifugu rubripes. Además existen planes para secuenciar algún otro primate y otros organismos que ayudarán a caracterizar los genomas de vertebrados y no vertebrados.

    5. Terminación el catálogo de la variación humana. Actualmente se han identificado más de 1.4 millones de SNPs a lo largo de todo el genoma y se extenderá hasta descubrir casi la totalidad de las diferencias entre distintos seres humanos, lo que permitirá la aplicación de esta información en el descubrimiento de las causas de muchas enfermedades.

    6. Paso de la secuencia a la función de los genes. El análisis de toda la información generada nos permitirá descubrir la función de cada uno de los genes y nos llevará a desarrollar nuevas tecnologías para el diagnóstico y tratamiento de enfermedades genéticas.

    AGRADECIMIENTOS

    Deseo expresar mi más cordial agradecimiento a Carmen Alfonsi e Isabel Mimbela de Loroño por la lectura crítica del manuscrito.

    BIBLIOGRAFíA

    BALTIMORE, D. (2001). Our Genome Unveiled. Nature 409:814-816.

    BIRNEY, E.; BATEMAN, A.; CLAMP, M.E. AND HUBBARD, T.J. (2001). Mining the Draft Human Genome. Nature 409:827-828.

    BOBROW, M. AND THOMAS, S. (2001). Patents in a Genetic Age. Nature 409:763-764.

    BUTLER, D. (2001). Publication of Human Genomes Sparks Fresh Sequence Debate. Nature 409:747-748.

    DE DONATO, M. (2000). El Libro de la Vida ¿Tiene Acaso Todas las Respuestas? Fontus Nº 7:17-44.

    EWING, B. AND GREEN, P. (2000). Analysis of Expressed sequence Tags Indicates 35,000 Human Genes. Nature Genet. 25:232-234.

    GREGORY, T.R. AND HEBERT, P.D. (1999). The Modulation of DNA Content: Proximate Causes and Ulitmate Consecuences. Genome Res. 9:317-324.

    INTERNATIONAL HUMAN GENOME SEQUENCING CONSORTIUM, IHGSC. (2001). Initial Sequencing and Analysis of the Human Genome. Nature 409:860-921.

    LABEIT, S. & KOLMERER, B. (1995). Titins: giant proteins in charge of muscle ultrastructure and elasticity. Science 270:293-296.

    MCKUSICK, V.A. (1998). Mendilian Inheritance in Man. Catalogs of Human Genes and Genetic Disorders. Johns Hopkins University Press, Baltimore, USA.

    RUBIN, M.G. (2001). Comparing Species. Nature 409:820-821.

    SMIT, A.F. (1999). Interspersed repeats and other mementos of transposable elements in mammalian genomes. Curr. Opin. Genet. Dev. 9:657-663.

    VENTER, C.J.; ADAMS, M.D.; MYERS, E.W.; LI, P.W.; MURAL, R.J.; SUTTON, G.G.; SMITH, H.O.; YANDEL, M.; EVANS, C.A.; HOLT, R.A.; GOCAYNE, J.D.; AMANATIDES, P.; BALLEW, R.M.; HUSON, D.H.; WORTMAN, J.R.; ZHANG, Q.; KODIRA, C.D.; ZHENG, X.H.; CHEN, l.; SKUPSKI, M., et al. (2001). The Sequence of the Human Genome. Science 291:1304-1351.

    Dr. MARCOS DE DONATO

    Lab. Genética Molecular, IIBCA, Universidad de Oriente.

    Cumaná, estado Sucre, Venezuela