Diagnóstico de enfermedades genéticas por secuenciación automática: cáncer gástrico (página 2)
Enviado por Fabi�n Shal�m
Para la amplificación por PCR los primers utilizados fueron: CDH1_12f: gggACACTTCTgCTgATCC
CDH1_12r: ATgCTACAAAgTTAgATACCA
Los cic realizados fueron: Desnaturalización inicial: 3min a 95ºC Melting 45seg a 94ºC Annealing 45seg a 56ºC Elongación 45seg a 72ºC Elongación final por 10 min a 72ºC
Se realizaron un total de 30 ciclos de PCR (Meeting, Annealing y elongación). Las muestras obtenidas luego de la reacción de PCR fueron resueltas en un gel de agarosa 1,4% con el marcador de peso pUC19.
Luego de la corrida electroforética, se degradaron el exceso de primers y de dNTP`s del producto de PCR, ya que estos pueden interferir con el buen funcionamiento y con la resolución de la reacción de secuenciación. Esta degradación se realizó utilizando la enzima comercial ExoSAP-IT. El protocolo de degradación utilizado fue el siguiente:
Se colocaron 3uL de producto de PCR, 1uL de ExoSAP-IT y 3uL de agua en un tubo de PCR y se incubaron durante 30` a 37 grados C y luego se inactivó la enzima por medio de la incubación a 80 grados C durante 15`.
La reacción de secuenciación se llevo a cabo utilizando los mismos primers de la PCR.
Resultados
Los productos de PCR luego de la corrida electroforética se observaron en el gel de agarosa de la siguiente manera.
Figura 1. Resolución de los productos de PCR por electroforesis en gel de agarosa 1,4%.
En este gel se puede observar que ambas fuentes de ADN (individuos A y B) presentan el gen codificante para la proteína CDH1 dentro de su secuencia genómica. En todos los casos las bandas presentes son del mismo peso molecular, y tal como es esperable, no se observa banda alguna en los controles negativos realizados. Asimismo en todos los casos la intensidad de la banda del ADN proveniente del individuo A es de menor intensidad que la banda proveniente del individuo B. Esta diferencia de intensidad probablemente se debe a que la concentración inicial de ADN en ambas muestras no fue la misma, encontrándose una mayor concentración en la muestra del individuo B que en el individuo A. Esto no puede aseverarse ya que no se ha utilizado un control de carga.
Secuenciación:
Durante el desarrollo de este trabajo práctico no se llevo a cabo la secuenciación del producto de PCR, así que se estudiarán los resultados obtenidos a partir de una secuenciación previa, considerando que los mismos son los resultados de este trabajo.
En la Figura 2 se observa el cromatograma obtenido a partir de la secuenciación con el primer forward. Se puede observar la sustitución de una guanina por una adenina en la posición 152 de la secuenciación (la cual no es la misma que la posición en el gen). En el cromatograma, esto se observa como dos picos superpuestos, luego de consultar la base de datos de genes GenBank se puedo conocer que la secuencia salvaje del gen que codifica para CDH1 contiene en dicha posición el nucleótido complementario a una adenina. Luego que en el cromatograma se observan los dos picos superpuestos, se puede decir que en uno de los dos alelos que codifican para dicho gen, el individuo analizado, posee una adenina mientras que en el otro alelo posee una guanina.
Figura 2. Cromatograma obtenido a partir de la secuenciación con el primer forward de un organismo mutante heterocigota.
En la Figura 3 se observa el cromatograma obtenido a partir de la secuenciación con el primer reverse. En este se puede observar la mutación complementaria a la observada con el primer forward (Figura 2); es decir se puede observar la sustitución de una citosina por una timina en la posición 198 de la secuenciación. En el cromatograma, esto se observa nuevamente como dos picos superpuestos.
Figura 3. Cromatograma obtenido a partir de la secuenciación con el primer reverse de un organismo mutante heterocigota.
Se puede observar que en los dos picos superpuestos de la figura 2, el programa que analiza el cromatograma, asigno en esta posición una G (guanina), debido a que el pico de guanina tiene una intensidad levemente mayor. Mientras que en la figura 3, ante un caso similar, aunque ambos picos tienen la misma intensidad, el programa no determinó un nucleótido específico, asignando la letra N (not-specified). Esto indica que no solo debe estudiarse la secuencia que el programa automáticamente nos proporciona, sino que además debe estudiarse el cromatograma presentado para la secuencia que estamos analizando.
Análisis de las secuencias:
Se buscó la secuencia salvaje del gen que codifica para la proteína CDH1, y se copió la secuencia en la cual se encuentra la mutación que está relacionada con el cáncer gástrico. La misma está dentro del exón 12. A continuación se presenta la secuencia salvaje que contiene el fragmento secuenciado en el desarrollo de este trabajo práctico. De esta manera esperamos encontrar el nucleótido que se encuentra en el genotipo salvaje, el cual al ser sustituido en ambos alelos, provoca cáncer gástrico. En la secuencia que se encuentra a continuación se destacó el nucleótido mutado en el individuo analizado previamente por secuenciación. Se puede observar que se produce una sustitución puntual de una guanina por una adenina.
86041 agaactaggg aaacaacagg caggcaatag gacttcttgg agtagttaaa attcagtgaa
86101 tgaataacga tatgtgaaga aggaggagtg tgttcttggt gtgaggaata acttgaataa
86161 ttgttatcaa ggtgggaata agttgtctgt gtaaaacggc cagagacctg cccacctggg
86221 agtggaggtc ctttgggatt ggtgggacag gaggttctgc gggtggagtg gggcctggtg
86281 agggaccact gaagagccag gacaagatct agacttggtc tggtggaagg caatggggat
86341 tcattactgt tgccaagctg ccacattttc tgtgtatttt ctcttaggtt ctccagttgc
86401 tactggaaca gggacacttc tgctgatcct gtctgatgtg aatgacaacg cccccatacc
86461 agaacctcga actatattct tctgtgagag gaatccaaag cctcaggtca taaacatcat
86521 tgatgcagac cttcctccca atacatctcc cttcacagca gaactaacac acggggcgag
86581 tgccaactgg accattcagt acaacgaccc aagtgggtac ctgagtttta ttttggcaac
86641 tttgctccaa ctgccatgct tcccttcccc cagatcccca cctttcaatt tcccttctca
86701 acttctagat gtcacccctt ccattgatac ttgcttcctt gtcccttctg tctttgaggc
86761 cttgctccaa aggtcttttt cctttcctgg tatctaactt tgtagcatgc tacccagtaa
86821 tctaaaaccc aagcagggct ccctctccca gcctctagcc accctccact cccctctcca
86881 cttgcaacca ggaccatctt ctctgctacc tcctgctcct gggaccaaac aacaccattt
86941 ttgtggttag ctccttcttg ccaaccaatc gtgagctccc agattcatca gaactattct
87001 accgaggtgg aggcagctgt caactgcctg gtcaatttgc atatatgggc ttcctacacc
87061 tacttctctc tgggcttcta tttccaccat gacgatgtgg atctggaagg tgtgcaccac
87121 ttcttccaca aattggccaa ggagaagcac aagggcgctg agtgtccctt gaaaatgcaa
87181 aaccagtgtg gcggccgcac tgtcttcccg gacatccaga agccatgtaa agatgaatgg
87241 ggtaaaaccc tgggtgcgat ggaagtcact ctggccctgg agaagaacct gaactggacc
87301 cttttggatc ttcatgcctt gggttccacc tgcacagacc cccatatctg tgacttcctg
87361 gagagccact tcctagatga aaaagtaaaa ctcatcaaga agataggtga ccacctgacc
87421 aaccttcaca ggccagccgg cctccaggcc gggctgggca aaaaggttca ccctcaggca
87481 cacgggagcc taccgaaccc agcgacatct gaagagcccc gctctgccta agcctctccc
87541 tccagccact aggcagcttt tttaaaccaa ctctagagcc ctctcccaag ccttagacca
87601 aatggaaata aagcttttta cagcaaaaaa aaaaaaaaaa aagtacatac ctaaataaaa
87661 cccaagcagc tctgctctct tcactcggct tgcgggtgtc tttagttcac tagcaatttt
87721 attctggaat gagcttttta ttttcctccc ctggtctcat catttctttt tattgctttc
87781 tccagcccaa gaatctatca ttttgaagcc aaagatggcc ttagaggtgg gtgactacaa
87841 aatcaatctc aagctcatgg ataaccagaa taaagaccaa gtgaccacct tagaggtcag
87901 cgtgtgtgac tgtgaagggg ccgccggcgt ctgtaggaag gcacagcctg tcgaagcagg
87961 attgcaaatt cctgccattc tggggattct tggaggaatt cttgctttgc taagtaagtc
88021 cagctggcaa agtgactcag cctttgactt aaaaaaatgg aggaggttta tttcctggaa
88081 atgatttttg ttcttatatt aataaggata taggttagct gatgtgggaa agagactccc
Secuencia 1. Secuencia de nucleótidos parcial del gen CDH1 salvaje.
Se realizó un blast2seq para encontrar donde esta la región de homología entre la secuencia analizada y la secuencia del gen. Se encontró que el fragmento secuenciado es homologo a una región del gen que se encuentra en la región que se muestra a continuación:
Score = 637 bits (331), Expect = 2e-179
Identities = 331/331 (100%), Gaps = 0/331 (0%)
Strand=Plus/Plus
Query 27 CCTCGAACTATATTCTTCTGTGAGAGGAATCCAAAGCCTCAGGTCATAAACATCATTGAT 86
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 86465 CCTCGAACTATATTCTTCTGTGAGAGGAATCCAAAGCCTCAGGTCATAAACATCATTGAT 86524
Query 87 GCAGACCTTCCTCCCAATACATCTCCCTTCACAGCAGAACTAACACACGGGGCGAGTGCC 146
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 86525 GCAGACCTTCCTCCCAATACATCTCCCTTCACAGCAGAACTAACACACGGGGCGAGTGCC 86584
Query 147 AACTGGACCATTCAGTACAACGACCCAAGTGGGTACCTGAGTTTTATTTTGGCAACTTTG 206
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 86585 AACTGGACCATTCAGTACAACGACCCAAGTGGGTACCTGAGTTTTATTTTGGCAACTTTG 86644
Query 207 CTCCAACTGCCATGCTTCCCTTCCCCCAGATCCCCACCTTTCAATTTCCCTTCTCAACTT 266
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 86645 CTCCAACTGCCATGCTTCCCTTCCCCCAGATCCCCACCTTTCAATTTCCCTTCTCAACTT 86704
Query 267 CTAGATGTCACCCCTTCCATTGATACTTGCTTCCTTGTCCCTTCTGTCTTTGAGGCCTTG 326
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 86705 CTAGATGTCACCCCTTCCATTGATACTTGCTTCCTTGTCCCTTCTGTCTTTGAGGCCTTG 86764
Query 327 CTCCAAAGGTCTTTTTCCTTTCCTGGTATCT 357
|||||||||||||||||||||||||||||||
Sbjct 86765 CTCCAAAGGTCTTTTTCCTTTCCTGGTATCT 86795
Se buscó en el NCBI la secuencia salvaje de la E-cadherina epitelial humana CDH1, y se copió la secuencia en la cual se encuentra la sustitución de un aminoácido que está relacionada con el cáncer gástrico. La misma se presenta a continuación. Se puede observar que la sustitución puntual del nucleótido observada la cual se traduce como la sustitución de un triptofano por un codón de stop en la posición 638 de la proteína. Esta mutación se denomina mutación sin sentido.
1 mgpwsrslsa lllllqvssw lcqepepchp gfdaesytft vprrhlergr vlgrvnfedc
61 tgrqrtayfs ldtrfkvgtd gvitvkrplr fhnpqihflv yawdstyrkf stkvtlntvg
121 hhhrppphqa svsgiqaell tfpnsspglr rqkrdwvipp iscpenekgp fpknlvqiks
181 nkdkegkvfy sitgqgadtp pvgvfiiere tgwlkvtepl dreriatytl fshavssngn
241 avedpmeili tvtdqndnkp eftqevfkgs vmegalpgts vmevtatdad ddvntynaai
301 aytilsqdpe lpdknmftin rntgvisvvt tgldresfpt ytlvvqaadl qgeglsttat
361 avitvtdtnd nppifnptty kgqvpenean vvittlkvtd adapntpawe avytilnddg
421 gqfvvttnpv nndgilktak gldfeakqqy ilhvavtnvv pfevslttst atvtvdvldv
481 neapifvppe krvevsedfg vgqeitsyta qepdtfmeqk ityriwrdta nwleinpdtg
541 aistraeldr edfehvknst ytaliiatdn gspvatgtgt lllilsdvnd napipeprti
601 ffcernpkpq viniidadlp pntspftael thgasanwti qyndptqesi ilkpkmalev
661 gdykinlklm dnqnkdqvtt levsvcdceg aagvcrkaqp veaglqipai lgilggilal
721 lililllllf lrrravvkep llppeddtrd nvyyydeegg geedqdfdls qlhrgldarp
781 evtrndvapt lmsvprylpr panpdeignf idenlkaadt dptappydsl lvfdyegsgs
841 eaaslsslns sesdkdqdyd ylnewgnrfk kladmyggge dd
Secuencia 2. Secuencia de aminoácidos de la proteína CDH1 salvaje.
Conclusiones:
A partir de los resultados obtenidos en la secuenciación del individuo heterocigota, y combinando dichos resultados con las bases de datos del NCBI, se pudo determinar cual es la mutación puntual que tiene como consecuencia el desarrollo del mencionado tipo de cáncer gástrico. Para lograr este resultado, debimos hacer uso de el soft para análisis de cromatogramas FinchTV, las bases de datos del NCBI (GenBank y Protein), así como también del sistema de búsqueda de secuencias Blast. Estos programas son algunas de las principales herramientas bioinformáticas de amplio uso tanto en biotecnología como en biología molecular.
Por otro lado el análisis de los cromatogramas y las secuencias predictivas del FinchTV permitió comprender la importancia del análisis del cromatograma y de la secuencia, ya que errores en el análisis automático de la secuencia pueden acarrear errores posteriores.
Fabián A. Shalóm
Ayelen Rapoport
Cátedra de Genética Humana – Instituto de Inv. Biotecnológicas – Univ. Nac. de San Martín
Av. General Paz 5445, INTI, Edificio 24 , Prov. de Bs. As.
Octubre de 2007
Página anterior | Volver al principio del trabajo | Página siguiente |