Reconocimiento de patrones en imágenes médicas basado en Sistemas Inteligentes (página 3)
Enviado por Enrique P. Calot
Imagen N° Ferrero Capas Real Error Ferrero | Error Capas | Diferencia | |||||||||
Ef | Ec | Ec-Ef | |||||||||
8 | 0.41256964 | 0.8761 | 1 | 0.58743036 | 0.1238808 | 0.46354956 | |||||
31 | 0.47556975 | 0.9516 | 1 | 0.52443025 | 0.04839879 | 0.47603146 | |||||
84 | 0.46320501 | 0.945 | 1 | 0.53679499 | 0.05496877 | 0.48182622 | |||||
123 | 0.47556975 | 0.9597 | 1 | 0.52443025 | 0.04032916 | 0.48410109 | |||||
50 | 0.47556975 | 0.9627 | 0 | 0.47556975 | 0.96266222 | -0.48709247 | |||||
4 | 0.46915919 | 0.96 | 1 | 0.53084081 | 0.04001558 | 0.49082523 | |||||
22 | 0.47556975 | 0.9682 | 1 | 0.52443025 | 0.03176451 | 0.49266574 | |||||
27 | 0.47556975 | 0.9703 | 1 | 0.52443025 | 0.02974647 | 0.49468378 | |||||
109 | 0.48750028 | 0.9824 | 1 | 0.51249972 | 0.01756734 | 0.49493238 | |||||
39 | 0.46867085 | 0.964 | 1 | 0.53132915 | 0.03603506 | 0.49529409 | |||||
56 | 0.47556975 | 0.9724 | 1 | 0.52443025 | 0.02763754 | 0.49679271 | |||||
55 | 0.47556975 | 0.9729 | 1 | 0.52443025 | 0.02706695 | 0.4973633 | |||||
149 | 0.47556975 | 0.9811 | 1 | 0.52443025 | 0.01888251 | 0.50554774 | |||||
110 | 0.47556975 | 0.9821 | 1 | 0.52443025 | 0.01786894 | 0.50656131 | |||||
90 | 0.42783737 | 0.9418 | 1 | 0.57216263 | 0.0582481 | 0.51391453 | |||||
121 | 0.45529473 | 0.9692 | 0 | 0.45529473 | 0.96922779 | -0.51393306 | |||||
127 | 0.47556975 | 1 | 1 | 0.52443025 | 0 | 0.52443025 | |||||
44 | 0.47556975 | 1 | 1 | 0.52443025 | 0 | 0.52443025 | |||||
122 | 0.47556975 | 1 | 0 | 0.47556975 | 1 | -0.52443025 | |||||
143 | 0.46053001 | 0.9855 | 1 | 0.53946999 | 0.01448542 | 0.52498457 | |||||
132 | 0.22455586 | 0.7513 | 0 | 0.22455586 | 0.75128043 | -0.52672457 | |||||
120 | 0.36425188 | 0.894 | 1 | 0.63574812 | 0.10600507 | 0.52974305 | |||||
144 | 0.21736649 | 0.7513 | 0 | 0.21736649 | 0.75128043 | -0.53391394 | |||||
125 | 0.46238786 | 1 | 1 | 0.53761214 | 0 | 0.53761214 | |||||
24 | 0.46169627 | 1 | 1 | 0.53830373 | 0 | 0.53830373 | |||||
102 | 0.31518331 | 0.8549 | 1 | 0.68481669 | 0.14512563 | 0.53969106 | |||||
145 | 0.20717257 | 0.7513 | 0 | 0.20717257 | 0.75128043 | -0.54410786 | |||||
42 | 0.43010551 | 0.977 | 1 | 0.56989449 | 0.02295786 | 0.54693663 | |||||
142 | 0.42811611 | 0.9785 | 1 | 0.57188389 | 0.02153611 | 0.55034778 | |||||
95 | 0.43412289 | 0.9904 | 0 | 0.43412289 | 0.99040848 | -0.55628559 | |||||
9 | 0.71085924 | 0.079 | 0 | 0.71085924 | 0.0790475 | 0.63181174 | |||||
113 | 0.19773531 | 0.8353 | 1 | 0.80226469 | 0.16471571 | 0.63754898 | |||||
64 | 0.33020949 | 0.9802 | 1 | 0.66979051 | 0.01983333 | 0.64995718 | |||||
133 | 0.09726956 | 0.7513 | 0 | 0.09726956 | 0.75128043 | -0.65401087 | |||||
82 | 0.11975512 | 0.7915 | 1 | 0.88024488 | 0.20853883 | 0.67170605 | |||||
147 | 0.17510447 | 0.9548 | 1 | 0.82489553 | 0.04521286 | 0.77968267 | |||||
98 | 0.15635006 | 0.9534 | 1 | 0.84364994 | 0.04659724 | 0.7970527 |
Tabla 5.7.d. Comparación de los resultados de ambos métodos.
Magnitud | Símbolo | Valor | |||
Diferencia hipotética de ambas muestras | d0 | 0 | |||
Diferencia media de ambas muestras | d- | 0.16442513 | |||
Desvío estándar de la diferencia de ambas muestras | Sd | 0.30440982 | |||
Tamaño de la muestra | n | 149 |
Tabla 5.8. Variables independientes de las ecuaciones para este test de hipótesis.
Magnitud | Símbolo | Valor | ||||
Fractil de t-Sudent | t | 6.59330 | ||||
Grados de libertad | df | 148 |
Tabla 5.9. Variables resultantes de las ecuaciones para este test de hipótesis.
Para que estas formulas sean válidas, se pide que la población sea normal o que el tamaño de la muestra sea mayor a 30 (en nuestro caso es 149, por lo que se cumplen los requisitos).
En el caso del test que se desea realizar, d- es la media de la diferencia entre ambas muestras y d0 la media propuesta. Se utilizará d0=0 para buscar con que nivel de significación la media difiere de 0.
Interpretación de los resultados
Como se puede observar los mejores resultados se obtienen con un entrenamiento de 450 000 epochs, una red neuronal con tres capas y 12 neuronas en la capa oculta. Esta configuración y tiempo de entrenamiento es muy dependiente del tamaño de la muestra y probablemente no debería ser tomada tan en cuenta como resultados.
Como se puede observar en los resultados del test de hipótesis, el método de utilizar el contorno con capas concéntricas prueba una mejoría, logrando aciertos de hasta 19/149 (87%) aunque en promedio son 22/149 (85%) contra 63/149 (58%) con el método de Ferrero et al. Esto constituye una prueba fundamental de que el método propuesto es una mejora.
Sin embargo, las varianzas, los momentos de inercia, los filtros Sobel y las capas muy alejadas del borde probaron no influir en los resultados, sobrecargando la red y logrando valores que en ciertos casos pueden llegar a ser peores que en los del citado trabajo anterior.
Los radios internos máximo y mínimo mostraron no ensuciar tanto la red y podrían llegar a ser prometedores si se encuentra una combinación adecuada y podría incluso superar al de la media.
Finalmente podemos decir que la mejor detección se da utilizando el brillo medio por región, utilizando las primeras 5 regiones concéntricas exteriores, 2 regiones interiores, la región del núcleo y la correspondiente al borde.
Se encontró además que gran parte de los 19 fracasos correspondía en parte a imágenes cuyo pre-procesamiento estaba mal realizado o bien su contorno como dato de entrada no bordeaba correctamente el tumor en todas sus partes. La mejoría de los algoritmos de pre-procesamiento y/o de calculo de contornos podrían significar un enorme avance como futuras líneas de investigación.
Capítulo 6.
En este capítulo se presentan las aportaciones de esta tesis (sección 6.1) y las futuras líneas de trabajo (sección 6.2).
Aportaciones
Dados los abordajes previos hechos por [Ferrero et al., 2006] para solucionar el problema de clasificación de mamografías, en esta tesis se introducen las mejoras que describen los siguientes párrafos.
Primero se encuentra la utilización de una base de datos con mayor resolución y conocimiento del contorno de la anomalía.
Luego, la utilización de capas concéntricas definidas alrededor de su contorno (basadas en la forma del tumor) para definir regiones de interés, y luego, ser transformadas en valores de entrada para el proceso de clasificación. El gran aporte aquí se basa en no utilizar regiones cuadradas elegidas arbitrariamente que no aprovechaban el análisis de la anomalía en sí utilizando la información de contorno que esta base de datos provee.
Además, para el método propuesto se ha estudiado la utilización de diferentes parámetros, de ellos los más promisorios son el tamaño del contorno, el radio mínimo o el radio máximo, siempre y cuando se los combine con información sobre las primeras capas internas y externas del tumor. Esta información puede venir como luminosidad media de la imagen original o como luminosidad media de la imagen procesada con el filtro Sobel módulo (si bien este es mucho más lento, obtiene resultados similares).
Desde el punto de vista de la velocidad, la varianza y el momento de inercia necesitaban una doble recorrida de las regiones de la figura para calcularse, ya que el momento de inercia requería del cálculo del centro de gravedad para luego sumar el producto de la luminosidad por las distancias del mismo a los puntos a recorrer; mientras que la varianza requería del cálculo de la media para luego calcular la diferencia cuadrática de cada píxel de la región con respecto a ésta. En resumen, se mostró que bajo estos parámetros procesar la información de manera previa a la red resulta innecesario y se puede obviar.
El desarrollo de esta tesis indirectamente, también dejó definido un marco de experimentación apto para el desarrollo de trabajos, donde otras entradas de redes podrán ser evaluadas. La utilización de esta tesis como base de los mismos podría ser de suma ayuda.
Futuras líneas de trabajo
Durante el desarrollo de la presente tesis han surgido las siguientes líneas de trabajo.
Al haberse definido un método dividido en capas de abstracción, es muy fácil poder encuadrar en ellas nuevos algoritmos sin la necesidad de tener en cuenta el resto de los problemas pertenecientes a otras capas. Es más, en caso de encontrarse un algoritmo que mejore una etapa de desarrollo, es posible aplicarlo dentro del código desarrollado con el cual se realizaron las pruebas sin la necesidad de modificar el resto del software. En la capa de pre-procesamiento, es posible investigar si ecualizaciones no lineales obtienen mejores resultados. Una ecualización muy utilizada es la sigmoidal cuya función de transformación fue expresada en la propiedad 1 de la sección 2.4.1.3, pero existen muchas otras posibles ecualizaciones ya que cualquier distribución de probabilidad tiene una función acumulativa creciente con propiedades favorables como para poder ecualizar una imagen logrando así diferencias más marcadas. Como se mencionó en la sección 4.3.4, esta tesis utilizó la distribución uniforme, ya que su función acumulativa es lineal.
La correcta selección de los contornos es uno de los problemas que contribuyen a la calidad de los resultados. Se propone como futura línea de investigación trabajar sobre ellos. Si se logra un algoritmo automatizado capaz de encontrarlos y marcarlos, no sería necesaria la intervención del ojo humano. Algoritmos de clustering pueden ser utilizados con el fin de encontrar zonas brillantes distintas del resto.
También es posible encontrar un algoritmo de entalle la región propuesta por el profesional que diagnostica y la lleve a un contorno del tumor mucho más preciso. De lograrse esto, los datos de entrada tendrían mucho menos ruido del que se menciona en la interpretación de los resultados experimentales (sección 5.4).
En la capa de generación de las entradas para las redes existe la posibilidad de incorporar nuevos operadores estadísticos que lleven a mejores tasas de éxito. Sería conveniente explorar cuales obtienen buenos resultados. Esta tesis deja disponible una metodología preparada para esta exploración.
Si bien el filtro Sobel mostró no ser significativo en el método propuesto, resultados tempranos aconsejan estudiar su utilización en futuras líneas de trabajo. Para ello será necesaria la utilización de una base de datos donde el contorno del tumor se encuentre mejor entallado o bien contar con algoritmos que corrijan esto.
Capítulo 7.
AMA. 2006. Consenso Nacional Inter-Sociedades sobre Cáncer de Mama: Pautas para el Diagnóstico y Manejo de las Lesiones Mamarias Subclínicas. Asociación Médica Argentina. 2006.
Antonie, M.; Zaïene, O.; Coman, A. 2001. Application of data mining techniques for medical image classification. Proceedings of the Second International Workshop on Multimedia Data Mining. San Francisco.
Arzhaeva Y.; van Ginneken, B.; Tax, D. 2006. Image Classification from Generalized Image Distance Features: Application to Detection of Interstitial Disease in Chest Radiographs Tax Image Sciences Institute, Delft University of Technology, Proceedings of the 18th International Conference on Pattern Recognition (ICPR'06) 0-7695-2521-0/06 Bellman, R.. 1958. On a Routing Problem. En Quarterly of Applied Mathematics, 16(1), pp.87-90.
Berhrend, P. 2006. Identificación de marcas en la industria siderúrgica. Reportes técnicos en ingeniería del software, 8(2):43-46. ISSN: 16775002 Chan, H. P.; Doi, K.;Galhotra, S.; Vyborny, C. J.; MacMahon, H.; Jokich, P. M. 1987. Image Feature Analysis and Computer-Aided Diagnosis in Digital Radiography: Part 1 Automated Detection of Microcalcifications in Mammography, Medical Physics, vol. 14, pp. 538-548, Davies, D. H. 1993 Digital mammography – the comparative evaluation of film digitizers. British Journal of Radiology, Vol.66 pp930-933.
Duncan, J. S.; Ayache, N. 2000. Medical Image Analysis: Progress over Two Decades and the Challenges Ahead. Ieee transactions on pattern analysis and machine intelligence, vol. 22, no. 1, january 2000 Ferrero, G.; Britos, P.; García-Martínez, R. 2006. Detection of Breast Lesions in Medical Digital Imaging Using Neural Networks. IFIP International Federation for Information Processing, Volume 218, Professional Practice in Artificial Intelligence, eds. J. Debenham, (Boston: Springer), pp. 1-10.
van Ginneken, B.; Katsuragawa, S.; ter Haar Romeny, B.; Doi, K.; Viergever, M. 2002. Automatic detection of abnormalities in chest radiographs using local texture analysis, IEEE Trans. Med. Imag., vol. 21, no. 2, pp. 139–149.
Gokhale, M.; Aslandonga Y. 2003. A Visualization Oriented Data Mining Tool for Biomedical Images. 9 Páginas. Departament of Computer Science and Engineering, University of Texas at Arlington.
Heath, M.; Bowyer, K.; Kopans, D; Kegelmeyer, W. P.; Moore, R.; Chang, K.; MunishKumaran, S. 1998. Current status of the Digital Database for Screening Mammography, Digital Mammography, 457-460, Kluwer Academic Publishers; Proceedings of the Fourth International Workshop on Digital Mammography.
Heath, M.; Bowyer, K.; Kopans, D; Moore, R.; Kegelmeyer, W. P. 2001. The Digital Database for Screening Mammography, Proceedings of the Fifth International Workshop on Digital Mammography, M.J. Yaffe, ed., 212-218, Medical Physics Publishing, ISBN 1-930524-00-5.
Lee, N. J. 2006. Computer-Aided Diagnostic Systems for Digital Mammograms. Tesis de Mágister, Louisiana State University.
Loog, M.; van Ginneken, B. 2004. Static posterior probability fusion for signal detection: applications in the detection of interstitial diseases in chest radiographs, in International. Conference on Pattern Recognition, J. Kittler, M. Petrou, and M. Nixon, Eds.
MAP. 2002a. Estudio de Viabilidad del Sistema (Proceso EVS). MÉTRICA. VERSIÓN 3. Metodología de Planificación, Desarrollo y Mantenimiento de sistemas de información. Ministerio de Administraciones Públicas de España. Disponible en http://www.csae.map.es/csi/metrica3/evs.pdf vigente al 20/12/2008.
MAP. 2002b. Análisis del Sistema de Información (Proceso ASI). MÉTRICA. VERSIÓN 3. Metodología de Planificación, Desarrollo y Mantenimiento de sistemas de información. Ministerio de Administraciones Públicas de España. Disponible en http://www.csae.map.es/csi/metrica3/asiproc.pdf vigente al 20/12/2008.
MAP. 2002c. Gestión de Proyectos (Proceso GPI). MÉTRICA. VERSIÓN 3. Metodología de Planificación, Desarrollo y Mantenimiento de sistemas de información. Ministerio de Administraciones Públicas de España. Disponible en http://www.csae.map.es/csi/metrica3/ gespro.pdf vigente al 20/12/2008.
MAP. 2002d. Técnicas y Prácticas. MÉTRICA. VERSIÓN 3. Metodología de Planificación, Desarrollo y Mantenimiento de sistemas de información. Ministerio de Administraciones Públicas de España. Disponible en http://www.csae.map.es/csi/metrica3/tecnicas.pdf vigente al 20/12/2008.
Martelli, A. 1976. An Application of Heuristic Search Methods to Edge and Contour Detection, Comm. ACM, vol. 19, pp. 73-83.
Pizer, S.; Todd-Pokropek, A.E. 1978. Improvement of Scintigrams by Computer Processing, Seminars in Nuclear Medicine, vol. 8, no. 2, pp. 125-146, Apr. 1978.
Selman, S. 2000. Data Mining of Digital Mammograms Will Aid in War against Cancer.
www.gatech.edu. Página vigente al 27 de marzo de 2008.
Shannon, C. E. 1948. A mathematical theory of communication. Bell System Technical Journal, vol. 27, pp. 379-423 and 623-656, July and October, 1948.
Simoff, S.; Djeraba, C.; Zaïane, O. 2002. Multimedia Data Mining between Promise and Problems. 3rd Edition of the International Workshop on Multimedia Data Mining. ACM SIGKDD Explorations 4(3): 118-121. December 2002.
Sklansky, J.; Ballard, D. 1973. Tumor Detection in Radiographs, Computers and Biomedical Research, vol. 6, no. 4, pp. 299-321, Aug. 1973.
Sluimer, I.; van Waes, P.F.; Viergever, M. A.; van Ginneken, B. 2003. Computer-aided diagnosis in high resolution CT of the lungs, Medical Physics, Vol. 30(12): 3081–3090.
Smith, R. A.; Caleffi M.; Albert, U. S.; Chen, T. H.; Duffy, S. W.; Franceschi, D.; Nystrom, L. 2006. Breast cancer in limited-resource countries: early detection and access to care. Breast J;12 Suppl 1:S16-26.
Sobel, I., Feldman,G.. 1968. A 3×3 Isotropic Gradient Operator for Image Processing, presentado en la Stanford Artificial Project.
Strauss, H.W. et al. 1971. A Scintiphotographic Method for Measuring Left Ventricular Ejection Fraction in Man Without Cardiac Catheterization, Am. J. Cardiology, vol. 28, pp. 985- 991, Nov. 1971.
Uchiyama, Y.; Katsuragawa, S.; Abe, H.; Shiraishi, J.; Li, F.; Li, Q.; Zhang, C.-T.; Suzuki, K.; Doi, K. 2003. Quantitative computerized analysis of diffuse lung disease in high-resolution computed tomography, Medical Physics, Vol. 30(9): 2440–2454.
Uppaluri, R.; Hoffman, E.A.; Sonka, M.; Hartley, P.G.; Hunninghake, G.W.; McLennan, G. 1999. Computer recognition of regional lung disease patterns, American Journal of Respiratory and Critical Care Medicine, Vol. 160(2): 648–654.Walpole, R. E; Myers, R. H. 1999. Probabilidad y estadística para ingenieros, Pearson Educación, ISBN 9701702646, 9789701702642, p 229.
Wirth, M; Lyon, J; Fraschini, M; Nikitenko, D. 2004. The Effect of Mammogram Databases on Algorithm Performance, cbms, p. 15, 17th IEEE Symposium on Computer-Based Medical Systems (CBMS'04), 2004 Yachida, M.; Ykeda, M.; Tsuji, S. 1980. A Plan-Guided Analysis of Cineangiograms for Measurement of Dynamic Behavior of the Heart Wall, IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 2, pp. 537-543.
Zorman, M.; Kokol, P.; Lenic, M.; Povalej, P.; Stiglic, B.; Flisar, D. 2003. Intelligent platform for automatic medical knowledge acquisition: detection and understanding of neural dysfunctions. Lab. for Syst. Design, Maribor Univ., Slovenia; Computer-Based Medical Systems, Proceedings. 16th IEEE Symposium, pp. 136-141. ISSN 1063-71258 Zrimec, T.; Busayarat, S. 2007. A System for Computer Aided Detection of Diseases Patterns in High Resolution CT Images of the Lungs. Computer-Based Medical Systems. CBMS apos;07. Twentieth IEEE International Symposium on Volume, Issue, 20-22 June, pp. 41-
Anexos
Para ver el contenido de los anexos seleccionar la opción "Descargar" del menú superior
Autor:
Enrique P. Calot
Página anterior | Volver al principio del trabajo | Página siguiente |