Descargar

Procesamiento del lenguaje natural en la Inteligencia Artificial

Enviado por egdia


    1. Linguística
    2. Análisis Lingüístico
    3. Lenguaje
    4. Lenguaje Formal
    5. Comprensión del lenguaje
    6. Generación de textos
    7. Gramáticas Formales
    8. Definiciones empleadas en las gramáticas formales
    9. Conclusiones
    10. Bibliografía

    Introducción

    El tesoro más valioso de la raza humana es el conocimiento, es decir, la información. Existen en el mundo volúmenes inmensos de información en forma de lenguaje natural: los libros, los periódicos, los informes técnicos, etcétera. Pero la posesión verdadera de este tesoro implica  la habilidad de hacer ciertas operaciones con la información:

         Buscar la información necesaria,

         Comparar las fuentes diferentes, y hacer inferencias lógicas y conclusiones,

         Manejar los textos, por ejemplo, traducirlos a otros idiomas.

    En realidad, las computadoras son más capaces de procesar la información que las personas. Pueden procesar muchísimos más grandes volúmenes de información que una persona puede leer en su vida. A base de ésta, pueden hacer inferencias lógicas tomando en cuenta más hechos y más fuentes.

    Todo parece estar preparado para el uso de las computadoras para procesar volúmenes grandes de información: los métodos lógicos ya son muy fuertes, los procesadores muy rápidos, muchos textos ya están disponibles en forma digital, tanto en las casas editoriales como en Internet. El único problema para la computadora al procesar los textos es que simplemente ¡no los entiende! Hasta ahora, los textos son para la computadora solamente cadenas de letras sin cualquier sentido y no una información útil para el razonamiento lógico.

    Para convertir la computadora en nuestro verdadero ayudante en el procesamiento de textos, se necesita pasar un largo camino de aprendizaje de la estructura de textos y de su formalización; más abajo vamos a hablar de algunos problemas en este camino.  Pero si es tan largo el camino, ¿existe una razón práctica para trabajar en esta área ahora? Sí, existe, porque con cada paso obtenemos las herramientas que ya tienen gran valor práctico, que ayudan en nuestras tareas cotidianas.

    Desarrollo

    Linguística

    La Lingüística es la disciplina que se ocupa del estudio científico del lenguaje. Dentro de la Lingüística se pueden identificar diferentes áreas de interés, tales como:

    • Lingüística Aplicada – aplicación de la lingüística a áreas específicas como la traducción, enseñanza de un segundo idioma, pronósticos, etc.
    • Antropología Lingüística – estudio de las relaciones entre lenguaje y cultura.
    • Lingüística Computacional – procesamiento del lenguaje natural.
    • Neuro-lingüística: estudio del cerebro y de su funcionamiento en la producción, percepción y adquisición del lenguaje.
    • Sociolingüística: estudio de las relaciones entre el lenguaje y estructuras sociales, variación lingüística y actitudes hacia el lenguaje.
    • Psico-lingüística: estudio de la adquisición del lenguaje.
    • Lingüística Teórica – análisis lingüístico.

    Análisis Lingüístico

    Cuando se hace análisis lingüístico, se está trabajando dentro del campo de la Teoría Lingüística o Lingüística Teórica. Desde este punto de vista, la gramática de una lengua es una representación explícita del conocimiento (consciente e inconsciente) que un hablante nativo tiene de su lengua. Una teoría lingüística debe de proporcionar las nociones y herramientas analíticas necesarias que nos permitan describir de manera explícita el conocimiento.

    Cuando un lingüista escribe una gramática, este lingüista no sólo describe una lengua, sino que también nos está diciendo algo sobre los procesos cognoscitivos del ser humano. Por lo tanto, una teoría lingüística debe no sólo proveer los medios para describir gramáticas de manera explícita, sino que debe de permitir hacer generalizaciones racionales que permitan describir los procesos gramaticales de un lenguaje.

    El análisis lingüístico consiste en:

    1. Analizar los datos existentes y descubrir las reglas, leyes y regularidades del lenguaje;

    2. Expresar de manera formal una generalización que describa esas reglas, leyes y regularidades de forma racional;

    La Lingüística tiene por objetivo descubrir los métodos para describir no sólo una lengua en concreto, sino de cualquier lenguaje natural, es conocer con profundidad una lengua particular, y llegar a entender la facultad humana del lenguaje. Por lo tanto, el análisis de fenómenos gramaticales en una lengua determinada ayuda a entender, no sólo la lengua en cuestión, sino el proceso cognoscitivo del hombre.

    Lenguaje

    Lenguaje es el empleo de la palabra para expresar ideas, comunicarse, establecer relaciones entre los seres humanos. Un lenguaje es un conjunto de palabras, su pronunciación y los métodos para combinarlas en frases y oraciones, generalmente infinito y que se forma mediante combinaciones de palabras definidas en un diccionario terminológico previamente establecido. Las combinaciones posibles deben respetar un conjunto de reglas sintácticas establecidas, a ello se le conoce con el nombre de Sintaxis. Además, las palabras deben tener determinado sentido, deben ser comprendidas por un grupo humano en un contexto dado, a ello se le denomina Semántica.

    A lo largo de la historia el ser humano a utilizado el lenguaje para trasmitir sus conocimientos, sentimientos, emociones, sensaciones, comunicarse con el resto de los humanos y esta función del lenguaje la ha desarrollado de manera oral, gráfica, escrita o por señas.

    Cuando hablamos de lenguajes se pueden diferenciar dos clases muy bien definidas

    Existen muchas definiciones de lenguaje natural, una que pudiera acercarnos a entender mejor este concepto plantea:

    Se denomina Lenguaje Natural a un lenguaje escrito o hablado usado por una comunidad que es precisamente lo contrario a un lenguaje para establecer comunicación con una computadora, mediante la entrada de datos, o la programación de su funcionamiento. (Guzmán 1997)

    Los lenguajes han sufrido un largo y complejo proceso de desarrollo desde el surgimiento del hombre sobre la faz de la Tierra. Los lenguajes se han desarrollado a partir de la experiencia práctica de los diferentes grupos humanos. La riqueza de sus componentes semánticos otorga a los lenguajes naturales gran poder expresivo y valor como herramienta para expresar y exteriorizar los razonamientos más sutiles y complejos. La sintaxis de un LN se puede modelar mediante la utilización de un lenguaje formal. Otra propiedad importante de los lenguajes naturales es la poli-semántica, es decir la posibilidad de que una palabra posea significados diferentes.

    Los lenguajes naturales se caracterizan por las propiedades siguientes:

    1. Han sufrido un largo y complejo proceso histórico de perfeccionamiento previo a la aparición de una teoría científica que explique las leyes fundamentales de su desarrollo;
    2. Su capacidad para expresar el pensamiento humano en toda su complejidad y belleza;
    3. Dificultad para lograr una formalización científica completa;
    4. Su capacidad para transmitir la historia, las ideas, las costumbres, la cultura y la ciencia de las diferentes sociedades humanas.

    La comprensión y reconocimiento del lenguaje natural es uno de los problemas mas complejos a que se enfrenta la Inteligencia Artificial debido a la complejidad, irregularidad y diversidad del lenguaje humano y a los problemas filosóficos y psicológicos asociados al significado de frases, oraciones y textos en su conjunto.

    La concepción principal que orienta el desarrollo de las tecnologías del habla y del lenguaje natural tiene por objetivo estratégico lograr que la interacción con las máquinas sea análoga a la que se ha desarrollado históricamente en la interacción entre las personas. En otras palabras, estratégicamente se plantea como objetivo lograr una relación hombre/máquina análoga a la relación hombre/hombre. En múltiples y diversas aplicaciones el reconocimiento del hablar y el lenguaje natural son de gran utilidad. En ocasiones se presentan problemas en el reconocimiento y comprensión de las expresiones orales y escritas. La escritura, los símbolos, las imágenes y la voz son los medios de comunicación fundamentales en la interacción hombre/máquina. La experiencia practica acumulada, en el campo del Lenguaje Natural, ha señalado la conveniencia de orientar el reconocimiento del lenguaje natural más al análisis de frases, oraciones y textos en su conjunto, que al reconocimiento de palabras aisladas. En otras palabras, priorizar el reconocimiento del sistema en su conjunto, sobre el reconocimiento de sus partes integrantes.

    Lenguaje Formal

    Un lenguaje formal es un lenguaje artificial o sea creado por el hombre que esta formado por símbolos y formulas y que tiene como objetivo fundamental formalizar la programación de computadoras o representar simbólicamente un conocimiento.

    Las palabras y oraciones en un lenguaje formal poseen definición rigurosa desde el punto de vista científico. Son utilizados para modelar teorías científicas con la ventaja de que en estos se reduce la ambigüedad.

    En resumen las características de los lenguajes formales son las siguientes:

    • Se han desarrollado como un medio para formalizar matemáticamente una teoría;
    • Su sintaxis es capaz de definir oraciones rigurosamente definidas;
    • Constituyen un poderoso instrumento para la investigación y el procesamiento del Lenguaje Natural por computadora.

    Un lenguaje de programación es un lenguaje Artificial usado para escribir instrucciones que pueden ser traducidas a lenguaje maquina y ejecutadas en una computadora.

    Un lenguaje de programación esta formado por un conjunto de reglas sintácticas que permiten escribir un programa, de forma tal que sea entendido por la computadora. Un programa es un conjunto de instrucciones con un orden determinado que permite realizar una tarea computacional dada.

    Un lenguaje de programación se basa en dos conceptos fundamentales:

    • Sintaxis – garantiza la utilización correcta de cada una de las expresiones de determinado lenguaje de programación.
    • Semántica – garantiza que las expresiones de un lenguaje de programación posean un significado correcto.

    Procesamiento del Lenguaje natural

    El procesamiento del lenguaje es de manera general, el conjunto de instrucciones que una computadora recibe en un lenguaje de programación dado (formal), que le permitirán comunicarse con un humano en su propio lenguaje, (ingles, francés, español, etc).

    El procesamiento del lenguaje natural presenta múltiples aplicaciones:

    • Corrección de textos
    • Traducción automática
    • Recuperación de la información
    • Extracción de Información y Resúmenes
    • Búsqueda de documentos
    • Sistemas Inteligentes para la Educación y el Entrenamiento

    La corrección de textos permite la detección y corrección de errores ortográficos y gramaticales, Para detectar este tipo de errores, la computadora necesita entender en cierto grado el sentido del texto. Los correctores de gramática detectan las estructuras incorrectas en las oraciones aunque todas las palabras en la oración estén bien escritas en el lenguaje en cuestión. El problema de detectar los errores de este tipo es complejo debido a la existencia de gran variedad de estructuras permitidas.

    Para describir las estructuras de las oraciones en el idioma, se usan las llamadas gramáticas formales, o sea conjuntos de reglas de combinación de palabras y su orden relativo en las oraciones.

    La traducción automática se refiere a la traducción correcta de un lenguaje a otro, tomando en cuenta lo que se quiere expresar en cada oración.

    En el campo de la recuperación de la información han desarrollado sistemas que permiten obtener información sobre estadísticas deportivas, información turística, geografía etc.. En lugar de buscar los documentos para encontrar en ellos la respuesta a su pregunta, el usuario podría hacer su pregunta a la computadora: ¿Cómo se llama el Presidente de Francia?, ¿Cuáles son los centros más avanzados en Procesamiento del Lenguaje Natural?, y otras.

    Por otra parte Se han desarrollado sistemas con la capacidad de crear resúmenes de documentos a partir de los datos suministrados. Estos sistemas son capaces de realizar un análisis detallado del contenido del texto y elaborar un resumen.

    También se han desarrollado sistemas inteligentes que permiten modelar el comportamiento del estudiante, reconocer y procesar sus errores, desarrollar habilidades en la resolución de problemas y otras actividades del proceso enseñanza y aprendizaje. En ellos el Procesamiento del Lenguaje Natural juega un papel de relevante importancia en la creación y desarrollo de interfaces amigables.

    Arquitectura de un sistema de Procesamiento del Lenguaje Natural

    Uno de los elementos fundamentales en el diseño de un sistema PLN es sin lugar a dudas la determinación de la arquitectura del sistema, es decir, como se introducen los datos a la computadora y como ella interpreta y analiza las oraciones que le sean proporcionadas. A continuación se muestra un esquema del análisis léxico/ sintáctico por computadora. El sistema consiste de:

    1. El usuario le expresa (de alguna forma) a la computadora que tipo de procesamiento desea hacer;
    2. La computadora analiza las oraciones proporcionadas, en el sentido morfológico y sintáctico;
    3. Luego, se analizan las oraciones semánticamente, es decir se determina el significado de cada oración;
    4. Se realiza el análisis pragmático del texto. Así, se obtiene una expresión final.

    Se ejecuta la expresión final y se entrega al usuario para su consideración.

    Comprensión del lenguaje

    El verbo comprender, proviene del latín comprenhendere, y significa entender, penetrar, concebir, discernir, descifrar. Se entiende entonces por comprensión – al conocimiento perfecto de alguna cosa; a la captación del significado de alguna cosa o fenómeno; a la acción de aceptar un hecho o un suceso como cierto o plausible sin lugar a duda; a tener certeza completa del significado, naturaleza o explicación de alguna cosa o fenómeno.

    La comprensión adecuada del texto es la tarea más importante y compleja del análisis lingüístico.

    ¿Qué es comprensión del lenguaje?

    ¿Cómo se puede determinar si la computadora comprende el texto?

    La comprensión del texto consiste en su transformación en determinada representación formal. Esta representación formal puede ser una red de conceptos, un conjunto de predicados lógicos, etc. Ella puede usarse posteriormente para responder preguntas, compilar resúmenes, y otras tareas lingüísticas. En la actualidad, los resultados prácticos alcanzados en el área de la comprensión de texto son aun modestos. Por ello, los científicos que trabajan en la lingüística computacional realizan ingentes esfuerzos en esta área del conocimiento.

    Problemas en el procesamiento del lenguaje natural

    Debido a que el Procesamiento del Lenguaje Natural tiene por objetivo fundamental la comprensión del lenguaje natural el hecho de que se presenten en textos y expresiones habladas elementos ambiguos constituye uno de los problemas que se fundamentales que deben ser resueltos racionalmente. El problema de la ambigüedad surge cuando una expresión hablada o escrita posee más de un significado o interpretación.

    Ejemplo 1

    "Pedro vio a Luisa, con la computadora"

    "Pedro vio a Luisa con la computadora"

    Ejemplo 2

    Otro ejemplo de ambigüedad podría estar relacionado con las diversas alternativas de escribir la oración:

    "Determine y Analice los errores del texto con estructuras complejas",

    posiblemente, sería más correcto escribir:

    • Determine y analice los errores del texto que tiene estructuras complejas
    • Determine y analice en el texto los errores que poseen estructuras complejas
    • Determine y analice a través de estructuras complejas los errores en el texto

    Los problemas de ambigüedad también se presentan en la traducción automática, la detección y corrección de errores ortográficos y gramaticales, etc.

    Por ejemplo, para traducir las oraciones como

    John took a cake from the table and ate it.

    John took a cake from the table and cleaned it.

    se necesita realmente entender qué hizo John: tomó un pastel de la mesa y ¿lo comió o la comió? ¿lo limpió o la limpió? Al revés, para traducir el texto Juan le dio a María un pastel. Lo comió, hay que elegir entre las variantes He ate it, She ate it, It ate him, She ate him, etc.

    Generación de textos

    El complemento natural a la capacidad de entender el lenguaje es el segundo componente de la comunicación, que es la capacidad de producir el texto o bien el habla. En cierto grado es una tarea más simple que la comprensión, ya que por lo menos la computadora puede elegir las expresiones que sabe producir.

    Uno podría pensar que para la generación de texto sólo es suficiente saber las reglas de gramática, es decir, saber palabras de cuales números, tiempos y géneros hay que usar en la oración y en que orden ponerlas. Sin embargo, hay algunos problemas en la generación de texto. Uno reside en la necesidad de elegir las palabras y expresiones que «se usan» en el contexto dado. Por ejemplo, hay que saber que para expresar la idea ‘muy, mucho’, hay que usar palabras diferentes: té cargado, voz alta, borracho como una uva, trabajar duro.

    El otro problema es que el texto producido con los métodos de fuerza bruta es aburrido, incoherente y a veces no entendible. Hay que saber en qué ocasiones se deben usar los pronombres y en qué otras las palabras completas, en qué ocasiones hay que explicar, de qué se trata la oración y en qué otras es entendible para el lector. Esto se refiere a los métodos de la nombrada planificación textual.

    El propósito del lenguaje es transferir conocimientos de una persona a otra. El conocimiento es una estructura compleja, multidimensional, que usualmente se representa como una red, o grafo, de conceptos. Pero el modo que usamos para transferir el conocimiento es unidimensional: en cada momento sólo podemos decir un sonido, una letra. Entonces, el trabajo del lenguaje es codificar el conocimiento multidimensional en una cadena de letras, y después, en el cerebro del escuchante o el lector, decodificar esta secuencia en el conocimiento original.

    El lenguaje es una estructura muy compleja. Afortunadamente, el codificador y decodificador funcionan en pasos, construyendo las estructuras más complejas de ladrillos más simples:

         Palabras de letras,

         Oraciones de palabras,

         Textos de oraciones.

    Para ver el gráfico seleccione la opción "Descargar" del menú superior

    En cierta forma un programa de PLN, simula los mecanismos de comunicación que se establecen entre dos humanos.

    Gramáticas Formales

    Hay una clase de sistemas de generación de interés primario para los Informáticos – ellos son los sistemas conocidos como Gramáticas.

    El concepto de Gramática fue originalmente formalizado por los lingüistas en su estudio de los lenguajes naturales

    Los lingüistas tenían relación no sólo con la definición precisa de lo que es o no es una sentencia u oración válida de un lenguaje, sino también de dar o suministrar descripciones estructurales de las sentencias u oraciones

    Uno de estos objetivos estuvo relacionado con el desarrollo de una Gramática Formal capaz de describir la lengua inglesa

    Se podría pensar, que si por ejemplo, se tiene una gramática formal para describir la lengua inglesa, podríamos usar el computador en los campos que necesiten una comprensión de la lengua inglesa

    Tal uso puede ser la traducción de de lenguajes o la solución computacional de problemas de enunciados

    Hasta el momento actual, este objetivo sigue siendo en gran parte irrealizable

    Aun no se dispone de una gramática bien definida de la lengua inglesa.

    Además, existen contradicciones sobre que tipo de gramática formal seria capaz de describir al idioma Ingles.

    Sin embargo, han sido alcanzados mejores resultados en la descripción de los lenguajes de computación

    Por ejemplo, la Forma Backus – Naur usada para describir el lenguaje de programación ALGOL es una "gramática de libre contexto ", esto es, un tipo de gramática con la que tendremos relación en esta disciplina.

    Existe costumbre de realizar diagramas o análisis (parsing) de una sentencia u oración inglesa

    Por ejemplo, la sentencia u oración :"The little boy ran quickly "

    se analiza (parsed) por medio de la notación de que la oración consiste de:

    nome (noun phrase):

    "The little boy"

    seguido de la frase verbal (verb phrase)

    "ran quickly"

    El nombre puede ser decompuesto en nombre singular "boy" modificado por dos adjetivos:

    "The" y

    "little"

    La frase verbal puede ser decompuesta, a su vez, en un verbo singular

    "ran"

    modificado por el adverbio

    "quickly"

    Esta estructura de la oración es indicada en el siguiente diagrama.

    Figura Árbol Sintáctico de una oración

    Se reconoce la estructura de la sentencia u oración como gramaticalmente correcta.

    Si se tiene un conjunto completo de negras para analizar (parsing) todas las oraciones en idioma Ingles, entonces podríamos tener una técnica para determinar si la oración es o no gramaticalmente correcta. Sin embargo, tal conjunto de negras realmente no existe. En parte, esto se debe a que no existen reglas claras y precisas para determinar lo que constituye una oración:

    <sentencia u oracion> ® < nombre> <frase verbal>

    <frase verbal> ® <adjetivo> <frase nominativa>

    <frase nominativa> ® <adjetivo> <nombre singular>

    <frase verbal> ® <verbo singular> <adverbio>

    <adjetivo> ® The

    <adjetivo> ® little

    <nombre singular> ® boy

    <verbo singular> ® ran

    <adverbio> ® quickly

    La flecha indica que el elemento de la izquierda de la flecha puede generar los elementos colocados en el lado derecho de la flecha. Note que se ha encerrado entre corchetes los nombres de las partes de las oraciones, tales como, nombre, verbo, frase verbal, etc., para evitar confusión con las palabras en Ingles y las frases "nombre", "frase verbal", etc. Se puede notar que no es sólo posible verificar las oraciones por su correlación gramatical, sino también es posible generar oraciones correctas gramaticalmente. Para ello se comienza con la cantidad <oración> y se sustituye <oración> por <frase nominativa> seguida de <frase verbal> . Luego se selecciona una de las dos reglas para <frase nominativa> y se aplica, y así sucesivamente , hasta que ninguna otra aplicación adicional de las negras sea posible. En esta forma, un número infinito de oraciones puede ser derivada – esto es, cualquier oración consistente de una cadena de ocurrencias de "the" y "little" seguido por "boy ran quickly" tal como "little the the boy ran quickly" puede generarse. La mayoría de las oraciones no tiene sentido, son gramaticalmente correctas en un sentido amplio.

    Definiciones empleadas en las gramáticas formales.

    Alfabeto: Un alfabeto es un conjunto arbitrario, pero finito, de símbolos.

    Por ejemplo, el código de maquina se basa en el alfabeto binario A1={0,1}; otros ejemplos son A2{0,1,2,3,4,5,6,7,8,9}, A3{+,-,*,/,} etc.

    Símbolos: Los elementos del vocabulario (alfabeto) de un lenguaje formal se denominan símbolos; en el caso de los lenguajes naturales los conocemos como palabras.

    Componente Léxico: las ocurrencias múltiples de símbolos (o palabras) se denominan componentes léxicos.

    Frase: Una frase es una secuencia de símbolos.

    Gramática (sintaxis): La gramática o la sintaxis de un lenguaje define si una secuencia arbitraria de símbolos es correcta, es decir, si es una frase significativa. Decimos que una frase correcta será aceptada por el lenguaje.

    Cadena: Sentencia (finita) de elementos de un cierto conjunto (alfabeto).

    Producción: Las reglas para la sustitución de cadenas se denominan producciones.

    Símbolos terminales: Son los símbolos que realmente aparecen en una frase.

    Símbolos no terminales: Los símbolos no terminales deben ser definidos por otras producciones o reglas ; es decir, también aparecen en el lado izquierdo de las producciones. Los símbolos no terminales son variables sintácticas.

    Vocabulario = alfabeto: Al igual que los lenguajes naturales, los lenguajes formales se basan en un vocabulario específico, a saber, los elementos del lenguaje.

    Forma de Backus – Naur

    La forma de Backus – Naur fue creada para definir la estructura del lenguaje de programación ALGOL60.

    Tabla Forma Backus – Naur

     

     

     

    Símbolo

    Significado

    "se define como"

    fin de definición

    |

    "or", alternativa

    [x]

    Una o ninguna ocurrencia de x

    {x}

    Número arbitrario de ocurrencias de

    x (0,1,2,…)

    (x | y)

    Selección (x o y)

     

    La forma Backus – Naur es un metalenguaje, o sea, un lenguaje con el que se pueden describir otros lenguajes. Hay algunos dialectos de la notación BNF. En la tabla se presentan algunos de los símbolos más comunes de la BNF. Con esa notación y los símbolos terminales.

    T= {+,-, 0,1,2,3,4,5,6,7,8,9}

    Además de los símbolos no terminales

    N= {int, unsigned_int, digit}

    Podemos definir los enteros con las siguientes reglas (producciones) BNF:

    int à [+ | – ] unsigned_int

    unsigned_int à digit unsigned_int digit.

    digit à 0|1|2|3|4|5|6|7|8|9|

    La primera regla define un entero como un entero sin signo mas un signo inicial. Este signo puede estar ausente o ser "+" o "-". La segunda regla indica que la notación BNF permite definiciones recursivas.

    Existe una descripción formal de un lenguaje si existe un número finito de reglas BNF que permiten derivar cualquier frase del lenguaje. En este aspecto, el conjunto finito de reglas anterior es una descripción formal del conjunto infinito de los enteros.

    Conclusiones

    El procesamiento del lenguaje natural tiene como objetivo fundamental lograr una comunicación maquina-humano similar a la comunicación humano-humano.

    El empleo del lenguaje le permite al hombre trasmitir sus conocimientos, sentimientos, sensaciones, emociones, y estados de ánimo

    A lo largo de la historia los lenguajes naturales han ido evolucionando, de forma paralela al desarrollo y evolución de la especie humana.

    Han sido varios los sistemas informáticos inteligentes que se han desarrollado que emplean el procesamiento del lenguaje natural.

    Bibliografía

    1.      Adolfo Guzmán-Arenas. Hallando los temas principales en un artículo en español. Soluciones Avanzadas. Vol. 5, No. 45, p. 58, No. 49, p. 66, 1997.

    2.      Adolfo Guzmán-Arenas. Finding the main themes in a Spanish document. Journal Expert Systems with Applications, Vol. 14, No. 1/2. Jan/Feb 1998, pp. 139-148.

    3.      I. A. Bolshakov, A. Gelbukh. Lexical functions in Spanish. CIC-98 – Simposium Internacional de computación, November 11 – 13, 1998, México D.F., pp. 383 – 395.

    4.      Alexander Gelbukh. Using a semantic network for lexical and syntactic disambiguation. Proc. of Simposium Internacional de Computación: Nuevas Aplicaciones e Innovaciones Tecnológicas en Computación, November 1997, México.

    5.      A.Gelbukh, I. Bolshakov, S. Galicia-Haro. Statistics of parsing errors can help syntactic disambiguation. CIC-98 – Simposium Internacional de Computación, November 11 – 13, 1998, México D.F., pp. 405 – 515.

    6.      I.A. Bolshakov, A.F. Gelbukh, S.N. Galicia-Haro. Syntactical managing patterns for the most common Spanish verbs. CIC’97, Nuevas Aplicaciones e Innovaciones Tecnológicas en Computación, Simposium Internacional de Computación, 12-14 de noviembre, pp. 367 – 371, 1997, CIC, IPN, México D.F.

    7.      I. A. Bolshakov, A. Gelbukh, S. Galicia Haro, M. Orozco Guzmán. Government patterns of 670 Spanish verbs. Technical report. CIC, IPN, 1998.

    8.      Manuel Montes y Gómez, Aurelio López López, Alexander Gelbukh. Text Mining as a Social Thermometer. Text Mining Workshop (forthcoming) at IJCAI'99, Stockholm, August, 1999.

    9.      A. Gelbukh, S. Galicia-Haro, I.Bolshakov. Three dictionary-based techniques of disambiguation. TAINA-98, International Workshop on Artificial Intelligence, CIC-IPN, México D.F., pp. 78 – 89.

    10.  Adolfo Guzmán Arenas. Colaboración Dirigida entre Agentes con Propósito. Memorias del Congreso Internacional de Computación CIC-99, CIC, IPN, 1999, México.

    Lic Ernesto González Díaz MsC.

    Licenciado en Matemática

    Master en Ciencias Cibernéticas

    Profesor de Inteligencia Artificial

    Universidad de las Ciencias Informáticas La Habana Cuba

    Categoría: Informática y Computación