Descargar

Procesamiento del lenguaje natural para recuperar información


Partes: 1, 2

  1. Resumen
  2. Introducción
  3. Problemas para el procesamiento del lenguaje natural
  4. Aplicaciones del procesamiento del lenguaje natural
  5. El procesamiento del lenguaje natural para la recuperación de información textual
  6. Campos de investigación relacionados
  7. Conclusiones
  8. Referencias

Resumen.

El presente trabajo tiene por objeto hacer una revisión de las principales características de las técnicas de procesamiento del lenguaje natural, centrándose en su aplicación a la recuperación de información y áreas afines. Se establece una comparación entre el procesamiento lingüístico y el procesamiento estadístico del lenguaje natural.

Palabras claves: Procesamiento del lenguaje natural, lenguajes, recuperación de la información.

1. Introducción

El Procesamiento del Lenguaje Natural es una disciplina con una larga trayectoria. Nace en la década de 1960, como subárea de la Inteligencia Artificial y la Lingüística, con el objeto de estudiar los problemas derivados de la generación y comprensión automática del lenguaje natural.

En sus orígenes, sus métodos tuvieron gran aceptación y éxito, no obstante, cuando sus aplicaciones fueron llevadas a la práctica, en entornos no controlados y con vocabularios genéricos, empezaron a surgir multitud de dificultades.

En los últimos años, las aportaciones que se han hecho desde este dominio han mejorado sustancialmente, permitiendo el procesamiento de enormes cantidades de información en formato texto con un grado de eficacia aceptable. Muestra de ello es la aplicación de estas técnicas como una componente esencial en los motores de búsqueda Web, en las herramientas de traducción automática, o en la generación automática de resúmenes. [Strzalkowski, 1999]

2. Problemas para el procesamiento del lenguaje natural.

El Lenguaje natural es el medio que utilizamos de manera cotidiana para establecer nuestra comunicación con las demás personas. La riqueza de sus componentes semánticas da a los lenguajes naturales su gran poder expresivo y su valor como una herramienta para razonamiento sutil.

El lenguaje natural, posee propiedades que merman la efectividad de los sistemas de recuperación de información textual:

  • Son desarrollados por enriquecimiento progresivo antes de cualquier intento de formación de una teoría.

  • La variación lingüística. Es la posibilidad de utilizar diferentes palabras o expresiones para comunicar una misma idea.

  • La ambigüedad lingüística. Se produce cuando una palabra o frase permite más de una interpretación.

Las dos últimas propiedades inciden en el proceso de recuperación de información de forma distinta. La variación lingüística provoca el silencio documental, es decir la omisión de documentos relevantes para cubrir la necesidad de información, ya que no se han utilizado los mismos términos que aparecen en el documento. En cambio, la ambigüedad implica el ruido documental, es decir la inclusión de documentos que no son significativos, ya que se recuperan también documentos que utilizan el término pero con significado diferente al requerido. Estas dos características dificultan considerablemente el tratamiento automatizado del lenguaje. [Pedraza-Jiménez, 2007]

Ejemplos:

Deja la comida que sobre, sobre la mesa de la cocina, dijo llevando el sobre en la mano.

La misma palabra es utilizada con diferentes significados.

3. Aplicaciones del procesamiento del lenguaje natural

Las aplicaciones del Procesamiento de Lenguajes Naturales son muy variadas, ya que su alcance es muy grande, algunas de estas son:

– Traducción automática: se refiere más que nada a la traducción correcta de un lenguaje a otro, tomando en cuenta lo que se quiere expresar en cada oración, y no solo palabra por palabra. Una aproximación a este tipo de traductores es el Babylon.

– Extracción de Información y Resúmenes: Los nuevos programas, deben tener la capacidad de crear un resumen de un documento basándose en los datos proporcionados, realizando un análisis detallado del contenido y no sólo truncando las primeras líneas de los párrafos.

– Resolución cooperativa de problemas: La computadora debe tener la capacidad de cooperar con los humanos para la solución de problemas complejos, proporcionando datos e información, incluyendo también, la demanda de información por parte del ordenador al usuario, debiendo existir una excelente interactividad entre el usuario y el ordenador.

– Tutores inteligentes: Esta aplicación, viene siendo más académica, ya que se refiere a la enseñanza asistida por computadora, el ordenador debe tener la capacidad de evaluar al educando y de adaptarse a cada tipo de alumno.

– Reconocimiento de Voz: Esta aplicación ha obtenido éxito en la actualidad, ya que las computadoras de hoy ya tienen esta característica, el reconocimiento de voz puede tener dos posibles usos: para identificar al usuario o para procesar lo que el usuario dicte, existiendo ya programas comerciales, que son accesibles por la mayoría de los usuarios, ejemplo: ViaVoice.

Partes: 1, 2
Página siguiente