Descargar

Recuperación de Datos

Enviado por julio vargas


Partes: 1, 2

  1. Introducción
  2. Como se lleva a cabo el proceso de búsqueda de información
  3. Fundamentos de recuperación de información
  4. Fundamentos de recuperación de información
  5. Sistemas o técnicas para buscar información
  6. Recomendaciones
  7. Conclusión
  8. Bibliografía

Introducción

Los sistemas de búsqueda han adquirido una gran importancia en el uso cotidiano de los ordenadores hasta el punto de que realizar una consulta en un buscador es la acción más frecuente, tras el envío de un correo electrónico. Sin embargo, la búsqueda y recuperación de información textual tienen asociadas una serie de problemas todavía no resueltos satisfactoriamente. Algunos de estos problemas provienen de la ambigüedad y la falta de estructura propias del lenguaje natural. En parte cuando la información ya no la tenemos a nuestro alcance por diferentes motivos acudimos a muchas técnicas para recuperar nuestra valiosa información.

OBJETIVO GENERAL

Reconocer las distintas formas aplicadas a la recuperación de información.

Como se lleva a cabo el proceso de búsqueda de información

El proceso de recuperación se lleva a cabo mediante consultas a la base de datos donde se almacena la información estructurada, mediante un lenguaje de interrogación adecuado. Es necesario tener en cuenta los elementos clave que permiten hacer la búsqueda, determinando un mayor grado de pertinencia y precisión, como son: los índices, palabras clave, tesauros y los fenómenos que se pueden dar en el proceso como son el ruido y silencio documental. Uno de los problemas que surgen en la búsqueda de información es si lo que recuperamos es "mucho o poco" es decir, dependiendo del tipo de búsqueda se pueden recuperar multitud de documentos o simplemente un número muy reducido. A este fenómeno se denomina Silencio o Ruido documental.

Fundamentos de recuperación de información

Según el modelo más aceptado actualmente, la recuperación de información consiste en un proceso en el que intervienen tres elementos:

  • una colección de ítemes de información, tales como documentos, que están registrados en un depósito de información (por ejemplo en una base de datos),

  • una serie de preguntas que traducen las necesidades de información de los usuarios y, finalmente,

  • una función de comparación documentos/preguntas que genera como salida documentos relevantes (véase la fig. 1). Recuperar información, entonces consiste en buscar los documentos que exhiben un mayor parecido con la pregunta.

  • edu.red

    La hipótesis subyacente en el modelo anterior es que una forma de juzgar la relevancia de un documento es medir su grado de similitud con la pregunta, y que la forma de representar ambas entidades (preguntas y documentos) es mediante el uso de información textual, aunque las entidades en sí mismas no sean textuales.

    En general, para comparar el grado de parecido entre dos entidades es necesario identificar algún grupo de propiedades medibles y después establecer un procedimiento que permita calcular cuántas de éstas propiedades comparten ambas entidades.

    Sistemas o técnicas para buscar información

    1. Sistemas de recuperación de lógica difusa

    En el modelo de lógica difusa los autores no asignan los grados de pertenencia de los documentos a los términos. Además, la aplicación de modelos borrosos es idónea para solucionar los problemas de incompletitud e imprecisión a la hora de indexar un documento.

    En la equiparación probabilística, el cálculo último devuelto sobre la probabilidad de que los términos de los documentos sean potencialmente relevantes a una pregunta, está contenida en los documentos relevantes y en los no relevantes. En la equiparación difusa, el cálculo se define basándose en el grado de pertenencia de los términos. La cuestión llega a ser tal, que el grado de confianza de que un documento contenga un término dado es relevante. Si ésto se usa para definir el grado de pertenencia, entonces este grado con respecto al conjunto de documentos relevantes, puede ser computado para cualquiera de los documentos.

    2. Técnica de ponderación de términos

    En la búsqueda unos criterios tienen más valor que otros, dependiendo de los intereses del usuario. Los documentos recuperados se encuentran en función del valor obtenido en la ponderación. El documento más pertinente de búsqueda sería aquel que tenga representado todos los términos de búsqueda y, además, el que más valor tenga repetidos más veces.

    3. Técnicas de clustering

    Partes: 1, 2
Página siguiente