Descargar

Los motores de búsqueda

Enviado por Pablo Turmero


Partes: 1, 2

    edu.red

    1 Objetivos El estudio de los motores de búsqueda en cuanto a su funcionamiento.

    La programación de un prototipo, implementado en Java, MySQL, HTML y JSP.

    edu.red

    2 Los buscadores

    edu.red

    3 Qué son Los buscadores son programas informáticos que se dedican a analizar la Web para posteriormente poder buscar en ella.

    Están formados por las cinco partes que se presentan a continuación:

    INTERFAZ: punto de interconexión con el usuario. En la interfaz se introducirán las palabras a buscar y se recibirán los resultados. RASTREADOR: Programa que analiza la red. BASE DE DATOS: Lugar en el que se almacenará la información encontrada. ÍNDICES: Algoritmos que modelarán la base de datos. PROGRAMA DE BÚSQUEDA: Programa que buscará en la base de datos.

    edu.red

    4 Por qué se utilizan “Aunque es sumamente difícil medir el tamaño de la Web, se estima que hoy en día unos 1.000.000.000 usuarios utilizan la Web, y que esta contiene del orden de 4.000.000.000 documentos, un volumen equivalente a entre catorce y veintiocho millones de libros” Pablo Castells, La Web Semántica Así, podemos admitir que una estructuración de esta información es necesaria. ¿Se imaginan el tiempo que tardaría una persona para encontrar todos los libros que contengan una palabra determinada en una pequeña biblioteca de cien libros? “Ahora se puede buscar a lo equivalente a 70 millas de altura en papel en menos de un segundo. Creemos que es fantástico” Lawrence Page, cofundador de Google

    edu.red

    5 Situación actual Según el portal SearchEngineWath.com se realizan unos 213 millones de búsquedas al día, con un total de 6.400 millones en Marzo de 2006 en EEUU.

    Por este motivo, el mundo de los buscadores mueve grandes cantidades de dinero (el 99% del cual es publicidad, según El País).

    El mercado actual está dominado por Google, que indexaba hace un tiempo el 71.16% de toda la red y que cuenta con más de 9.500 empleados bajo un lema: “organizar la información mundial y hacerla universalmente accesible y útil”.

    edu.red

    6 En vista al futuro Dos son las tendencias actuales: Búsqueda semántica: de esta nueva generación de motores de búsqueda se espera que consigan entender a la perfección al usuario. A modo de ejemplo: buscadores capaces de entender la diferencia entre ‘libros de niños’, ‘libros para niños’, ‘libros con niños’. Búsqueda personalizada: buscadores que almacenan todos los movimientos de los usuarios en sus cuentas (búsquedas, e-mails, etc.) para dar con temas de interés personal.

    edu.red

    7 Prototipo

    edu.red

    8 Idea El objetivo de este trabajo ha sido la implementación de un prototipo de buscador.

    Hacerlo a escala de red de redes es una tarea que se me presenta hoy por hoy inabarcable: hacer una base de datos eficiente, un rastreador rápido, etc.

    De esta manera, Wibo rastreará sólo las páginas Abat Oliba y permitirá buscar en ellas.

    edu.red

    9 Tecnologías Java, JSP y HTML como lenguajes de programación

    MySQL como herramienta de base de datos

    edu.red

    10 Diseño e implementación Wibo ha sido diseñado para que sea de lo más eficiente.

    Este motor de búsqueda está orientado a páginas Abat Oliba.

    Por este motivo, no controla muchos de los posibles errores con los que un buscador a gran escala debe tratar.

    Está formado por un crawler, una base de datos, un programa de búsqueda y una interfaz.

    edu.red

    11 Diseño e implementación Diseñada para estructurar la información de un modo más racional. A continuación se presenta el modelo entidad-relación: Base de datos

    edu.red

    12 Diseño e implementación Las imágenes que seguidamente se presentan muestran muy bien su estructura: Tabla URLS:

    Tabla PALABRAS:

    Tabla PALABRAS_URL:

    Base de datos

    Partes: 1, 2
    Página siguiente