Descargar

Reomendación de weblogs utilizando reglas de asociación

Partes: 1, 2

    1. Abstract

    Los weblogs son sitios web en los que uno o varios autores publican sus opiniones sobre temas de actualidad. Estos sitios web suelen actualizarse varias veces al día, y los buscadores no suelen contener actualizados sus índices con los últimos cambios. En este artículo proponemos las reglas de asociación como medio para recomendar a los lectores de un weblog otros weblogs con temas relacionados partiendo del resultado de una encuesta.

    Palabras clave· comunidades virtuales · entornos virtuales · gestión del conocimiento · hipertexto/hipermedia · sociedad del conocimiento

    2. Introducción

    La información y los servicios que Internet y la World Wide Web (WWW) ofrece, han crecido vertiginosamente en los últimos años. La WWW se ha convertido en un medio de comunicación indispensable para cerca de mil millones (a) de usuarios en todo el mundo.

    Entre los servicios de comunicación que La Red ofrece, uno de los que está teniendo un mayor crecimiento (b) son los weblogs (abreviado blogs y traducido como bitácoras (c)).

    Los weblogs son sitios web en los que uno o varios autores publican sus opiniones sobre temas de actualidad, comentan otros sitios u opiniones de otros usuarios. Estos sitios además, ofrecen un alto grado de interactividad con el lector, ya que estos pueden publicar sus comentarios a las opiniones de los autores.

    Las bitácoras en español más populares, como Blogalia, contienen miles de historias y cada historia decenas de comentarios. Navegar entre tanta información no es tarea fácil, más cuando las bitácoras suelen actualizarse varias veces al día, y los buscadores genéricos (Google, Yahoo!, Excite, Altavista, etc.) no suelen contener actualizados sus índices con los últimos cambios. Otro inconveniente de los sistemas de búsqueda actuales son las búsquedas basadas en palabras clave (keywords). Estos sistemas no contienen información semántica por lo que la búsqueda de, por ejemplo, la palabra "granada" dará como resultado una lista de páginas sobre información turística de la ciudad de Granada, otras con información sobre explosivos y posiblemente otra lista que nos hable sobre frutas.

    Estos y otros inconvenientes motiva el estudio de nuevas técnicas que generen mejores resultados en la extracción de conocimiento del web (web mining) y más concretamente en los weblogs.

    Este trabajo está basado en la aplicación de las reglas de asociación pertenecientes al grupo de técnicas utilizadas en la minería de datos (data mining) para resolver el problema de extracción de conocimiento de las bases de datos de las bitácoras.

    Pretendemos con la aplicación de las reglas de asociación ofrecer al usuario de las bitácoras información que puede serle de gran utilidad como los autores que tratan los mismos temas que su autor preferido, los temas que están más relacionados con sus temas preferidos, o los enlaces que tienen relación con un tema.

    El trabajo está organizado en las siguientes secciones: la introducción introduce al lector en el problema, la sección weblogs pone en antecedentes históricos a lector sobre este servicio de Internet objeto de esta investigación, a continuación se realiza un recorrido por las técnicas más utilizadas del data mining. La sección web mining realiza una revisión de las técnicas más utilizadas en la minería del Web, posteriormente se tratan las reglas de asociación y el algoritmo Apriori, utilizado en este trabajo. Posteriormente realizamos una descripción formal del problema y se detallan las fases de la minería de datos llevadas a cabo para llegar a la solución. Mas adelante se presentan los resultados y por último detallamos las conclusiones y los trabajos futuros.

    Weblogs

    Segun Dave Winer, creador de uno de los primeros weblogs y uno de los que más tiempo lleva funcionando en Internet Scripting News (d), los weblogs son "sitios web actualizados frecuentemente que apuntan a artículos en cualquier lugar de la Web, usualmente con comentarios. Un weblog es un tipo de tour guiado por Internet con un guía especializado. Hay muchos guías para elegir, cada uno tiene su propia audiencia y suele existir camaradería entre la gente que publica los weblogs, suelen crear links entre sus weblogs formando todo tipo de estructuras, grafos, bucles, etc." (9)

    Marcé Molist de El País, define los weblogs como "sitios web donde uno o más autores publican regularmente sus reflexiones, descubrimientos o cualquier otro tipo de información que consideren interesante para sus lectores". (11)

    Con esto concluye nuestra pequeña introducción a Internet, la WWW y los weblogs. Esperamos que el lector tenga ahora un mayor conocimiento del lugar en el que se centra nuestra investigación. En las siguientes secciones introduciremos al lector en las técnicas de data mining utilizadas.

    Partes: 1, 2
    Página siguiente