Descargar

Almacenes de Datos y Microsoft SQL Server 2008


Partes: 1, 2

    1. Esquemas del diseño dimensional
    2. Base de datos fuentes
    3. Interfaces orientadas a usuarios que extraen información para la toma de decisiones
    4. Microsoft SQL Server 2008
    5. Bibliografía

    Categorías de los Sistemas de Información

    Los sistemas de Información se dividen en dos categorías (Casares, 2003):

    • Sistemas operacionales: Son aquellos que tienen como objetivos reflejar el estado y funcionamiento de la empresa registrando las transacciones u operaciones diarias, de aquí que los mismos se conozcan como sistemas de Procesamiento de Transacciones en Línea (OLTP).

    • Sistemas para el soporte de decisiones: Son aquellos que tienen como objetivos medir y controlar el desarrollo de las variables importantes del negocio, buscando identificar, proyectar y predecir tendencias a partir de los datos acumulados.

    Desde que se inició la era de la computadora, las organizaciones han usado los datos desde sus sistemas operacionales para atender sus necesidades de información. Algunas proporcionan acceso directo a la información contenida dentro de las aplicaciones operacionales. Otras, han extraído los datos desde sus bases de datos operacionales para combinarlos de varias formas no estructuradas, en su intento por atender a los usuarios en sus necesidades de información (Casares, 2003).

    Bill Inmon fue uno de los primeros autores en escribir sobre el tema de almacenes de datos, define un almacén de datos en términos de las características del repositorio de datos (Inmon, 2007):

    Orientado a temas: Los datos en la base de datos están organizados de manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre sí.

    Variante en el tiempo: Los cambios producidos en los datos a lo largo del tiempo quedan registrados para que los informes que se puedan generar reflejen esas variaciones.

    No volátil: La información no se modifica ni se elimina, una vez almacenado un dato, éste se convierte en información de sólo lectura y se mantiene para futuras consultas.

    Integrado: La base de datos contiene los datos de todos los sistemas operacionales de la organización y dichos datos deben ser consistentes.

    Los mercados de datos son subconjuntos de datos de un almacén de datos para áreas específicas. Desde el punto de vista de diseño se aplica en el mercado de datos todo lo que es aplicable a un almacén de datos (Inmon, 2007).

    El Modelo Dimensional es el más usado en los sistemas de almacenes de datos, este es diferente al modelo relacional utilizado en los sistemas OLTP. Este modelo se basa en dimensiones, las cuales representan categorías de información, atributos que representan un único nivel dentro de una dimensión, pueden existir jerarquías de atributos las cuales expresan relaciones entre diferentes atributos y por último tablas de hechos, las cuales contienen datos de interés, que presentan un nivel de granularidad. La granularidad es el nivel más bajo de información que será almacenado en la tabla de hechos. El primer paso al diseñar una tabla de hechos es determinar la granularidad.

    Esquemas del diseño dimensional

    • Esquema Estrella: Una tabla de hechos en el centro conectada con un conjunto de tablas de dimensiones.

    • Esquema Copo de Nieve: Un refinamiento del anterior donde algunas dimensiones se normalizan en tablas más pequeñas.

    • Constelación de Hechos: Múltiples tablas de hechos comparten tablas de dimensión que se visualizan como una constelación de hechos.

    La gestión administrativa reconoce que una manera de elevar su eficiencia está en hacer el mejor uso de los recursos de información que ya existen dentro de la organización. El almacén de datos, es actualmente, el centro de atención de las grandes instituciones, porque provee un ambiente para que las organizaciones hagan un mejor uso de la información que está siendo administrada por diversas aplicaciones operacionales (Casares, 2003).

    La arquitectura de un almacén de datos consta de tres niveles (Casares, 2003):

    • Bases de datos fuentes (producción e históricos).

    • Una base de datos con datos resumidos extraídos de las bases de producción (almacén de datos).

    • Interfaces orientadas a usuarios que extraen información para la toma de decisiones. Las clásicas son: consultas y reportes, análisis multidimensional y Minería de Datos.

    Base de datos fuentes

    Consiste en bases de datos de producción así como en históricos de dichas bases. Estas bases de datos pueden estar implementadas en diferentes tipos de sistemas: BD-Relacionales, BD-geográficas, BD-textos, archivos, etc. Una característica común es que almacenan ítems de datos atómicos, los cuales son relevantes como datos de producción, pero pueden ser demasiado finos para servir como base para la toma de decisiones. Además, la noción de calidad de los datos en estas bases se basa en la consistencia de dichos registros, independientemente de la relevancia que estos tengan dentro del problema.

    Partes: 1, 2
    Página siguiente