Una componente importante en el almacén de datos es el Diccionario de Datos (Meta-Data), en el mismo se describen los datos almacenados con el objetivo de facilitar el acceso a los mismos a través de las herramientas de explotación del almacén de datos. El Diccionario de Datos establece correspondencias entre los datos almacenados y los conceptos que estos representan para facilitar la extracción de información por parte del usuario final.
Interfaces orientadas a usuarios que extraen información para la toma de decisiones
Interfaces para consultas y reportes complejos: Permiten al usuario construir gráficas y reportes a partir de la información contenida en el almacén de datos y descrita a través del Diccionario de Datos. Algunas funcionalidades típicas de estas herramientas son: agrupamiento y desagrupamiento dinámico de datos en reportes, cambios en el orden de los campos del reporte, visualización del resultado de las consultas en forma gráfica (barras, torta, puntos, etc.). Estas herramientas generan las expresiones en el lenguaje de consulta que recupera los datos pedidos (típicamente SQL), se conectan al almacén de datos, recuperan el resultado y lo formatean según la especificación dada.
Productos de análisis de datos (OLAPs): Permiten representar los datos del problema en términos de dimensiones. Por ejemplo, si se trata de ventas de productos en diferentes zonas, una dimensión del problema son las zonas, otra los productos y otra el tiempo. De esta manera, las consultas de análisis de datos de una dimensión en función de la otra se realizan en forma inmediata.
Herramientas de Minería de Datos: Permiten explorar el almacén de datos en búsqueda de relaciones desconocidas o inesperadas entre los datos.
Las principales motivaciones para construir un almacén de datos son las siguientes (Casares, 2003):
Disponer de Sistemas de Información de apoyo a la decisión.
Disponer de bases de datos que permitan extraer conocimiento de la información histórica almacenada en la organización.
Diseñar una base de datos que permita ejecutar consultas desconocidas.
Microsoft SQL Server 2008
Microsoft SQL Server 2008 brinda una plataforma para la construcción y el mantenimiento de almacenes de datos, a continuación se muestran algunas de sus nuevas características y mejores prácticas asociadas a las mismas:
Compresión de Datos
La compresión de datos reduce el espacio requerido para almacenar tablas e índices permitiendo un uso más eficiente de la capacidad de almacenamiento. Existe la posibilidad de la compresión por artículo o por página. La compresión por artículo almacena todos los campos en un formato de ancho variable, la compresión por página hace lo mismo pero se realiza entre los artículos de una misma página. Un diccionario a nivel de página es usado para almacenar los valores comunes, además prefijos comunes de valores de columnas son almacenados solo una vez en la página. Ambas formas de compresión pueden ser aplicadas a las tablas y a los índices.
Encriptación de Datos Transparente
La encriptación de datos transparente permite que los datos sean almacenados de forma segura mediante la encriptación de los ficheros de la base de datos. El SQL Server realiza la encriptación y desencriptación directamente por lo que el proceso es transparente para la aplicación conectada. Si se utiliza a la vez compresión de datos y encriptación, se deben realizar las operaciones en este orden.
Gobernador de Recursos
El Gobernador de Recursos les permite a los administradores el control y la asignación de recursos como Procesadores y Memoria a las aplicaciones de más alta prioridad.
Adición en Caliente de Procesadores y Memoria
La edición de SQL Server Enterprise de 64 bits permite la adición en caliente de procesadores y memoria sin necesidad de apagar el servidor ni limitar las conexiones existentes.
Operador MERGE
El nuevo operador MERGE simplifica el proceso de carga de un almacén de datos desde su fuente. Este nuevo operador distingue los artículos nuevos y actualizados en la base de datos fuente y realiza la acción apropiada en el almacén de datos.
Nuevos Tipos de Datos Espaciales
Los nuevos tipos de datos espaciales GEOGRAPHY y GEOMETRY permite que datos espaciales puedan almacenarse directamente en SQL Server 2008. GEOGRAPHY permite representar datos geodésicos en tres dimensiones los cuales son utilizados por aplicaciones GPS y GEOMETRY permite representar puntos en planos de dos dimensiones. Además existe una integración con Virtual Earth lo cual permite representaciones gráficas de localizaciones físicas.
Todas estas nuevas características hacen de Microsoft SQL Server 2008 una herramienta de avanzada para la creación y el mantenimiento de almacenes de datos.
Bibliografía
, C. (2003) Data Warehousing.
INMON, B. (2007) Coporate Information Factory. Inmon Consulting Services.
MICROSOFT (2008) Best Practices for Data Warehousing with SQL Server 2008.
MICROSOFT (2008) What's New in SQL Server 2008.
Autor:
Lic. Carlos Galindo González
Dr. Ramiro Pérez Vázquez
Universidad Central de Las Villa, Cuba
Página anterior | Volver al principio del trabajo | Página siguiente |