Descargar

El Benchmark TPC-H en MySQL y Postgress


    Resumen

    Para cualquier Sistema de Informacion el poder procesar informacion de manera rapida se ha vuelto una necesidad muy importante. Por este motivo se necesita la construccion de base de datos con caracteristicas especiales que permitan mejorar los procesos, a esta coleccion de bases de datos se le denomina Almacenes de Datos (Data Warehouse), estos favorecen el analisis y divulgacion eficiente de los datos (especialmente operaciones de analisis de datos (OLAP).

    Palabras Clave—Benchmark, Funciones OLAP, Almacen de Datos, Benchmark TPC-H.

    1 INTRODUCCION

    A partir de 1999 en el estandar de SQL incluye funcionalidades OLAP, que nos permiten obtener informacion de bases de datos multidimensionales que son utiles en la toma de decisiones en una empresa u organizacion.

    Para tomar decisiones correctas es necesario implementar un benchmark, el cual puede facilitarnos todas las especificaciones tecnicas de un ordenador junto con su rendimiento ante los diferentes estimulos lo que permite realizar comparativas entre diferentes sistemas atendiendo a sus especificaciones tecnicas y su rendimiento.

    En esta investigacion se haraun analisis comparativo en terminos de la eficiencia de la funciones OLAP de los Sistemas Gestores de Bases de Datos (SGBD) MySQL y PostgreSQL, para lo cual se tomocomo referencia el modelo logico de la base de datos y las consultas incluidas en el benchmark TPC-H version 2.8.0, este se centra como apoyo a la toma de decisiones involucrando grandes cantidades de datos relativamente estables.

    2 CONCEPTOS BASICOS

    Para entender mejor de lo que se trata esta investigacion, describiremos lo que son Benchmark, Funciones OLAP, Almacen de Datos y Benchmark TPC-H.

    2.1 ¿Que es un Almacen de Datos?

    Almacen de Datos (Data Warehouse).Es una coleccion de datos en la cual se encuentra integrada la informacion de la empresa u organizacion. Esta informacion es de utilidad en el proceso de toma de decisiones gerenciales.

    Un Data Warehouse es como el expediente de una empresa con informacion transaccional y operacional, que es almacenada en una base de datos diseñada para favorecer analisis y la divulgacion eficientes de datos (especialmente OLAP, procesamiento analitico en linea). El almacenamiento de los datos no debe usarse con datos de uso actual.

    Los Data Warehouse contienen a menudo grandes cantidades de informacion que se subdividen a veces en unidades logicas mas pequeñas, llamadas los centros comerciales, dependientes de los datos. Generalmente, dos ideas basicas dirigen la creacion de un almacen de los datos:

    Integracion de los datos de bases de datos distribuidas con estructuras diferentes, que facilitan una descripcion global y un analisis comprensivo en el almacen de los datos.

    Separacion de los datos usados en operaciones diarias de los datos usados en el almacen de los datos para los propositos de la divulgacion, de la ayuda en la toma de decisiones, para el analisis y para controlar.

    2.2 Funcionalidades OLAP

    OLAP. Es el acronimo en ingles de procesamiento analitico en linea (On-Line Analytical Processing). Es una solucion utilizada en el campo de la Inteligencia de Negocios (Business Intelligence), la cual consiste en consultas a estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de Datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de direccion, mineria de datos y areas similares.

    La razon de usar OLAP para las consultas es la velocidad de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Pero esto es relativamente lento a la hora de realizar las complejas consultas multitabla. Un modelo mejor para busquedas, es una base de datos multidimensional. La principal caracteristica que potencia a OLAP, es que es lo mas rapido a la hora de hacer SELECTS.

    2.3 ¿Que es un benchmark?

    En terminos informaticos un benchmark es una aplicacion destinada a medir el rendimiento de un ordenador o de algun elemento del mismo. Para ello se somete a la maquina a una serie de cargas de trabajo o estimulos de distinto tipo con la intencion de medir su respuesta ante ellos. De esta forma se puede estimar bajo quetareas o estimulos un determinado ordenador se comporta de una manera fiable y efectiva o por el contrario se muestra ineficiente.

    Esta informacion es muy util a la hora de seleccionar una maquina para realizar tareas determinadas en el proceso de postproduccion y creacion del producto audiovisual, pudiendo elegir la mas adecuada para un proceso determinado. El benchmark tambien es util para estimar el nivel de obsolescencia de un sistema o en queaspectos tecnicos puede ser mejorado su rendimiento, por medio de actualizaciones.

    Por otro lado el benchmark puede facilitarnos todas las especificaciones tecnicas de un ordenador junto con su rendimiento ante los diferentes estimulos lo que permite realizar comparativas entre diferentes sistemas atendiendo a sus especificaciones tecnicas y su rendimiento.

    Las comparativas son utiles para determinar que caracteristicas tecnicas son las idoneas para conseguir un rendimiento optimo en una tarea especifica. Una comparativa entre multiples ordenadores de diferentes fabricantes (con diferentes especificaciones tecnicas) nos permite determinar a priori cuales son mas adecuados para determinadas aplicaciones y cuales son mejores para otras.

    2.4 Benchmark TPC-H

    El Benchmark TPC-H es una prueba de rendimiento a sistemas de soporte de decisiones. Consiste en una "suite" de negocios orientados a busquedas convenientes y modificaciones simultaneas de datos. Las busquedas y la poblacion de datos han sido elegidas un amplia relevancia en la industria. Este benchmark ilustra las decisiones de los sistemas de respaldo que examinan grandes volumenes de datos, ejecutan busquedas con un elevado grado de complejidad y responde a situaciones criticas de negocios.

    EL PRESENTE TEXTO ES SOLO UNA SELECCION DEL TRABAJO ORIGINAL. PARA CONSULTAR LA MONOGRAFIA COMPLETA SELECCIONAR LA OPCION DESCARGAR DEL MENU SUPERIOR.