4. Diferentes enfoques de los sistemas manejadores de base de datos
El sistema manejador de bases de datos (dbms). Es un conjunto de programas que se encargan de manejar la creación y todos los accesos a las bases de datos. Se compone de un lenguaje de definición de datos, de un lenguaje de manipulación de datos y de un lenguaje de consulta. Una de las ventajas del DBMS es que puede ser invocado desde programas de aplicación que pertenecen a sistemas que pertenecen a Sistemas Transaccionales escritos en algún lenguaje de alto nivel, para la creación o actualización de las bases de datos, o bien para efectos de consulta a través de lenguajes propios que tienen las bases de datos o lenguajes de cuarta generación.
Relación Entre Los Datos Sistema de administración de bases de datos, que almacena información en tablas (filas y columnas de datos) y realiza búsquedas utilizando los datos de columnas especificadas de una tabla para encontrar datos adicionales en otra tabla. En una base de datos relacional, las filas representan registros (conjunto de datos acerca de elementos separados) y las columnas representan campos (atributos particulares de un registro). Al realizar las búsquedas, una base de datos relacional hace coincidir la información de un campo de una tabla con información en el campo correspondiente de otra tabla y con ello produce una tercera tabla que combina los datos solicitados de ambas tablas. Por ejemplo si una tabla contiene los campos NÚM-EMPLEADO, APELLIDO, NOMBRE Y ANTIGÜEDAD y otra tabla contiene los campos DEPARTAMENTO, NÚM-EMPLEADO y SALARIOS, una base de datos relacional hace coincidir el campo NÜM-EMPLEADO de las dos tablas para encontrar información, como por ejemplo los nombres de los empleados que ganan un cierto salario o los departamentos de todos los empleados contratados a partir de un día determinado. En otras palabras, una base de datos relacional utiliza los valores coincidentes de dos tablas para relacionar información de ambas. Por lo general, los productos de base de datos para microcomputadoras o microordenadores son base de datos relaciónales.
Relación Muchos A Uno Ejemplos PROY- GERENTE (los proyectos designan a los gerentes) DEPTO-EMP (los empleados designan a los departamento) EMP-DEPEN (los dependientes designan a los empleados) De estas tres, la última implica un tipo de entidad débil (DEPENDIENTE) y las otras dos implican sólo tipos de entidades regulares. El ejemplo DEPTO-EMP no provoca la introducción de relaciones nuevas. En vez de ello, basta introducir una clave ajena en la relación correspondiente al lado de "muchos" de la interrelación (EMP), que haga referencia a la relación correspondiente al lado "uno" (DEPTO). La interrelación entre un tipo de entidad débil y el tipo de entidad del cual depende es por su puesto una interrelación de muchos a uno.
Relación uno a uno No son muy frecuentes en cualquier caso en prácticas. Estas se manejan exactamente en el mismo modo que las interrelaciones mucho a uno.
Relaciones mucho a mucho Las interrelaciones de muchos a muchos (o de muchos a muchos a muchos, etc) mostradas en el ejemplo siguiente: PROY-TRABAJO (asocia empleados y proyectos) PROV-PARTE (asocia proveedores y partes) PROV_PARTE_PROY (asocia proveedores, partes y proyectos) ESTRUCTURA DE PARTES (asocia a partes a partes) Cada una de estas interrelaciones también corresponde a una relación base. Por tanto, introducimos otras cuatro relaciones base correspondientes a estas cuatro interrelaciones. Como en el caso de las interrelaciones de muchos a muchos, resulta que podemos escoger. Una posibilidad es tomar la combinación de la clave ajena y la "clave" de la entidad del diagrama E/R. O bien, podríamos introducir un atributo nuevo no compuesto que sirva como clave primaria.
Enfoque jerarquizado Una base de datos jerárquica se compone de un conjunto ordenado de árboles, dicho de manera más precisa, un conjunto ordenado formado por múltiples ocurrencias de un solo tipo de árbol.
Árboles Un tipo de árbol consiste en un solo tipo de registro "raíz", junto con un conjunto ordenado de cero o más tipos de subárbol dependientes (de nivel más bajo). Un tipo de subárbol a su vez consiste en un solo tipo de registro la raíz del tipo de subárbol junto con un conjunto ordenado de cero o más tipos de subárbol dependientes, de nivel más bajo, y así sucesivamente. Por tanto, el tipo de árbol completo es un arreglo jerárquico de tipos de registro. Además, claro, los tipos de registro están formados por tipos de campo de la manera acostumbrada. Directorio raíz, en informática, punto de entrada en el árbol de directorios en una estructura jerárquica de directorios. Las ramificaciones de esta raíz son varios directorios y subdirectorios, cada uno de los cuales puede contener uno o más archivos y subdirectorios propios. En la ilustración se muestra una estructura de directorios del sistema operativo MS-DOS. El directorio raíz se identifica con la barra invertida () y constituye el directorio principal del disco duro. Por debajo de la raíz hay un directorio denominado MIS DOCUMENTOS, que contiene dos subdirectorios adicionales, CARTAS e INFORMES.
Árboles Binarios Los árboles de grado 2 tienen una especial importancia. Se le conoce con el nombre de Árboles binarios. Se define un árbol binario como un conjunto finito de elementos (nodos) que bien está vació o está formado por una raíz con dos árboles binarios disjuntos, llamados subárbol izquierdo y derecho de la raíz. En los apartados que siguen se consideran únicamente árboles binarios y, por lo tanto, se utilizará la palabra árbol para referirse a árbol binario. Los árboles de grado superior a 2 reciben el nombre de árboles multicamino.
Árbol binario de búsqueda Los árboles binarios se utilizan frecuentemente para representar conjuntos de datos cuyos elementos se identifican por una clave única. Si el árbol esta organizado de tal manera que la clave de cada nodo es mayor que todas las claves su subárbol izquierdo y menor que todas las claves del subárbol derecho se dice que este árbol es un árbol binario de búsqueda.
Operaciones básicas Una tarea muy común a realizar con un árbol es ejecutar una determinada operación con cada uno de los elementos del árbol. Esta operación se considera entonces como un parámetro de una tarea más general que es la visita de todos los nodos o, como se denomina usualmente, del recorrido del árbol. Si se considera la tarea como un proceso secuencial, entonces los nodos individuales se visitan en un orden especifico, y pueden considerarse como organizados según una estructura lineal. De hecho, se simplifica considerablemente la descripción de muchos algoritmos si puede hablarse del proceso del siguiente elemento en el árbol, según su cierto orden subyacente. Hay dos formas básicas de recorrer un árbol: El recorrido en amplitud y el recorrido en profundidad.
Recorrido En Amplitud Es aquel recorrido que recorre el árbol por niveles, en el último ejemplo sería: 12 – 8,17 – 5,9,15. Recorrido en profundidad Recorre el árbol por subárboles. Hay tres formas: Preorden, orden central y postorden PREORDEN: Raíz, Subárbol izquierdo, subárbol derecho ORDEN CENTRAL: Subárbol izquierdo, raíz, subárbol derecho POSTORDEN: Subárbol izquierdo, subárbol derecho, raíz. Directorio raíz, en informática, punto de entrada en el árbol de directorios en una estructura jerárquica de directorios. Las ramificaciones de esta: raíz son varios directorios y subdirectorios, cada uno de los cuales puede contener uno o más archivos y subdirectorios propios. En la ilustración se muestra una estructura de directorios del sistema operativo MS-DOS. El directorio raíz se identifica con la barra invertida () y constituye el directorio principal del disco duro. Por debajo de la raíz hay un directorio denominado MIS DOCUMENTOS, que contiene dos subdirectorios adicionales, CARTAS e INFORMES. El camino es un elemento más inteligente y posibilita la interconexión de diferentes tipos de redes de ordenadores. Hoja de calculo, programa de aplicación utilizado normalmente en tareas de creación de presupuestos o previsiones, y en otras tareas financieras. En un programa de hoja de calculo, los datos y las formulas necesarios se introducen en formularios tabulares (hojas de cálculos u hojas de trabajo), y se utilizan para analizar, controlar, planificar o evaluar el impacto de los cambios reales o presupuesto sobre una estrategia económica. Los programas de hoja de cálculo usan filas columnas y celdas. Cada celda puede contener texto, datos numéricos o una formula que use valores existentes en otras celdas para hacer un cálculo determinado. Para facilitar los cálculos, estos programas incluyen funciones incorporadas que realizan operaciones estándar. Dependiendo del programa, una sola hoja de cálculo puede contener miles o millones de celdas. Algunos programas de hojas de cálculo permiten también vincular una hoja de cálculos a otra que contenga información relacionada y pueden actualizar de forma automática los datos de las hojas vinculadas. Los programas de hojas de cálculos pueden incluir también utilidades de macros; algunas se pueden utilizar para crear y ordenar bases de datos. Los programas de hoja de cálculo cuentan por lo general con capacidades gráficas para imprimir sus resultados. También proporcionan un buen número de opciones de formato tanto para las páginas y el texto impreso como para los valores numéricos y las leyendas de los gráficos.
Enfoque Relacional Casi todos los productos de base de datos desarrollados años recientes se basan en lo que se conoce como enfoque relacional. La cuestión es que ningún sistema actual maneja el modelo relacional en todos sus aspectos (varios se acercan, pero la mayor parte fallan en algún detalle u otro; en los dominios, o si no en alguna otra cosa) Bases de datos relaciónales, es decir, bases de datos percibidas por el usuario como tablas y solo como tablas. En una computadora existen diferentes formas de almacenar información. Esto da lugar a distintos modelos de organización de la base de datos: jerárquico, red, relacional y orientada a objeto. Los sistema relacionales son importantes porque ofrecen tipos de procesos de datos, como: simplicidad y generalidad, facilidad de uso para el usuario final, períodos cortos de aprendizaje y las consultas de información se especifican de forma sencilla. Las tablas son un medio de representar la información de una forma más compacta y es posible acceder a la información contenida en dos o más tablas. Mas adelante explicaremos que son las tablas. Las bases de datos relacionales están constituidas por una o más tablas que contienen la información ordenada de una forma organizada. Cumplen las siguientes leyes básicas:
- Generalmente, contendrá muchas tablas.
- Una tabla sólo contiene un número fijo de campos.
- El nombre de los campos de una tabla es distinto.
- Cada registro y de la es único.
- El orden de los registros y de los campos no está determinado
- Para cada campo existe un conjunto de valores posible.
Requisitos Que Han De Tener Las Tablas El primer paso para crear una base de datos, es planificar el tipo de información que se quiere almacenar en la misma, teniendo en cuenta dos aspectos: la información disponible y la información que necesitamos. La planificación de la estructura de la base de datos, en particular de las tablas, es vital para la gestión efectiva de la misma. El diseño de la estructura de una tabla consiste en una descripción de cada uno de los campos que componen el registro y los valores o datos que contendrá cada uno de esos campos. Los campos son los distintos tipos de datos que componen la tabla, por ejemplo: nombre, apellido, domicilio. La definición de un campo requiere: el nombre del campo, el tipo de campo, el ancho del campo, etc. Los registros constituyen la información que va contenida en los campos de la tabla, por ejemplo: el nombre del paciente, el apellido del paciente y la dirección de este. Generalmente los diferentes tipos de campos que se pueden almacenar son los siguientes: texto (caracteres), Numérico (números), Fecha / Hora, Lógico (informaciones lógicas si / no, verdadero / falso, etc., imágenes. En resumen, el principal aspecto a tener en cuenta durante el diseño de una tabla es determinar claramente los campos necesarios, definirlos en forma adecuada con una nombre especificado su tipo y su longitud. Terminología Para Describir La Estructura Relacional
- Relaciones: corresponde a lo que hasta ahora hemos llamado en general tabla
- Una tupla: corresponde a una fila de esa tabla y un atributo a una columna. El número de tuplas se denomina cardinalidad y el número de atributos se llama grado.
- Campo: columna es la vista lista que muestra una categoría de información como un número de serie o fecha de compra.
- Registro: toda la información relacionada sobre una persona, lugar o cosa.
- Ada, en informática, el lenguaje de programación basado en procedimientos diseñado bajo la dirección del Departamento de Defensa (DOD) de Estado Unidos a finales de la década de 1970. Ada, llamado así en honor a Augusta Ada Byron, condesa de Lovelace y pionera en el campo de la informática, se desarrolló a partir del Pascal, aunque incluía importantes extensiones semánticas y sintácticas, incluyendo la ejecución simultanea de tareas.
- La clave primaria: es única para las tablas, es decir, una columna o combinación de columnas con la siguiente propiedad. Nunca existen dos filas de la tabla con el mismo valor en esa columna o combinación de columnas.
- Por último, un dominio es una colección de valores, de los cuales uno o más atributos (columnas) obtienen sus valores reales.
Existen fundamentalmente tres alternativas disponibles para diseñar las bases de datos; el modelo jerárquico, el modelo de red y el modelo relacional.
- Modelo Jerárquico: puede representar dos tipos de relaciones entre los datos: relaciones de uno a uno y relaciones de uno a muchos.
- Modelo de Red: este modelo permite la representación de muchos a muchos, de tal forma que cualquier registro dentro de la base de datos puede tener varias ocurrencias superiores a él. El modelo de red evita redundancia en la información, a través de la incorporación de un tipo de registro denominado el conector.
- Modelo Relacional: este modelo se está empleando con más frecuencia en la práctica, debido a las ventajas que ofrece sobre los dos modelos anteriores, entre ellas, el rápido entendimiento por parte de usuarios que no tienen conocimiento profundos sobre sistemas de Bases de Datos.
- Bases de Datos Distribuidas: las bases de datos distribuidas se están utilizando cada vez más en la misma medida en que se usan las arquitecturas de cliente–servidor y groupware. Los principales problemas que se generan por el uso de la tecnología de bases de datos distribuidas son en lo referente a duplicidad de datos y a su integridad al momento de realizar actualizaciones a los mismos. Además, el control de la información puede constituir una desventaja, debido a que se encuentra diseminada en diferentes localidades geográficas.
- Tendencias Futuras: en el futuro la mayoría de las organizaciones cambiarán la forma convencional de manejo de la información a la arquitectura de base de datos a las ventajas derivadas de sus uso. El uso de las bases distribuidas se incrementará de manera considerable en la medida en que la tecnología de comunicación de datos brinde más facilidades para ello.
Objetivo de diseño El uso de bases de datos facilita y soporta e gran medida a los sistemas de información para la toma de decisiones .
Normalización Normalización es un proceso que clasifica relaciones, objetos, formas de relación y demás elementos en grupos, en base a las características que cada uno posee. Si se identifican ciertas reglas, se aplica una categoría; si se definen otras reglas, se aplicará otra categoría. Estamos interesados en particular en la clasificación de las relaciones BDR. La forma de efectuar esto a través de los tipos de dependencias que podemos determinar dentro de la relación. Cuando las reglas de clasificación sean más y más restrictivas, diremos que la relación está en una forma normal más elevada. La relación que está en la forma normal más elevada posible es que mejor se adapta a nuestra necesidades debido a que optimiza las condiciones que son de importancia para nosotros:
- La cantidad de espacio requerido para almacenar los datos es la menor posible;
- La facilidad para actualizar la relación es la mayor posible;
- La explicación de la base de datos es la más sencilla posible,
Dependencia Antes de entrar en el tópico principal de dependencia, vamos a rever algunos conceptos acerca de los individuos y acerca de las tuplas que los describen en la base de datos relacional (BDR). Restringiremos la discusión en la BDR, si bien la misma se aplica igualmente a las otras arquitecturas. Los individuos tienen muchos atributos que pueden ser de interés a diferentes personas en diferentes momentos. Nuestro problema actual es con una sola aplicación o conjunto de aplicaciones: solemne son de interés algunos de los atributos. Los símbolos aplicables a la relación han sido introducidos previamente.
- R es una tupla general o vector que describe a un individuo;
- R es una relación, una matriz o un conjunto dos vectores que pertenecen la población de interés.
- U es el universo consistente en todas las posibles descripciones individuales, obtenido mediante una combinación exhaustiva de los valores a atributos.
La tupla general toma la siguiente forma; R= (a,b,c…,n) La pertenencia con respecto a relaciones, tuplas y universos se indica mediante. Con respecto a los atributos:
- A es el símbolo del nombre de un atributo
- a es el símbolo de un valor del atributo.
Dominio (A) es el dominio para el atributo cuyo nombre es A. La dependencia es una relación funcional que penetra en el universo de posibilidades. La dependencia no puede deducirse de los datos de nuestra, ya que estos son necesariamente incompletos, sino que debe ser inherente al comportamiento del sistema. Por ejemplo, si los datos revelan que cada uno de nuestro proveedores tiene exactamente una planta y que todas estas plantas están en diferentes ciudades, podemos asumir una dependencia total entre proveedor, planta y ciudad. Es decir, dada una ciudad, la misma está asociada con un proveedor; y dado este proveedor estará asociado con una ciudad. En la práctica, solamente cuando un nuevo proveedor se incorpore con una planta en la misma ciudad que uno de nuestro antiguos proveedores, resultará claro que no existe dicha dependencia total, esto no podrá ser deducido a partir a los datos previos.
Primera Forma Normal Para que una relación esté en primera forma normal (1 FN), debe ser solamente una relación propia, una matriz m por n, donde:
- Ninguna celda de la matriz está vacía;
- El valor n cualquier columna está definido por el dominio para dicho atributo.
- Cada tupla tiene una clave que la identifica en forma unívoca, pero dicha clave no significa orden.
Segunda forma normal Una relación está en segunda forma normal (2 fn) solamente si todos los atributos son dependientes en forma completa de la clave.
Descripción de la segunda forma normal ( 2 fn) Su nombre ya nos indica el hecho de que la segunda forma normal es por lo general el próximo paso de normalización y descomposición. Para ser accesible a la normalización, y poder ser puesta en segunda forma normal, la relación debe poseer las siguientes propiedades:
- Debe estar en primera forma normal
- Debe tener una clave compuesta.
Tercera forma normal Una relación se encuentra en tercera forma normal (efn) si no existen transitividades entre sus atributos y si ya se encuentra en 2 fn.
Descripción Una relación r a poner en tercera forma normal debe estar en la segunda forma general. Es muy común que r sea una sub-relación; la relación original estaba en primera forma normal (para ponerla en segunda forma normal fue descompuesta en varias sub-relaciones). Estas son ahora candidatas a una descomposición adicional. Las propiedades de la segunda forma normal (2 fn) son:
- Tenemos una matriz m x n con un valor determinado para cada componente de cada tupla.
- Cada valor es obtenido a partir de un dominio propiamente definimos.
- Cada valor contiene una clave, ya sea simple o compuesta
- Cada componente no clave es dependiente en forma completa de su clave.
Cuarta forma normal La tercera forma normal toma en cuenta la dependencia transitiva y provee una reducción óptima universal, excepto para los casos infrecuentes de dependencia multivaluadas. Ha quedado claro en épocas recientes que es posible una reducción adicional en este caso, y que es lo que se lleva a cabo mediante la cuarta forma normal. Existe una dependencia multivaluada cuando un valor de una variable está siempre asociado con varios valores de otra u otras variables dependientes que son siempre las mismas y están siempre presentes. Esto se ilustra mejor con el ejemplo presentado en la figura. La relación FAB describe tejidos. La variable independiente (con respecto a las dependencias (multivaluadas) es el número de tejido FABNO. Con el se encuentra asociado un modelo (o patrón) y un color. En la figura, el tejido 345 vienen en dos modelos y entre combinaciones de modelo y color. En este caso se aplica el grafo de dependencia. Para hacer más clara que esta es una dependencia multivariable, una cabeza doble de flecha apunta desde FABNO o PATRN y también desde FABNO a COLOR. La ineficiencia en el registro de información y se resulta clara al examinar las dos nuevas relaciones. La primera de éstas, FABPAT lista el número de tejidos contra las combinaciones de color. Dado que la regla es que todas las combinaciones de las variables dependientes multivaluadas deben prevalecer, resulta simple reconstruir la relación FAB a partir de las dos Sub-relaciones que resultaron. Descomposición para poner una relación o sub-relación en la cuarta forma normal debe poder aplicarse lo siguiente:
- Debe estar en la tercera forma normal
- Deben existir una o más multidependencias
6. Ventajas De La Base De Datos
La utilización de bases de datos como plataforma para el desarrollo de sistemas de aplicación en las organizaciones se ha incrementado notablemente en los últimos años, se debe a las ventajas que ofrece su utilización, algunas de las cuales se comentarán a continuación:
- Globalización de la información: permite a los diferentes usuarios considerar la información como un recurso corporativo que carece de dueños específicos.
- Eliminación de información inconsistentes: si existen dos o más archivos con la misma información, los cambios que se hagan a éstos deberán hacerse a todas las copias del archivo de las facturas.
- Permite compartir información
- Permite mantener la integridad en la información: La integridad de la información es una de sus cualidades altamente deseable y tiene por objetivo que sólo se almacena la información correcta.
- Independencia de datos: El concepto de independencia de datos es quizás el que más ha ayudado a la rápida proliferación del desarrollo del Sistema de Bases de Datos. La independencia de datos implica un divorcio entre programas y datos.
Autor:
Venezuela
Página anterior | Volver al principio del trabajo | Página siguiente |