- Administración de datos
- La jerarquía de los datos
- Entidades, atributos y claves de los datos
- El método tradicional en contraste con el método de la base de datos
- Modelado de datos y modelos de bases de datos
- Sistemas de administración de bases de datos (DBMS)
- Creación y modificación de la base de datos
- Almacenaje y recuperación de datos
- Manipulación de datos y creación de informes
- Sistemas de administración de base de datos de amplio uso para usuarios finales
- Selección de un sistema de administración de base de datos
- Desarrollos de las bases de datos
- Almacenes de datos, mercados de datos y minería de datos
- Procesamiento analítico en línea (OLAP)
- Sistemas de administración de base de datos objeto-relacional
Sin los datos y la capacidad para procesarlos, una organización no podría completar con éxito la mayor parte de sus actividades de negocios. Como ya se vio, los datos consisten de hechos son procesar, por ejemplo la cantidad de empleados y cifras de ventas.
Por lo general, los datos se organizan en una jerarquiza que se inicia con la pieza de datos más pequeña que utilizan las computadoras (un bit), y se desplaza a través de esa escala hasta una base de datos. Pro lo comoun un byte consiste de ocho bits.
Cada byte representa un carácter, que es la unidad de construcción de información básica. El carácter puede consistir de letras mayúsculas (A,B,C,…..Z), LETRAS NIMUSCULAS (a,b,c…..z), dígitos numéricos (0,1,2,….9), o símbolos especiales (.!+-/…).
Los caracteres se reúnen para formar un campo. Un campo por lo general es un nombre, un numero o una combinación de caracteres que describen un aspecto de un objeto de negocios. Un grupo de campos relacionados representa un registro.
Al combinar descripciones de varios aspectos de un objeto o actividad, de obtienen una descripción mas completa de estos.
Un conjunto de registros relacionados representan un archivo. Por lo general un archivo de inventarios es la suma de todos los registros de inventarios para una compañía u organización en particular.
ENTIDADES, ATRIBUTOS Y CLAVES DE LOS DATOS
Las entidades, atributos y claves son conceptos importante de la base de datos. Una entidad es una clase generalizada de personas, lugares o cosas (objetos), para los cuales se recopilan, almacenan y mantienen datos.
Un atributo es una característica de una entidad. El valor especifico de un atributo, conocido como elemento de datos , se puede encontrar con los campos de registro que describe una entidad. Como ya se planteo, un conjunto de campos de una objeto especifico representa un registro. Cuna clave es un campo o grupo de campos en un registro que se utiliza para identificar a este.
Un clave primaria es un campo o grupo de campos que identifica en forma única un registro. Ningún otro registro puede tener la misma clave primaria. La clave primaria se utiliza por distinguir registro con el fin de que se pueda tener acceso a ellos, organizarlos y manipularlos. En el caso del registro de una empleado, él numero de este representa un ejemplo de una clave primaria.
La localización de un registro en particular que cumpla con un grupo de criterios específicos quizá requiera del uso de una combinación de claves secundarias.
Por ejemplo, un cliente podría hacer una llamada telefónica a una complicación de clave secundaria.
EL METODO TRADICIONAL EN CONTRASTE CON EL METODO DE LA BASE DE DATOS
El método tradicional. Las organizaciones son sistemas en adaptación, con necesidades de datos e información en constante cambios. Para cualquier negocio en crecimiento o que esta experimentado cambios, la administración de datos se puede convertir en algo bastante complejo. Uno de los modos más básicos para manejar los datos es mediante los archivos.
Puesto que un archivo es un conjunto de registros relacionados, todos aquellos de estos últimos que se relacionan con una aplicación en particular se puede recopilar y administrar juntos en un archivo especifico de aplicaciones.
Uno de los puntos débiles de este método tradicional orientado hacia archivos, en cuanto a la administración de datos, es que gran parte de ellos, por ejemplo el nombre y la dirección del cliente, se duplica en dos o más archivos. Muchos sistemas de base de datos computarizados basados en el método tradicional de archivos, los datos se organizan para un programa de aplicaciones en particular.
El método de la base de datos.
Debido a los problemas que se vinculan con el método tradicional para la administración de datos, muchos gerentes buscaron un medio más eficiente y eficaz para organizar los datos.
El método de la base de datos.
En un método de la base de datos, una variedad de programa de aplicaciones comparten un grupo de datos relacionados. En lugar de tener archivos de datos independientes, cada aplicación utiliza una colección de datos que pueden estar unidos o relacionados en la base de datos. El método de la base de datos ofrece ventajas importantes en contraste con el método tradicional basado en archivos.
El método de la base de datos para la administración de datos incluye una combinación de hardware y software. Debido a las muchas ventajas del método de base de datos la mayor parte de las empresas utilizan bases de datos para almacenar datos referentes a clientes, perdidos, inventarios, empleados y proveedores.
Muchas de la base de datos modernos comprenden toda la empresa y abarcan gran parte de los datos de toda la organización. El desarrollo de base de datos para la empresa requiere un alto nivel de planeación y organización.
MODELADO DE DATOS Y MODELOS DE BASES DE DATOS
Debido a la cantidad de elementos con los que cuentan las empresas actuales, resulta esencial mantener organizados los datos para que se puedan utilizar con mas eficacia. Se debe diseñar la base de datos para que almacene toda los datos relevantes para la empresa y proporción acceso rápido.
MODELO DE DATOS
Entre las consideraciones fundamentales al organizar los datos en una base de datos se incluyen la determinación de los datos que se deben recopilar en la base de datos, de quien tendrá acceso a ella y como podrían desear utilizarlos.
El diseño lógico de una base de datos muestra un modelo abstracto de cómo se deben estructurar y ordenar los datos para cumplir con las necesidades de información de la organización. El diseño lógico de una base de datos incluye la identificación de las relaciones entre las diferentes sesiones de datos y su agrupamiento en una forma ordenada.
Una de las herramientas que usan los diseñadores de las bases de datos para mostrar la relación lógica entre los datos la constituye el método de datos. Un modelo de datos es un mapa o diagrama de entidades y sus relaciones, por lo general, el modelado de datos incluye la comprensión de un problema de negocios especifico y el análisis de los datos y la información necesarias para producir una solución.
Mediante diagramas ER también se pueden revelar relaciones de uno a uno, entre las entidades de datos en una base de datos estén estructuradas en forma lógica para que se puedan desarrollar programas de aplicaciones que satisfagan mejor las necesidades del usuario.
MODELOS DE BASE DE DATOS
En la mayor parte de las bases de datos, la estructura de las relaciones sigue uno de tres modelos lógicos de base de datos. Jerárquico de red y relacional. Estos vínculos muestran la forma en que los usuarios pueden tener acceso a los datos con los programas de aplicaciones. puesto que los diferentes modelos incluyen distintos vínculos entre datos, cada modelo tiene sus ventajas y desventajas únicas.
Modelos jerárquicos (de árbol).
En muchas situaciones , los datos siguen una estructura jerárquica, o en forma de árbol. El un modelo jerárquico de base de datos, los datos se organizan en una estructura descendente, o en forma de una árbol invertido. Consideramos un proyecto característico.
El modelo jerárquico es más conveniente para situaciones en donde las relaciones lógicas entre los datos se pueden presentar en forma apropiada con el enfoque de un padre-muchos hijos.
Si tiene acceso a los datos en forma lógica pasando a través de la "generaciones" apropiadas de padres para llegar al elemento de datos que se buscan, y solo hay una ruta de acceso a cualquier elemento particular de datos.
Modelos de red.
Un modelo de red es una ampliación del modelo jerárquico, sin embargo, en lugar de tener solo varios niveles de relaciones de uno a muchos, el modelo de red es una relación de propietario-miembro en la cual un miembro puede tener muchos propietarios.
En una base de datos estructurada como un modelo de red a menudo se puede tener acceso a un elemento de datos en particular a través de mas de una ruta.
Modelos relacionales.
Los modelos relacionales se han convertido en los modelos de base de datos de mayor demanda y su popularidad aumentara en el futuro. En el modelo relacional, cada fila de una tabla representa una entidad de dedos, mientras que las columnas de la tabla representan los atributos.
Cada atributo solo puede tomar ciertos valores. Los valores permisibles para dichos atributos se denominan el dominio. El dominio para un atributo en particular indica cuales valores se pueden colocar en cada una de las columnas de la tabla relacional.
Depuración de datos.
El propósito de la depuración de datos es buscar y arreglar estas y otras inconsistencias que pudieran ocasionar que aparezcan registros duplicados o incorrectos en la base de datos.
Una comparación de modelos de bases de datos.
Cada uno de los modelos de bases de datos que se han visto aquí se utiliza en diversas organizaciones, y cada uno de ellos tiene puntos fuertes y vulnerables. La principal ventaja del modelo jerárquico es la eficiencia del procesamiento. Su sistema de base de datos jerárquico puede requerir monos tiempo para manipular datos que otros modelos de bases de datos. Pues las relaciones entre los datos son menos complejas
Los modelos jerárquicos también son difíciles de cambiar y las bases de datos quizá presentan dificultades al momento de instalarse. El modelo de base de datos relaciona es con mucho le dé mas demanda. Es más fácil de controlar. Mas fexible e intuitivo que los otros pues organiza los datos en tablas.
El modelo relacional se puede usar también con sistemas de computadoras personales y macrocomputadoras.
SISTEMAS DE ADMINISTRACION DE BASES DE DATOS (DBMS)
La cracon y puesta en practica del correcto sistema de base de datos asegura que esta dará soporte a las actividades y objetivos de la empresa. Con independencia del modelo que respalden, los DBMS comparten algunas funciones comunes, tales secamente los datos en una base de datos, permitir la modificación de la base de datos, manipular datos y elaborar informes.
SUMINISTRO DE UNA VISTA DE DATOS PARA EL USUARIO
Puesto que el BDMS tiene la responsabilidad del acceso a una base de datos, uno de los primeros pasos para instalar y usar una base de datos incluye informarle a aquel la estructura lógica y física de los datos y de las relaciones entre estos en la base de datos.
El DBMS puede hacer referencia a un esquema para encontrar donde tener acceso a los datos solicitados con relacion a otra pieza de datos. El DBMS actúa también como una interfaz de usuario al proporcionar una vista de la base de datos.
Puede desarrollarse subesquema, que después de acceso al esquema por que a los programadores, gerentes y otros usuarios a menudo solo se les permite ver ciertas partes de la base de datos.
CREACION Y MODIFICACION DE LA BASE DE DATOS
Los esquemas y subesquemas se introducen al DBMS mediante un lenguaje de definición de datos.
En general, un DDL describe las rutas de acceso lógicas y los registros lógicos de la base de datos.
Otros pasos importantes en la creación de una base de datos es el establecimiento de un diccionario de datos, una descripción detallada de todos los datos utilizados en la base de datos.
Proporcionar una definición estándar de términos y elementos de datos.
Esto puede ayudar en el proceso de programación al proporcionar términos y variables consistentes para utilizar en todos los programas.
Ayudar a los programadores a diseñar y escribir programas.
Los programadores no necesitan conocer cuales dispositivos de almacenamiento se usan para almacenar los datos necesarios, aun mas importantes los programadores pueden usar el diccionario de datos para ver cuales programas usan ya una parte de los datos y si resulta conveniente.
Simplificar la modificación de la base de datos.
Si por alguna razón se necesita cambiar o eliminar un elemento de datos, el diccionario de datos señalaría los programas específicos que utilizan el elemento de datos que quizá sea necesario modificar.
Menor reducción de datos.
Al proporcional definiciones estándar de todos los datos, es menos probables que el mismo elemento de datos se almacene en diferentes lugares.
ALMACENAJE Y RECUPERACION DE DATOS
Como se acaba de describir, ser una interfaz entre un programa de aplicaciones y la base de datos es una de las funciones de DBMS. Este proceso sera el mismo si un gerente quiere obtener informacion de la base de datos. Primerio, el gerente solicita los datos al DBMS. Cuando dos o mas personas o programas intentan tener acceso al mismo registro, en la misma base de datos, al mismo tiempo, puede prosentarse un problema. Al mismo tiempo un programa de compras podria intentar incrementar en veite unidaddes el nivel de existencias del mismo producto por que se acaba de recibir. La necesidad de los usuarios de estar en osibilidad de lograr acceso y/o actualizar las bases de datos mediante internet va en aumento.
Esas bases de datos le permiten a las compañias crear un catalogo accesible en internet, lo que no es otra cosa mas que una base de datos de elementos, descipciones y precios.
MANIPULACION DE DATOS Y CREACION DE INFORMES
Una vez que se instala el DBMS, los empleados de todos los niveles pueden usar el sistema mediante comandos especificos en varios lenguajes de programacion.
Este lenguaje especifico, que se proporciona con el DBMS, les permite a los gerentes y a otros usuarios de la base de datos tener acceso, modificar y hacer consultas referentes a datos contendidos en la base de datos para crear informes.
Los informes de excepcion, progeramados y demanda, que se estudiaron por primera vez ponen en relieve los hechos que requieren atencion urgente de la administracion. Los programas de base de datos pueden producir literalmente cientos de documentos e informes.
SISTEMAS DE ADMINISTRACION DE BASE DE DATOS DE AMPLIO USO PARA USUARIOS FINALES
La mas reciente generacion de sistemas de administracion de base de datos les permite a los usuarios finales crear sus propias aplicaciones de bases de datos. Los usuarios finales ahora usan estas herramientas para enfrentarse a los problemas contidianos, tales como el modo de administrar una creciente informacion referente a empleados, clientes, inventarios, o ventas y cuestiones de entretenimiento como son las listas de videos. Estos sistemas de administracion de base de datos son una importante herramienta de productividad personal junto con el software para el procesamiento de texto, la hoja de calculo y las graficas. Un factor importante que facilita el uso de los DBMS por algunas bases de datos es la incorporacion de asistentes, los cuales ofrecen guias para crear bases de datos personalizadas, modificar aplicaciones listas para ejecutarse, usar las plantas aplicaciones tambien incluyen caracteristicas nuevas de gran capacidad, por ejemplo los sistemas de ayuda y las capacidades de publicacion en la web.
SELECCIÓN DE UN SISTEMA DE ADMINISTRACION DE BASE DE DATOS
La selección de mejor sistemas de administracion de datos se inicia con el analisis de las necesidades y caracteristicas de la base de datos. Las necesidades y caracteristicas de la base de datos. Las necesidades de informacion de la organización influyen en el tipo de datos que se recopilan y en el tipo de sistemas de administracion de base de datos que se usa.
Tamaño de la base de datos.
Las imensiones de la base de datos dependen del numero de registros o archivos que hayen en ella. El tamaño determina las necesidades generales de almacenamiento para la base de datos.
Cantidad de usuarios concurrentes.
La cantidad de usuarios simultaneos que pueden tener acceso a los contenidos de la base de datos tambien es un factor importante. En ocasiones se emplea el termino escalibilidad para describir que tan bien se desempeña una base de datos a medida que se aumenta el tamaño de esa y el numero de usuarios concurrentes.
Desempeño.
La rapidez con que la base de datos puede actualizar registros quiza sea el criterio de desempeño mas importante para algunas organizaciones.
Entre otas consideraciones de desempeño se incluyen la cantidad de usuarios concurrentes a los que se les puede dar soporte y cuanta memoria principal se requiere para ejecutar el programa de administracion de base de datos.
Integracion.
Un aspecto fundamental de cualquier sistema de administarcion de base de datos es su capacidad para integrarse con otras aplicacioes y bases de datos.
Una compañía industrial con cuatro plantas en tres sitios lejanos diferntes pude tener una base de datos independiente en cada localidad.
Caracteristicas.
Las caracteristicas del sistema de administracion de bases de datos tambien puede representar una gran diferencia. La mayor parte de los programas de base de datos cuaentan con procedimientos de seguridad, proteccion de la confidencialidad y deversas herramientas.
El proveedor.
La importancia, reputacion y estabilidad financiera de proveedor tambien deben tenerse en cuenta al tomar cualquier deciison para abrir la base de datos.
Costo.
Los paquetes de base de datos para computadoras personales pueden constar unos pocos cientos de dolares, mientras que los grandes sistemas de bases de datos para macrocoputadoras pueden tener un costo de cientos de miles de dolares.
Algunas compañias especializadas alquilan o arriendan se sofware de bases de datos.
DESARROLLOS DE LAS BASES DE DATOS
Los tipos de datos e informacion que necesitan los administradores se modifican conforme cambian los procesos de las empresas.
BASES DE DATOS DISTRIBUIDAS
Un procesamiento distribuido incluye colocar uniddes de procesamiento en diferentes ubicacioens y vincularlas a traves de equipos de telecomunicaciones.
La organizaciones encuentran a menudo que las bases de datos distibuidad proporcionan algunas de la misma ventajas del procesamiento distribuido.
A pesar de sus ventajas, el procesamiento distribuido plantea retos adicionales para mantener la seguridad exactidud oportunidad y cumplimiento de los estandares de los datos. Las bases de datos distribuidas permiten a mas usuarios tener acfceso directo en distintas ubicacioens.
Otro reto que plantean las bases de datos distrribuidad incluye la integracion de las diversas bases de datos.
ALMACENES DE DATOS, MERCADOS DE DATOS Y MINERIA DE DATOS
Los datos sin procesar necesarios para tomar decisiones de negocios bien fundamentadas se almacenan en diversas ubicaciones y formatos. Durante decadas, las organizaciones han recopilado datos de operaciones, de ventas y financieros mediante sus sistema de procesamiento de transacciones el linea.
Ademas los datos almacenados en sistemas OLTP son inconsistentes y estan en constante cambio. Las base de datos contiene las transacciones actuales necesarias para operar la empresa, incluyendo errores, entradas duplicadas y transacciones invertidas, que obstaculizan el trabajo de un analista de empresas que requiere datos estables. Asi, aunque los datos recopilados quienes toman las decisiones en las empresas. Estos son datos abundantes pero con escasa informacion.
Almacenes de datos. El concepto de almacen de datos es la evolucion actual de los sistemas de apoyo a las decisiones. Un almace de datos es un sistema de administracion de base de datos relacional creado especificamente para dar apoyo en las toma de decisiones administrativas, no para satisfacer las necesidades de los sistemas de procesamiento de transacciones.
Un almacen guarda datos historicos que se extrajeron de sistemas operacionales y de fuentes de datos externas. Los almacenes de datos por lo general se inician como bases de datos muy grandes que contienen millone, e incluso cientos de millones, de registros de datos. La informacion antigua que ya no se necesita se elimina del almacen de datos.
Las herramientas para depurar de datos pueden reunir datos de muchas fuentes en una base de datos, automatizar la recopilacion y verificacion de datos, eliminar los datos no deeacos y mantener los datos en un sistema de administracion de base de datos.
Mercado de datos. Un mercado de datos es un subconjunto de un almacen de datos. Traen consigo el concepto de almacen de datos. Los mercados de datos tienen mayor utilidad para grupos mas pequeños que desen acceder a datos detallados. Se usa un almacen para resumenes de datos que puedan ser usados para el resto de la compañía. Aunque se puede usar cualquier software de base de datos para establecer un almacen de datos, algunos proveedores proporcionan software de base de datos para establecer un almacen de datos.
Mineria de datos.
Otra nueva herramienta de analisis de informacion es la mimeria de datos. La mineria de datos es el descubrimiento automatizado de patrones y relaciones en un almacen de datos. Reppresenta ademas el paso siguiente de la evolucion de sistemas de apoyo a las decisiones. Existen miles de aplicaciones para la mineria de datos. Los emisores de tarjetas de creditos y los aseguradores exploran sus almacenes de datos en busca de patrones sutiles dentro de miles de transacciones de clientes para identificar el fraude, a menudo justo al momento en que ocurre. Los proveedore tradicionales de DBMS estan conscientes del gran potencial de la mineria de datos.
PROCESAMIENTO ANALITICO EN LINEA (OLAP)
En la actualidad. La mayor parte de las encuestas de la industria muestra que la mayoria de los usuarios de almacenes de datos se apoyan en hojas de calculo, herramientas para elaboracion de informes y analisis, o en sus propias aplicaciones personalizadas para recuperar datos de los almacenes y formatearlos a informes y graficas para la empresa. Durante casi dos decadas, las bades de datos multidimensionales y sus sistemas de exposicion de informacion analitica han proporcionado presentaciones de ventas y demostraciones atractivas en las ferias comerciales. Los servidores y las herramientas de escritorio de OLAP den soporte al analisis de alta velocidad de datos con relaciones complejas, tales como combinacioens de los productos de una compañía. Regtiones , canales de distribucion, unidades de presentacion de informes y periodos de tiempo. El OLAP, o analisi multidimensinal, requiere de gran cantidad de ingenio humano e interaccion con la base de datos para encontrar informacion en ella.
El software de OLAP le informa a los usuarios respecto a lo que ocurrio en sus negocios. La mineris de datos es direrente. Esta les de el porque . como usuario de una herramienta de mineria de datos no es necesario que se piense en que preguntas hacer.
Despues se puede aplcar este perfil a los datos de todas las transacciones que lleguen para identificar y detener el coportamiento fraudulento, que de lo contario pasaria inadvertido.
CONECTIVIDAD ABIERTA DE LA BASE DE DATOS (ODBC)
Los estandares de la ODBC ayudan a asegurar que el software escrito para cumplir con estos estandares se pueda utilizar con cualquier base de datos que cumpla con la ODBC. Esto hace mas facil transferir y tener aceso a datos entre base de datos diferentes.
La vinculacion le permite a una aplicación usar datos o un objeto almacenado en otr aplicación sin en realidad importar los datos o el objeto a ella.
Las aplicaciones que siguen el estandar de ODBC pueden usar estas caracteristicas de gran capacidad para copartir datos entre diferentes aplicaciones almacendnadas en distintos formatos. Los productos que cumplen con la ODBC sufren de su naturaleza de propositos multiples. Su desempeño general por lo comun es menos eficiente que el de los productos creados para utilizarse con una base de datos especifica. Las normas de la ODBC tamien hacen mas facil para las compañias en crecimiento integrar las bases de datos existentes, conectar mas usuarios a la misma base de datos, y mover programas de aplicaciones desde bases de datos orientadas a computadoras personales a bases de datos basadas en estaciones de trabajo mayores y viceversa.
SISTEMAS DE ADMINISTRACION DE BASE DE DATOS OBJETO-RELACIONAL
En la actualidad muchos de los programas de aplicacioens mas reciente requieren de la capacidad para manipular datos de audio, video y graficos. Un sistema de administacion de bases de datos convencionales no estan bien preparados para esto, pues tales datos no pueden almacenarse con facilidad en filas o tablas.
En tal base de datos, estos tipos de datos se almacenan como objetos, que contienen tanto los datos como las instucciones de procesamiento necesarias para completar la transaccion de la base de datos. Cada uno de los proveedores que ofrecen medios de ORDBMS proporcionan un grupo de interfaces de programacion de aplicaciones que permiten a los usuarios añadir definiciones y metodo de datos externos relacionados con aquellas definiciones en el sistema de base de datos.
Una cantidad cada vez mayor de datos que usan las organizaciones tienen la forma de inagenes, que se pueden almacenar en base de datos objeto-relaciones.
Los datos de imágenes tienen algunas desvbentajas, una de las cuales es el requerimiento de mayores requisitos de almacenamiento secundario. En la actualidad se desarrollan otra formas de crear indices y de referencias cruzadas de los datos.
Hipertexto. La base de datos objeto-relaciona proporciona mayuor flexibilidad para definir las relaciones entere datos. Se pueden crear las relaciones entre los datos de acuerdo con las especificaciones del usuario, en lugar de seguir uno de los modelos de base de datos mas estructurados.
Hipermedia. Hipermedia es una ampliacion de hipertaxto. Dichas notas podrian incluir material escrito acera de nuevos mercados, imágenes de productos y de folletos de publicidad, y anuncios comerciales. Comn el metodo de base de datos de hipermedia, chuchos de los tipos de datos se pueden organizar en red de nodos conectados.
Margarita González