- Introducción
- Redes de almacenamiento
- Sistemas de almacenamiento inteligente
- Red de almacenamiento de área local (SAN)
- Network Attached Storage (NAS)
- Conclusión
- Bibliografía
Introducción
La información crece en importancia diariamente en el diario vivir. Irremediablemente nos hemos convertido dependientes de la información en lo que va corrido del siglo 21, en un mundo sobre demanda, en el sentido de que necesitamos la información donde y cuando sea requerido. Accesamos Internet diariamente en el desarrollo de búsquedas, participamos en redes sociales, enviamos y recibimos correos electrónicos, compartimos fotos, videos y otro sinnúmero de aplicaciones.
Equipados con un número creciente de dispositivos generadores de contenido, más y más información es creada por individuos y por diferentes negocios y, dicha información creada individualmente gana valor cuando se es compartida con otros. Cuando la información es creada, reside localmente en PCs, laptops, dispositivos móviles como, Smart phones, cell phones, tablets y cámaras y, para compartir esta información debes ser cargada vía redes a centros de datos.
La importancia, dependencia y volumen de información para el mundo de los negocios también continúa creciendo a pasos agigantados, los negocios dependen de lo rápido y confiable que puedan accesar los datos críticos para el negocio como por ej., sistemas de facturación de las empresas de las [1]Telcos, [2]e-commerce, [3]ATMs, diseño de productos, administración de inventarios, portales Web, tarjetas de crédito y mercados capitales en general. Esta creciente dependencia creciente de la información sobre los negocios ha multiplicado los retos en cuanto a almacenar, proteger y administrar los datos, es por esto que las redes de almacenamiento han cobrado inmenso valor durante la evolución de las tecnologías y desarrollo de nuevos negocios en la actualidad.
Redes de almacenamiento
Que es La Data
La [4]Data es una colección de datos en bruto de los cual se podrían extraer conclusiones. Cartas escritas a mano, un libro impreso, una fotografía de la familia, una película en cinta de video, impresos y copias debidamente firmadas, libros de contabilidad de un banco, y libretas de un titular de la cuenta son todos los ejemplos que contienen datos.
Con los avances de los computadores y tecnologías de la comunicación, la rata de crecimiento de la creación de datos ha incrementado exponencialmente. Los siguientes son algunos de los factores que han provocado el crecimiento exponencial de los datos digitales:
Incremento en la capacidad de procesamiento de datos
Bajo costo de almacenamiento digita
Tecnologías de comunicación más rápidas y accequibles
Proliferación de aplicaciones y dispositivos inteligentes
Tipos de Datos
Figura 1 -; Tipos de Datos
Los datos puede clasificarse en Datos Estructurados y Datos no Estructurados dependiendo de cómo es almacenada y administrada. Los datos estructurados son organizados en filas y columnas en un formato rígidamente definido de tal manera que las aplicaciones puedan accesarla y procesarla eficientemente.
Los datos son no estructurados si sus elementos no pueden ser almacenados en fila y columnas y por consiguiente, es difícil su búsqueda y acceso por parte de aplicaciones.
Como vemos en al gráfico anterior, 90% de los datos de las empresas son no estructurados.
Big Data
Big Data se refiere a grupos de datos que por su tamaño y por estar más allá de las capacidades de herramientas de software para capturar, almacenar, administrar y procesar, dentro de los límites aceptables.
Incluye datos estructurados y no estructurados, generados por diferentes fuentes, cuyo análisis requiere de nuevas técnicas y herramientas que provean:
Alto desempeño
Plataformas de procesamiento paralelo masivo [5]MPP)
Herramientas de Análisis Avanzado
Las herramientas de análisis avanzado proveen la oportunidad de toma de decisiones sobre la forma de almacenar, accesar y administrar grandes volúmenes de datos que con herramientas tradicionales no podrían realizar.
Que es Información
La información es la inteligencia y conocimiento derivado de los datos. Los datos, bien sean estructurados o no, no reflejan ningún propósito a menos de que sean presentados de una manera que les dé sentido. Los negocios analizan fuentes de datos para identificar tendencias. Con base en estas tendencias, una compañía puede planear o modificar sus estrategias de negocio.
Almacenamiento
Los datos creados por personas o empresas deben ser almacenados con el propósito de ser fácilmente accesados para más tarde ser procesados. In un ambiente computacional, los dispositivos diseñados para almacenar datos son denominados "Dispositivos de Almacenamiento" o simplemente almacenamiento. El tipo de almacenamiento utilizado varía dependiendo del tipo de datos y la frecuencia con la cual es creada y usada. Ejemplos de dispositivos de almacenamiento son:
DVDsCD-ROMsTarjetas de memoria en cámaras digitalesTarjetas de memoria en Teléfonos CelularesDiscos durosArreglos de DiscosCintasLas empresas cuentan con varias opciones para el almacenamiento de datos, incluyendo discos duros internos, arreglos de discos externos y cintas.
Evolución de la Arquitectura de Almacenamiento
Históricamente, las compañías habían centralizado los computadores y los dispositivos para almacenamiento de información en su centro de datos. La evolución de los sistemas abiertos, su accequibilidad y facilidad de implementación hicieron posible a las organizaciones tener sus propios servidores y sistema de almacenamiento.
Figura 2 -; Server-Centric to Information-Centric
En los inicios de estas implementaciones de sistema s abiertos, el almacenamiento era típicamente interno al servidor y no podía ser compartido con ningún otro servidor; esta arquitectura es llamada [6]Server Centric Storage". En esta arquitectura los servidores son islas de cómputo y almacenamiento teniendo límites muy cortos en cuanto a capacidad de almacenamiento, haciendo indisponible la información a otros servidores/sistemas.
Para superar esto, la arquitectura de almacenamiento evolucionó de Server Centric a [7]Information Centric Storage", en donde los dispositivos de almacenamiento son administrados centralmente e independiente de los servidores.
Centro de Datos
Un Centro de Datos es un sitio que contiene almacenamiento, cómputo, redes y otros recursos de TI para proveer capacidades de procesamiento de datos centralizado.
Los elementos centrales de un centro de datos son:
Aplicaciones
Sistemas de Administración de Bases de Datos (DBMS)
Servidores
Redes
Almacenamiento
Estos elementos centrales trabajan en conjunto para direccionar todos los requerimientos de procesamiento de datos.
Características Clave de un Centro de Datos
Las operaciones ininterrumpidas de un centro de datos son críticas para la supervivencia y éxito de un negocio. Mientras las características mostradas en la siguiente figura son aplicables para todos los elementos de infraestructura del centro de datos, me centraré en lo concerniente a sistemas de almacenamiento.
Figura 3 – Características de un Centro de Datos
Disponibilidad
Disponibilidad de los datos con sistemas de almacenamiento con arreglos de disco que proporcionen redundancia.
Seguridad
Políticas, procesos e integración correcta de los elementos centrales del centro de datos.
Escalabilidad
Los elementos del centro de datos deberán ser escalables de acuerdo a los requerimientos del negocio sin interrumpir la operación. De acuerdo a como el negocio crece, crece en servidores, aplicaciones, bases de datos, etc., por esta razón el sistema de almacenamiento debe estar en la capacidad de crecer con el negocio con una alta disponibilidad.
Desempeño
Todos los elementos del centro de datos deben proveer un desempeño óptimo basado en los requerimientos de niveles de servicios.
Integridad de los Datos
La integridad de los datos hacen referencia a los mecanismos, como códigos de corrección de errores o bits de paridad que garanticen que los datos son escritos al disco exactamente de la forma como fueron recibidos.
Capacidad
El centro de datos requiere de recursos de almacenamiento para almacenar y procesar grandes cantidades de datos eficientemente. Cuando los requerimientos de capacidad se crecen, el centro de datos debe estar en capacidad de proveer capacidad adicional sin interrumpir la disponibilidad de los datos o con mínima disrupción.
Administrabilidad
Un centro de datos debe proveer una administración fácil e integrada de sus elementos. La administración debe ser lograda a través de la automatización y reducción de intervención manual en tareas comunes.
Sistemas de almacenamiento inteligente
Las aplicaciones críticas del negocio requieren altos niveles de desempeño, disponibilidad, seguridad y escalabilidad. Un disco es un elemento central que gobierna el desempeño de cualquier sistema de almacenamiento. Algunas tecnologías de sistemas de almacenamiento antiguos no estaban en la capacidad de superar las restricciones de desempeño debido a las limitaciones del disco y sus componentes mecánicos. La tecnología RAID hizo una importante contribución en mejorar el desempeño del almacenamiento y confiabilidad, pero los discos, aún con implementaciones de RAID no pudieron cumplir con los requerimientos de plas aplicaciones actuales.
Con los avances tecnológicos, una nueva generación de soluciones de almacenamiento conocidas como sistemas de almacenamiento inteligentes ha evolucionado. Estos sistemas de almacenamiento inteligentes son arreglos ricos en características de RAID que proveen capacidades de procesamiento de I/O altamente optimizadas. Estos arreglos de Almacenamiento están equipados con capacidades grandes de memoria cache y múltiples caminos de I/O usando algoritmos sofisticados para cumplir con los requerimientos de aplicaciones sensibles a desempeño.
Estos arreglos de almacenamiento tienen un ambiente de operación que inteligente y óptimamente manejan la administración, asignación y utilización de los recursos. El soporte de [8]flash drives y otras tecnologías de punta, como aprovisionamiento virtual, y [9]Tiering dinámico, han agregado una nueva dimensión al desempeño, escalabilidad y disponibilidad del sistema de almacenamiento.
En la siguiente figura se muestras los componentes principales de un sistema de almacenamiento inteligente.
Figura 4 -; Sistema de Almacenamiento Inteligente
Front End: Conexión hacia los Hosts -; Servidores
Memoria Cache: Componente que mejora ostensiblemente el desempeño en escrituras y lecturas
Back End: Sistema de interconexión interna desde memoria cache hacia los discos físicos.
Discos Físicos: Conectados directamente al back-end del controlador de almacenamiento y proveen almacenamiento de datos persistente.
Red de almacenamiento de área local (SAN)
Las organizaciones experimentan actualmente un crecimiento explosivo de la información. Esta información. Esta información necesita ser almacenada, protegida, optimizada en acceso y administrada eficientemente, por lo tanto, una solución de administración efectiva tiene que proveer lo siguiente. Es de anotar que algunos términos presentados a continuación no son traducidos al español por perder su sentido tecnológico:
Just-in-time to Business users: Información tiene que estar disponible al usuario cuando la necesite con 7 x 24 de disponibilidad de los datos.
Flexible and resillient storage infrastructure: La infraestructura tiene que proveer flexibilidad y resiliencia.
Direct-Attached-Storage (DAS) es un tipo de almacenamiento en el cual el servidor o host es su dueño por tanto es difícil su administración y el compartir recursos en este dispositivo de almacenamiento. Los esfuerzos en organizar estos datos dispersos llevaron a la que emergiera el [10]Storage Area Network (SAN) que en adelante llamaremos SAN.
Que es una SAN?
Una SAN es una red dedicada de alta velocidad y desempeño de servidores y dispositivos de almacenamiento compartidos.
Entre las características de una SAN tenemos:
Centraliza la administración de almacenamiento.
Habilita compartir recursos de almacenamiento a través de múltiples servidores
Cumple con las crecientes demandas eficientemente con una mejor economía a escala
Implementaciones comunes de SAN son:
Fibre Channel (FC) SAN: Utiliza protocolo FC
IP SAN: utiliza protocolos basados en IP
Figura 5 -; Fibre Channel SAN
Transmisión de datos a alta velocidad es una característica importante en una red FC. En comparación con tecnología Ultra- SCSI que es comúnmente usada en servidores ambiente DAS, FC es un paso gigante en tecnologías de almacenamiento en red. Las últimas implementaciones FC de 16GB, ofrecen una tasa de transferencia de 3200MB/s, cuando Ultra640-SCSI está disponible con una tasa de transferencia de apenas 640MB/s. La tecnología FC es mucho más escalable y, teóricamente una sola red FC puede acomodar aproximadamente 15 millones de dispositivos.
Nota: FibRE se refiere al procolo, mientras fibER se refiere al medio de conexión.
Componentes de Una SAN
Una SAN es una red de servidores y almacenamiento compartido. Los servidores y almacenamiento son los [11]end-points o dispositivos llamados "nodos". Una SAN FC consiste de:
Nodos (Servidores y almacenamiento)
Cables -; Patch Cords FC
Conectores
Dispositivos de interconexión como lo son FC switches o SAN switches
Software de administración para SAN
Topologías de Conexión
La arquitectura FC soporta tres tipos básicos de interconectividad:
Point to Point: Dos dispositivos son conectados directamente entre sí.
Figura 6 -; Point-to-Point
Fibre Channel Arbitrated Loop (FC-AL): Los dispositivos están conectados a un loop. Solo un dispositivo puede realizar una operación a la vez. Si se presenta un daño en alguno de los dispositivos se genera una reasignación de direcciones generando disrupción. Topología utilizada en implementaciones antiguas o en dispositivos que solo soportan ese tipo de conexión.
Figura 7 -; FC-AL
Fibre Channel Switched Fabric (FC-SW): Conforma un fabric sobre el cual todos los dispositivos son interconectados entre si. Habilita la interconexión de switches (ISLs) para ampliar cobretura de dispositivos y ampliar la red SAN. Tambien habilita osibilidades de conexión metropolitana o MAN (Metropolitan Area Network).
Figura 8 -; FC-SW
Network Attached Storage (NAS)
Compartir archivos permite a los usuarios compartir archivos con otros usuarios quienes pueden tener un interés común en el contenido. In un ambiente archivos compartidos, un usuario que crea un archivo determina el tipo de acceso que se le da a los otros usuarios como lectura, escritura, ejecución, borrado, etc., y control los cambios al archivo. Cuando muchos usuario pretenden accesar el mismo archivo, un esquema de protección es requerido para mantener la integridad de los datos y, al mismo tiempo, hacer posible ser compartido.
Protocolos standard cliente-servidor para compartir, tales como NFS o CIFS (SMB), habilitan al dueño del archivo configurar el tipo de acceso requerido, como solo-lectura o, lectura y escritura, a un usuario en particular o grupo de usuarios. Usando estos protocolos, los clientes montan [12]file-system remotos los cuales están dedicados en [13]file-servers.
En un modelo de compartir archivos peer-to peer (P2P), se utiliza el tipo de red peer-to-peer. P2P permite a las máquinas cliente compartir archivos directamente sobre la red.
Figura 9 -; Evolución de Compartición de Archivos
Que es una NAS?
NAS ó [14]Network Attached Storage, es un dispositivos de almacenamiento dedicado a la compartición de archivos. NAS habilita a los usuarios a compartir archivos mediante una red IP. Provee las ventajas de consolidación de servidores, mediante la eliminación de múltiples file-servers. Adicionalmente consolida almacenamiento utilizado por clientes comunes en un punto único.
NAS utiliza protocolos de red y de File-Sharing para proveer acceso a los datos, incluido TCP/IP para transferencia de datos, Comon Internet File System (CIFS) y Network File System (NFS) para servicios de red de archivos.
NAS habilita a sistemas operativos como UNIX, LINUX, MAC OS, Windows, VMWare a compartid los mismos datos sin importar el [15]O.S.
Los sistema basados en NAS, utilizan su propio sistema operativo, así como hardware y software para cumplir con los requerimientos de [16]file-sharing.
Figura 10 -; Servidores de propósito general vs. NAS
Un dispositivo NAS está optimizado para funciones de servicios de archivos, como acceso, recuperación y almacenamiento para aplicaciones y clientes.
BENEFICIOS DE UNA NAS
NAS ofrece los siguientes beneficios:
Eficiencia Mejorada
NAS despacha mejor desempeño comparado a un servidor de archivos de propósito general, ya que NAS está optimizada para esa función.
Flexibilidad Mejorada
Compatible con múltiples sistemas operativos que pueden accesar simultáneamente la misma data.
Almacenamiento Centralizado
Centraliza el almacenamiento de datos minimizando la duplicidad de los datos.
Administración Simplificada
Provee una consola central para administración eficiente de su propio file system y funcionalidades adicionales.
Escalabilidad
Escala bien, de acuerdo con diferentes perfiles de utilización y diferentes tipos de aplicaciones, debido a su gran desempeño y baja latencia.
Alta disponibilidad
Ofrece opciones de replicación y recuperación, habilitando alta disponibilidad de los datos.
Seguridad Integrada
Asegura la seguridad, autenticación de usuarios, aseguramiento de archivos en conjunto con esquemas de seguridad estándar de la industria.
COMPONENTES DE UNA NAS
Figura 11 -; Componentes de una NAS
Una NAS tiene dos componentes centrales -; Cabezal NAS y Almacenamiento. En algunas implementaciones el almacenamiento puede ser externo y compartido con otros hosts -; servidores.
El cabezal NAS incluye los siguientes componentes:
CPU y Memoria
Una o más [17]NICs los cuales proveen conexión a los clientes
Un sistema operativo optimizados para funcionalidades NAS
Protocolos de compartición de archivos como [18]NSF y CIFS [19]SMB)
Protocolos estándar de la industria para conectividad de back-end hacia los recursos de almacenamiento como: ATA, SATA, SCSI o FC
El ambiente NAS incluye clientes accesando un dispositivo NAS sobre una red IP utilizando protocolos para file-sharing.
Conclusión
Las Redes de Almacenamiento fueron la mejor solución a los problemas que generaban el tener islas de procesamiento que incluían su propio almacenamiento. Esto genera independencia negativa frente a la administración de datos y más en una infraestructura de centro de datos en donde la prestación de servicios objeto del negocio depende de la disponibilidad, confiabilidad y seguridad.
Las redes de almacenamiento junto con los sistemas de almacenamiento proveen un servicio con las características, requerimientos y funcionalidades necesarias para optimizar la continuidad del negocio.
Tecnologías con FC-SW, NFS, CIFS (SMB) ofrecen los beneficios necesarios alineados con el tipo de datos que se pretenda administrar. Para una organización puede ser factible el uso de SAN para los sistemas centrales con requerimientos de desempeño y confiabilidad y disponibilidad extremos. Al mismo tiempo, la organización puede verse en la necesidad de implementar un sistema de compartición de archivos como bodega de datos o manejo de Big Data, para lo cual sería beneficioso implementar un sistema NAS.
La tecnologías de almacenamiento siguen su crecimiento exponencial, ya que día a día crecen los requerimiento respecto a compatibilidad, flexibilidad, disponibilidad, desempeño y eficiencia; requerimientos que se convierten en los más interesantes retos para los fabricantes de almacenamiento como lo son EMC², Hitachi, IBM, NetApp, entre otros..
Bibliografía
Storage Networking y el almacenamiento sobre internet: iSCSI, Francisco Matas Albaladejo Documento consultado Diciembre de 2013 http://www.uv.es/~montanan/redes/trabajos/ISCSI.PDF
Almacenamiento distribuido basado en red (III): Almacenamiento SAN por red TCP/IP
http://cuchillac.net/archivos/pre_ipv6/3_san-nas/lects/lect1_almacenamiento_SAN.pdf
Simulación concurrente de redes de almacenamiento de altas prestaciones (SAN, Storage Area Networks)1 À. Perles, X. Molero, A. Martí, V. Santonja, J.J. Serrano
http://www.disca.upv.es/aperles/investigacio/seid2000.pdf
Storage Information Systems & Management V2 EMC² Information Systems -; Education Services 2012
Autor:
Angel Alberto Echeverry Castano
NOMBRE DEL CURSO: STORAGE NETWORKS
FECHA: Octubre 10 de 2014LUGAR: Bogotá D.C., Colombia
ATLANTIC INTERNATIONAL UNIVERSITY
[1] Telcos: empresas de telecomunicaciones
[2] e-commenrce: comercio electrónico
[3] ATM: siglas de atomatic Tellr Machine – Cajero Automático
[4] Data: término inglés usado para referirse a los datos
[5] MPP – siglas en inglés de Masive Parallel Processing.
[6] Server Centric Storage: Almacenamiento centrado en Servidores
[7] Information Centric Storage: Almacenamiento centrado en la Información
[8] Flash Drives: discos duros de etado sólido con velocidades de lectura – escritura bastante altas
[9] Tiering: almacenamiento por capas donde cada capa es un categoría
[10] Disco Físico: disco duro o de estado sólido implementado en el arreglo de disco.
[11] Direct attached Storage: Almacenamiento conectado directamente a servidores o hosts
[12] Storage área Network: Red de Area de Almacenamiento (SAN)
[13] End-points: puntos extremos de la red de almacenamiento
[14] File-System: Sitema de archivos que permite la distribución lógica de los mismos.
[15] File-Server: Servidores dedicados a compartir archivos
[16] Network Attached Storage: significado de NAS – dispositivos para compartir archivos
[17] O.S.: siglas de Sistema Operativo
[18] Compartición de Archivos
[19] NISs: Network Interface Cards – tarjetas de red.