Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012, p. 68-82 ISSN 1729-3804
68 Sitio web: http://revistatelematica.cujae.edu.cu/index.php/tele
PROPUESTA DE UNA ARQUITECTURA DE ALMACENAMIENTO PARA
NUBES PRIVADAS QUE SOPORTEN INFRAESTRUCTURA COMO
SERVICIO (IAAS1)
Ing. Alejandro Santoyo González1, Ing. Lilia Rosa García Perellada2, Dr.C. Alain Abel Garófalo Hernández3
1Dirección de Tecnologías y Sistemas, 2Departamento de Telecomunicaciones y Telemática. Facultad de Ingeniería Eléctrica, Instituto Superior Politécnico José Antonio Echeverría (ISPJAE), 3Departamento de Telecomunicaciones y
Telemática. Facultad de Ingeniería Eléctrica, ISPJAE 1e-mail: [email protected]
2e-mail: [email protected] 3e-mail: [email protected]
RESUMEN Las soluciones de almacenamiento (SAs) actualmente empleadas en las Nubes Privadas con soporte para IaaS, requieren de altos costos para su despliegue y mantenimiento, lo que dificulta la adopción del mencionado modelo de computación en organizaciones con fuertes restricciones económicas. En respuesta a esta problemática el presente trabajo tuvo como objetivo obtener una propuesta de arquitectura de almacenamiento para una Nube Privada con soporte para IaaS, con bajos requerimientos de costo por conceptos de despliegue y mantenimiento, basando la propuesta sobre hardware de propósito general, Software Libre y Código Abierto (SLCA) y el gestor Nube OpenNebula. Como resultado se obtuvo una propuesta de arquitectura de almacenamiento compuesta por una Red de Área de Almacenamiento (SAN2) sobre el Sistema de Interfaz para Pequeñas Computadoras (SCSI3) sobre Internet (iSCSI SAN) y Sistemas de Almacenamiento Conectados a la Red (NAS4), basada en hardware de propósito general y exponentes del SLCA como Openfiler, Heartbeat y Dispositivo de Bloque Replicado Distribuido (DRBD5). Para la obtención de la solución propuesta se estudiaron las arquitecturas de almacenamiento privativas y libres de los líderes de la Computación en la Nube, así como los SAs empleados en la actualidad en centros de datos y los asociados al paradigma de Computación en la Nube. Se seleccionaron los componentes lógicos y físicos de la infraestructura de la iSCSI SAN y el sistema NAS y se elaboraron las estrategias de respaldo y recuperación ante fallos de la solución. PALABRAS CLAVES: Computación en la Nube, Infraestructura como Servicio, Sistemas de Almacenamiento, Software Libre y Código Abierto, Hardware de Propósito General.
PROPUESTA DE UNA ARQUITECTURA DE ALMACENAMIENTO PARA NUBES PRIVADAS QUE SOPORTEN
INFRAESTRUCTURA COMO SERVICIO (IAAS1)
69 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
A STORAGE ARCHITECTURE FOR A PRIVATE CLOUD SUPPORTING IAAS. ABSTRACT The cost of maintain and deploy the high-range storage solutions actually deployed in Private Clouds with support for IaaS, is very high, thus the organizations with economic restrictions can’t easily adopt this model. To address this problematic situation, the main objective of this paper was to obtain a proposal ofstorage architecture for a Private Cloud with support for IaaS, with low requirements in terms of costs for maintenance and deployment, using commodity hardware, Free an Open Source Software (FOSS) and the Cloud manager OpenNebula. As a result, it was obtained a proposal of storage architecture formed by an iSCSI SAN and a NAS system, based on commodity hardware and FOSS like Openfiler, Heartbeat and DRBD. To achieve this result, a study was made about the private and free storage solutions given by the leaders of Cloud Computing and about the main storage systems used in today’s Data Centers and those associated to the paradigm of Cloud Computing. In this paper, the logical and physical components for the iSCSI SAN and NAS system’s infrastructure were selected and the strategies of backup and disaster recovery were elaborated for the storage solution obtained. KEY WORDS: Cloud Computing, Infrastructure as a Service, Storage Systems, Free and Open Source
Software, Commodity Hardware.
Ing. Alejandro Santoyo González, Ing. Lilia Rosa García Perellada, Dr.C. Alain Abel Garófalo Hernández
70 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
INTRODUCCIÓN
Todas las aplicaciones y servicios propios de Nubes Privadas utilizan, de una forma u otra, recursos de
almacenamiento, por lo que actualmente más del 40% del presupuesto de las empresas, orientado a
infraestructura de telecomunicaciones, es dedicado al almacenamiento. Hoy en día las SAs son ofrecidas
por grandes fabricantes sobre la base de hardware y software propietario. Esto implica que la gran
mayoría de las organizaciones cubanas no pueden permitirse la adquisición de la infraestructura de
almacenamiento necesaria debido a los altos costos de la misma, lo cual imposibilita el despliegue de la
IAAS en el marco de la estrategia nacional de desarrollo tecnológico. De esta situación se desprende la
necesidad de reducir los altos costos que requieren actualmente las SAs, pertenecientes a las
infraestructuras de Nubes Privadas con soporte para IAAS, para su despliegue y mantenimiento. Con
este fin, se pretende obtener una propuesta de arquitectura de almacenamiento para Nube Privada con
soporte para IaaS con bajos requerimientos de costo por conceptos de despliegue y mantenimiento.
SISTEMAS DE ALMACENAMIENTO
El almacenamiento de datos ha evolucionado grandemente en aras de satisfacer las necesidades
impuestas por la era digital y los enormes volúmenes de información que esta ha traído consigo. En la
actualidad, los SAs básicamente empleados en Centros de Procesamiento de Datos (CPDs), son:
Almacenamiento Directamente Conectado (DAS6), NAS y las SAN.
Almacenamiento Directamente Conectado
DAS es el nivel más básico de almacenamiento, en el cual los dispositivos de almacenamiento forman
parte de la estación de trabajo, o están directamente conectados a un servidor y son accesibles solo a
través de este [10]. En la Figura 1 se muestra el esquema básico de este SA.
Figura 1: Almacenamiento Directamente Conectado.
Según el esquema DAS, si el servidor falla o experimenta problemas de funcionamiento, esto tendrá un
efecto directo sobre la disponibilidad del sistema, lo cual constituye la principal desventaja de estos
sistemas. Otras desventajas son problemas como la congestión en la red y la ralentización en la
disponibilidad de los datos, que pueden ocurrir si el ancho de banda del servidor es consumido por las
aplicaciones, especialmente si una gran cantidad de datos se están intercambiando entre estaciones de
trabajo [10].
Las principales ventajas de DAS frente a otros SAs radican en su fácil despliegue, configuración y en sus
bajos costos iniciales. Además, permite fácilmente aislar física y lógicamente los datos, dado que estos
solo pueden ser accedidos directamente a través de un servidor. Sin embargo, además de las
desventajas antes mencionadas, DAS adolece también de dificultar en gran medida la gestión, debido
PROPUESTA DE UNA ARQUITECTURA DE ALMACENAMIENTO PARA NUBES PRIVADAS QUE SOPORTEN
INFRAESTRUCTURA COMO SERVICIO (IAAS1)
71 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
principalmente a que el almacenamiento se encuentra distribuido por toda la organización. Estas
complicaciones derivan en un aumento indeseable en los costos de mantenimiento de los sistemas DAS.
Almacenamiento Conectado a la Red
La tecnología NAS, surgió como respuesta a los problemas asociados a los sistemas DAS [10]. Los
dispositivos NAS se conectan directo a la a la Red de Área Local (LAN7) como se muestra en la Figura 2 y
ofrecen acceso al almacenamiento basado en ficheros.
Figura 2: Almacenamiento Conectado a la Red.
Entre las ventajas de los sistemas NAS se encuentra su funcionalidad plug-and-play, por lo que solo
requieren ser conectados a la red para su funcionamiento, adquieren su dirección IP y aparecen
automáticamente como un dispositivo de almacenamiento adicional. Son soluciones económicas y
confiables de alta velocidad pues eliminan la sobrecarga innecesaria del sistema operativo. Los NASs,
además, presentan bajos costos de mantenimiento y son altamente escalables, por lo que constituyen
soluciones de almacenamiento de excelente disponibilidad y confiabilidad.
A pesar de que NAS resuelve las principales deficiencias y problemas de DAS, adolece de limitaciones y
desventajas en la utilización del ancho de banda, puesto que el tráfico de almacenamiento emplea las
mismas conexiones que el tráfico propio de la red. Esto puede traer consigo una disminución sustancial
en el desempeño de las aplicaciones, un aumento de la latencia de la red, así como cuellos de botella en
los enlaces.
Red de Área de Almacenamiento
Las SANs son redes especializadas cuyo propósito fundamental es la transferencia de datos entre
sistemas de cómputo y dispositivos de almacenamiento. Siendo así, una SAN comprende: la
infraestructura de comunicación que provee conexiones físicas y una capa de gestión encargada de
organizar las conexiones, elementos de almacenamiento y sistemas de cómputo, de manera tal que la
transferencia sea robusta y segura [9]. La Figura 3 muestra el esquema de una SAN.
Las SAN resuelven el problema fundamental de los sistemas NAS, pues se dedica una red al tráfico de
almacenamiento. Por esta razón, las SANs son los SAs con mayores índices de desempeño y
disponibilidad, en gran medida debido a que el almacenamiento es independiente de las aplicaciones y
accesible a través de múltiples caminos. A su vez, ofrecen mayor rendimiento de aplicación y mayor
escalabilidad y flexibilidad. En resumen, las SANs son las soluciones de almacenamiento más versátiles y
Ing. Alejandro Santoyo González, Ing. Lilia Rosa García Perellada, Dr.C. Alain Abel Garófalo Hernández
72 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
potentes y presentan el mayor número de prestaciones en el universo actual de la Computación en la
Nube.
Almacenamiento Unificado (AU)
El AU, es un sistema basado en la convergencia de tecnologías de red y almacenamiento. Básicamente,
permite la integración en una misma plataforma, de sistemas que brindan acceso al almacenamiento
basado en ficheros (NAS) y basado en bloques (SAN). La implementación de soluciones de AU, permite la
reducción de los requerimientos y despliegue de hardware. Esto trae aparejado una simplificación
importante de la gestión del SA.
El AU reduce el número de tecnologías requeridas para la solución de almacenamiento, con lo que se
simplifican las tareas de mantenimiento y disminuye la cantidad de personal calificado requerido para la
atención al mismo. Reduce además los costos de despliegue y explotación del almacenamiento y ofrece
mayor flexibilidad en la agrupación de capacidades de almacenamiento dado que permite el acceso
basado en fichero y en bloques al almacenamiento, eliminando la necesidad de planificar capacidades
de almacenamiento para cada sistema por separado.
Figura 3: Red de Área de Almacenamiento.
Actualmente, lo que se pretende con este concepto es aprovechar las bondades propias del estándar
Ethernet, con motivo de manejar el tráfico de almacenamiento y de esta manera integrar las diferentes
tecnologías relacionadas al mismo.
SOLUCIONES DE ALMACENAMIENTO COMERCIALES
Soluciones de almacenamiento propietarias
La experiencia adquirida y funcionalidades desarrolladas por compañías como IBM, Microsoft y VMware
en el diseño e implementación de soluciones de almacenamiento para CPDs que soporten la
Computación en la Nube, hace que el análisis de estas soluciones sea obligatorio si se pretende
incursionar en el universo del Almacenamiento en la Nube (AN). Las soluciones de almacenamiento para
PROPUESTA DE UNA ARQUITECTURA DE ALMACENAMIENTO PARA NUBES PRIVADAS QUE SOPORTEN
INFRAESTRUCTURA COMO SERVICIO (IAAS1)
73 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
Nubes Privadas de estos proveedores tienen en común elevados niveles de desempeño, disponibilidad y
prestaciones, con consecuentes astronómicos precios.
Los puntos comunes de estos proveedores, parten del empleo de soluciones de almacenamiento
basadas, por lo general, en SANs. A pesar de la diferencia de sus implementaciones, todos recomiendan
emplear multicamino para el acceso al almacenamiento, redundancia en el almacenamiento de datos
sobre la base de sistemas de Arreglo Redundante de Discos Independientes (RAID8) y recomiendan
además agregar adecuados niveles de redundancia de fuentes de energía. Por otra parte, tanto
Microsoft, VMware como IBM emplean herramientas de gestión que permiten el monitoreo constante
del SA desplegado.
Estos tres fabricantes proponen la utilización de estrategias de gestión de la capacidad y la tolerancia y
recuperación ante fallos que incluye funcionalidades como el thin provisioning, la realización de
instantáneas y el clonado de volúmenes. Proponen además el empleo de altas velocidades (Gigabit o
superior en el caso de Ethernet) para los enlaces de la SAN con el objetivo de potenciar el desempeño
del sistema y el empleo de una fuerte capa de virtualización para aumentar la flexibilidad y simplificar la
gestión.
Soluciones de almacenamiento no propietarias
Los mayores proveedores de tecnologías para Computación en la Nube no propietarias son CloudStack,
Eucalyptus y OpenNebula, por lo que deben ser consultados en lo referido al almacenamiento basado en
hardware de propósito general y SLCA. Sin embargo, a diferencia de sus homólogos propietarios, estos
no ofrecen soluciones concretas de almacenamiento para Nubes Privadas, sino que proponen solo las
características más relevantes de arquitecturas de almacenamiento medularmente opuestas entre sí,
orientadas a satisfacer las particularidades de sus plataformas de gestión. No puede hablarse de SAs
propuestos por estos proveedores ni recomendaciones de diseño referidas a los mismos, sino de
aquellos SAs que pueden ser manejados por los gestores homónimos y cuyas características permiten el
consecuente despliegue de dichas plataformas y el correcto desempeño del CPD sobre esta base. En
este sentido aún es grande la brecha entre las soluciones de almacenamiento propietarias y libres, y
entre los proveedores de unas y otras soluciones.
SOLUCIÓN DE ALMACENAMIENTO PROPUESTA
Sistema de almacenamiento
Para la proposición de una solución de AN, existe la disyuntiva de seleccionar uno u otro SA (DAS, NAS,
SAN, AU). El análisis cuidadoso de cada tecnología, basado en sus características, ventajas y desventajas,
determina que se seleccione el sistema que responda en mayor medida a las exigencias de un entorno
Nube. (Tabla 1)
Ing. Alejandro Santoyo González, Ing. Lilia Rosa García Perellada, Dr.C. Alain Abel Garófalo Hernández
74 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
Tabla 1: Comparación de los SAs actualmente utilizados en CPDs.
Partiendo de la Tabla 1, se aprecia que DAS no responde a las necesidades de tolerancia a fallos,
flexibilidad, desempeño y otros requerimientos críticos propios del AN, por lo que se descarta como
posible solución de almacenamiento en el marco de este trabajo.
Con el objetivo de aprovechar las ventajas que proporciona la utilización de los sistemas NAS y SAN, este
trabajo propone un sistema de tipo "híbrido" como solución de AN. Este tipo de sistemas mejora
considerablemente la escalabilidad pues en caso de necesitarse mayores capacidades, la funcionalidad
plug-and-play de los sistemas NAS permite, con solo conectar otro terminal de almacenamiento NAS a la
red, un aumento en las capacidades disponibles. En segundo lugar, se simplifica considerablemente la
gestión y se mejora la usabilidad del sistema.
La SAN, por otra parte, resuelve el inconveniente de los sistemas NAS respecto a los posibles cuellos de
botella por la escasez de ancho de banda disponible, brindando recursos de almacenamiento con un
excelente desempeño, caracterizado por bajas demoras y tiempos de respuesta, en gran medida debido
a que la utilización de acceso basado en bloques al almacenamiento, disminuye la sobrecarga de
procesamiento de los terminales de almacenamiento. Esto es muy importante pues actualmente las
velocidades más utilizadas en entornos de Nubes Privadas son 8 y 10 Gbps, lo cual permite la
implementación de redes convergentes (el tráfico de la red de almacenamiento y la red del CPD fluye
por los mismos enlaces). Sin embargo, el despliegue de sistemas con estas velocidades puede ser casi
tan costoso como el de una SAN de Canal de Fibra (FC9) (SAN FC) y no resuelve la problemática que da
lugar a este trabajo. Por esta razón se propone una iSCSI SAN como red dedicada al almacenamiento, lo
que permite desplegar un SA basado en Gigabit Ethernet con excelentes índices de desempeño, bajos
costos de despliegue y mantenimiento y dando la posibilidad de utilizar terminales de almacenamiento
distribuidos.
Los grandes fabricantes y proveedores de Nubes Privadas, están optando actualmente por sistemas AU.
Estos SAs están basados en su mayoría en la tecnología de FC sobre Ethernet (FCoE10), lo que implica
PROPUESTA DE UNA ARQUITECTURA DE ALMACENAMIENTO PARA NUBES PRIVADAS QUE SOPORTEN
INFRAESTRUCTURA COMO SERVICIO (IAAS1)
75 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
que su despliegue parte de la existencia de una infraestructura FC en explotación como solución de
almacenamiento. Esta es otra de las razones por las cuales se propone la utilización de una iSCSI SAN y
un sistema NAS, con el propósito de desplegar un SA diseñado sobre la concepción de una solución de
AU, aprovechando las importantes ventajas de esta tecnología.
Arquitectura lógica de la solución de almacenamiento propuesta
La arquitectura lógica de la solución de almacenamiento propuesta abarca la topología de la iSCSI SAN y
la topología lógica del SA propuesto, así como los componentes software de la solución.
Como parte de la topología de la iSCSI SAN, este trabajo propone la utilización de fabrics SAN jerárquicas
pues responden a los exigentes requerimientos de disponibilidad de las Nubes Privadas, mediante la
utilización de altos niveles de redundancia, tolerancia a fallos y desempeño. Por otra parte, la
modularidad de su implementación permite una visión simplificada de los bloques que componen el
sistema, con una consecuente mejora en los niveles de gestión y facilita sobremanera la realización de
cambios y actualizaciones de dispositivos y tecnologías.
La topología lógica del SA propuesto puede observarse en la Figura 4.
Figura 4: Topología lógica del SA propuesto.
NAS1 es el servidor NAS que brinda acceso basado en ficheros a recursos de almacenamiento. Este está
pensado para el almacenamiento de datos temporales de usuarios y en general datos no críticos para la
empresa. Aunque solo se propone un terminal NAS, en caso de necesitarse mayores capacidades, basta
conectar otro u otros dispositivos NAS a la red.
Los Servidores NFS1 y NFS2 son los encargados de brindar al front-end de OpenNebula el entorno de
almacenamiento compartido para el soporte de funcionalidades de alta disponibilidad como la
"migración en caliente" y para el almacenamiento en general correspondiente a la Nube Privada,
orientado a los servicios y aplicaciones de mayor importancia para la empresa. Estos servidores son
utilizados a modo de clúster dedicado al almacenamiento, en configuración activo-pasivo para
Ing. Alejandro Santoyo González, Ing. Lilia Rosa García Perellada, Dr.C. Alain Abel Garófalo Hernández
76 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
garantizar la disponibilidad y agruparán los recursos exportados por los terminales de almacenamiento
mediante la iSCSI SAN en una gran pool de almacenamiento.
Se recomienda el software DRDB [8] [2] [4], para la replicación de los datos y ficheros de configuración
en ambos nodos del clúster, de manera que en caso de fallo en uno de los nodos el otro entre en
funcionamiento y mantenga la disponibilidad de los servicios. El front-end de OpenNebula es el
encargado de realizar las tareas de gestión del clúster y el software Heartbeat [8] [2], se propone para
monitorizar el estado de funcionamiento de ambos servidores.
La iSCSI SAN se encarga de brindar acceso al almacenamiento, garantizando adecuados niveles de
disponibilidad y desempeño, sobre la base fundamental del aislamiento del tráfico de almacenamiento.
Los componentes software de la solución de almacenamiento que se propone en este trabajo
comprenden los Sistemas Operativos (SOs) que correrán las computadoras de propósito general
convertidas en servidores y dispositivos de almacenamiento, el gestor de volúmenes que se empleará
para el manejo de las particiones lógicas y los protocolos para compartir ficheros en red.
Existen diversos SOs de SLCA que pueden utilizarse para convertir computadoras de propósito general
en servidores y dispositivos de almacenamiento. Las más empleadas en SAs actuales son las
distribuciones de Linux FreeNAS [5], NASLite y Openfiler [6] [1]. En la Tabla 2 se muestran las principales
características y funcionalidades de cada distribución.
Este trabajo propone la utilización de la distribución Openfiler para convertir computadoras de
propósito general en dispositivos de almacenamiento, sobre la base de las indiscutibles ventajas frente a
FreeNAS y NASLite que este presenta como alternativa para una Nube Privada. Esta distribución posee
una interfaz web muy amigable y funcional para la administración, lo cual mejora sustancialmente la
usabilidad del sistema y reduce el tiempo de familiarización con el mismo requerido por los
administradores. Openfiler permite además la creación tanto de dispositivos NAS como SAN, lo cual
reduce la necesidad de utilizar software adicional en la solución de almacenamiento que se propone,
mejorándose con ello los niveles de gestión y simplificándose la estructura lógica del almacenamiento.
Para la virtualización del almacenamiento, se recomienda emplear el Gestor de Volúmenes Lógicos
(LVM11) [7] [3], para el manejo de las capacidades de almacenamiento agrupadas en volúmenes. LVM
es un gestor (incluido en la distribución Openfiler), que añade a la solución de AN propuesta altos
niveles de flexibilidad y una elevada eficiencia en el uso de las capacidades de almacenamiento
PROPUESTA DE UNA ARQUITECTURA DE ALMACENAMIENTO PARA NUBES PRIVADAS QUE SOPORTEN
INFRAESTRUCTURA COMO SERVICIO (IAAS1)
77 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
disponibles. Actualmente LVM es el gestor de volúmenes lógicos más utilizado en SAs basados en SLCA y
hardware de propósito general debido a sus excelentes funcionalidades y prestaciones.
Con el objetivo de proveer funcionalidades de compartición de ficheros, Openfiler brinda soporte a las
tecnologías de Sistema de Ficheros en Red (NFS12) y SMB/Sistema de Ficheros de Internet Común
(CIFS13). NFS es el sistema de ficheros propuesto para presentar los recursos de almacenamiento
compartido al front-end de OpenNebula mediante los servidores NFS1 y NFS2. En el caso del sistema
NAS, se empleará SMB/CIFS, con el objetivo de brindar a los usuarios la posibilidad de acceder al
almacenamiento mediante sistemas Linux o Windows indistintamente, lo cual añade mayor flexibilidad
a la solución propuesta.
Arquitectura física de la solución de almacenamiento propuesta
Una solución de AN, debe contar con una infraestructura subyacente que responda a las exigencias de
las aplicaciones y servicios propios de un entorno Nube. En este trabajo, esta infraestructura ha sido
dividida en infraestructura de interconexión, infraestructura para servidores y dispositivos terminales de
almacenamiento e infraestructura de almacenamiento.
Como parte de la infraestructura para servidores y dispositivos terminales de almacenamiento se
recomienda utilizar Tarjetas de Interfaces de Red (NICs14) con soporte para tramas jumbo, para
garantizar la conectividad de los dispositivos a la red, debido fundamentalmente a su excelente relación
costo-beneficio y a su amplia presencia en las redes de computadoras actuales. El soporte para tramas
jumbo está dirigido a una mejor utilización del ancho de banda disponible, con lo que se mejora el
desempeño y la disponibilidad. El empleo de NICs multipuertos implica puntos de fallos singulares, pues
si falla la NIC se pierde la conectividad completamente. Por esta razón se propone utilizar más de una
NIC (con velocidad igual o mayor a la del enlace de red al que están conectadas) por computadora, a fin
de lograr alta disponibilidad, dando respuesta a las necesidades de una Nube Privada con soporte para
IaaS.
Los servidores deberán contar con al menos 1 GB de disco duro y 256 MB de RAM para la instalación del
Openfiler. Este trabajo propone, para los servidores NFS1, NFS2 y NAS1, la utilización de al menos 2 GB
de RAM, placas madres multiprocesadores y más de un procesador multinúcleo por servidor con una
frecuencia superior a los 2 GHz, en aras de mejorar el desempeño y disminuir las demoras que pudiera
ocasionar la sobrecarga de procesamiento debida a la utilización, por iSCSI, de las capas superiores del
modelo TCP/IP. Los dispositivos terminales de almacenamiento pueden ajustarse a los requerimientos
básicos de hardware para la instalación de Openfiler
(256 MB de RAM) [6], aunque la utilización de 1 GB de RAM y procesadores multinúcleo con frecuencias
mayores de
2 GHz, puede mejorar en gran medida el desempeño del sistema y evitar posibles cuellos de botella en
el acceso al almacenamiento.
La infraestructura de almacenamiento propuesta en este trabajo, comprende los sistemas de discos y las
unidades básicas de almacenamiento (discos duros en este caso). Los sistemas de discos tienen un
impacto decisivo sobre la disponibilidad, el desempeño y la relación costo-beneficio de las soluciones de
almacenamiento para Nubes Privadas.
Ing. Alejandro Santoyo González, Ing. Lilia Rosa García Perellada, Dr.C. Alain Abel Garófalo Hernández
78 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
En este trabajo se propone la utilización de software RAID, debido a la ausencia de controladoras RAID
en gran parte de las placas bases con que cuentan las empresas actuales, así como la incidencia de
dificultades prácticas para la implementación de los diferentes niveles RAIDs empleando estas
controladoras integradas y distribuciones de SLCA. Por otra parte, la variante software RAID ofrece una
implementación de gran flexibilidad y elimina las controladoras que podrían considerarse posibles
puntos de fallos adicionales del sistema, aunque ofrece niveles de desempeño ligeramente inferiores a
la variante hardware.
La propuesta de los niveles RAIDs adecuados para la solución de almacenamiento en este trabajo, está
directamente ligada al soporte brindado por Openfiler, debido a la utilización de software RAID. Dado
que la versión de Openfiler 2.3 soporta RAID 0, 1, 5, 6, y 10, este trabajo propone emplear RAID 5 para el
sistema NAS que brindará acceso basado en ficheros a los usuarios, garantizando un excelente
aprovechamiento de la capacidad disponible y un aceptable desempeño, unido a una óptima relación
costo-beneficio; RAID 10 para el repositorio de imágenes de Máquinas Virtuales (VMs15) y el
almacenamiento dedicado a servicios y aplicaciones, respondiendo a las necesidades de tolerancia a
fallos y altos niveles de desempeño; y RAID 6: para el sistema de respaldo de datos implementado,
garantizando la más elevada tolerancia a fallos y excelentes indicadores de entrada/salida (I/O16).
Como unidades básicas de almacenamiento, los SAs para Nubes Privadas actuales utilizan discos duros
ATA Serie (SATA17), Conexión SCSI Serie (SAS18) o Unidades de Estado Sólido (SSD19). Aunque los SSDs
ofrecen por amplio margen los mejores índices de desempeño y de consumo energético, son
dispositivos que aún ofrecen bajas capacidades en comparación con los discos SATA y SAS, y elevan
inadmisiblemente para la mayoría de las empresas, el costo de la solución de almacenamiento.
Por esta razón este trabajo propone la utilización de discos SAS y SATA, teniendo en cuenta planificar el
sistema de forma que las estrategias de respaldo cuenten con espacio de almacenamiento en discos
SATA y las aplicaciones y servicios dispongan de almacenamiento en discos SAS. Esta planificación
mejora sustancialmente la relación costo-beneficio, aporta adecuados niveles de confiabilidad y
desempeño; y optimiza el consumo energético del almacenamiento, resultando en una variante costo-
efectiva de prescindir de los dispositivos SSDs, manteniendo adecuados valores de desempeño.
Para el sistema NAS y el almacenamiento de respaldo se recomienda utilizar discos SATA III y SATA II
dependiendo de su disponibilidad en el mercado, debido a las altas capacidades ofrecidas por estos, su
bajo costo y sus adecuados niveles de fiabilidad, desempeño y consumo energético (más bajo que el de
los discos SAS) para estos propósitos. Debe priorizarse la utilización de discos SATA III debido a su mayor
razón de transmisión de datos (6 Gbps) frente a sus antecesores SATA II (3 Gbps), aunque esto significa
un ligero aumento en los costos de los dispositivos terminales de almacenamiento, pues deben
adquirirse placas madres que soporten esta interfaz.
En el caso del almacenamiento destinado a las aplicaciones y servicios, se propone utilizar discos SAS de
10k RPM para las necesidades de mayor capacidad y relativamente menores índices de desempeño y de
15k RPM para las aplicaciones y servicios críticos de la empresa que requieran alta fiabilidad,
desempeño y donde el consumo energético quede en segundo plano.
Como parte de la infraestructura de interconexión, dado que iSCSI emplea el estándar Ethernet, pueden
emplearse dispositivos para esta tecnología de red y adquirirse a precios relativamente bajos en
comparación con sus homólogos para la tecnología FC. El número de dispositivos dependerá de la
PROPUESTA DE UNA ARQUITECTURA DE ALMACENAMIENTO PARA NUBES PRIVADAS QUE SOPORTEN
INFRAESTRUCTURA COMO SERVICIO (IAAS1)
79 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
infraestructura de almacenamiento implementada por cada empresa en particular, pues debe tenerse
en cuenta la redundancia de caminos, el número de computadoras destinadas como dispositivos
terminales de almacenamiento y el número de servidores dedicados al almacenamiento (dos en este
trabajo).
Se propone utilizar conmutadores Ethernet con soporte para las funcionalidades de LANs Virtuales
(VLANs20), tramas jumbo y control de flujo. La utilización de tramas jumbo permite un mejor
aprovechamiento del ancho de banda disponible, mientras que el control de flujo evitará situaciones de
congestión en la red en las que se descarten paquetes innecesariamente, lo cual es un requerimiento
indispensable de las SANs y garantiza que no se afecte la estabilidad y disponibilidad del SA. El soporte
para VLANs es requerido previendo futuras expansiones de la SAN, lográndose con esto la
implementación de una solución escalable y flexible.
Dado que iSCSI requiere, para un mejor desempeño, enlaces de alta velocidad, este trabajo propone la
utilización de velocidad Gigabit Ethernet para la iSCSI SAN y para la interconexión de los servidores
NAS1, NFS1 y NFS2 y el front-end de OpenNebula con la red del CPD. Esta recomendación se sustenta en
los resultados favorables que fabricantes como NetApp y EMC han obtenido con iSCSI SANs a estas
velocidades, pero en caso de preverse altos índices de escalabilidad, se recomienda la migración a 10
Gigabit Ethernet, con el objetivo de dar un salto significativo en el comportamiento y los niveles de
desempeño del SA.
Estrategias de respaldo y recuperación ante fallos
Los SAs tienen gran impacto en la disponibilidad en Nubes Privadas, puesto que todos los datos que
emplean las aplicaciones y servicios son almacenados en estos. Esto implica que el respaldo y la
recuperación ante fallos de la solución de almacenamiento sean elementos de vital importancia.
Este trabajo propone la realización de tareas de respaldo mediante el software DRBD, y nodos de
respaldo con iguales recursos (de procesamiento y almacenamiento) a los empleados como dispositivos
terminales de almacenamiento. DRBD forma parte de la distribución Openfiler 2.3, lo cual evita agregar
software adicional para la realización de la replicación de datos para el respaldo. La utilización de DRBD,
reduce la probabilidad de fallo debido a la des actualización de los datos almacenados en los dispositivos
de respaldo y en los servidores de almacenamiento. Los nodos de respaldo pueden encontrarse
físicamente situados en el mismo local que los nodos activos, aunque se recomienda una locación
remota asegurada, para maximizar la tolerancia a fallos y las capacidades de recuperación ante
desastres.
Unido a estos recursos debe implementarse redundancia de suministro de energía para los servidores,
dispositivos de interconexión y de almacenamiento (incluidos los de respaldo), de manera que un corte
eléctrico no afecte negativamente la disponibilidad del SA.
Se recomienda utilizar un software como Heartbeat para la monitorización del estado de los dispositivos
de almacenamiento, de esta forma se garantiza el mecanismo necesario para la recuperación ante fallos
en estos dispositivos y elevados niveles de disponibilidad en el sistema.
Por otra parte, la estrategia de recuperación ante fallos debe comenzar con la documentación de los
ajustes de configuración de todos los dispositivos que formen parte del SA, incluyendo los dispositivos
de interconexión de la SAN y un diagrama detallado de esta. Esto reducirá significativamente el tiempo
Ing. Alejandro Santoyo González, Ing. Lilia Rosa García Perellada, Dr.C. Alain Abel Garófalo Hernández
80 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
de recuperación ante fallos y garantizará la correcta puesta en marcha del sistema a su estado anterior
de correcto funcionamiento. Esta documentación debe incluir además una minuciosa caracterización de
los dispositivos de almacenamiento con que cuenta el SA, sin pasar por alto los números de serie y
modelos de cada uno. De esta forma se agiliza cualquier proceso de reemplazo necesario. El segundo
componente de la estrategia de recuperación ante fallos debe ser el sistema de monitorización que
permita la detección temprana de fallos o situaciones indeseables y los mecanismos de alertas
necesarios, con el fin de que los módulos correspondientes en la plataforma de gestión entren en
funcionamiento y permitan mantener elevados niveles de disponibilidad.
Este trabajo propone como piedra angular de la estrategia de recuperación ante fallos un Plan de
Recuperación ante Fallos (PRF) que incluye una descripción detallada de las acciones y pasos a seguir en
caso de desastre, con el objetivo de agilizar el proceso de recuperación de los sistemas desplegados.
PROPUESTA DE UNA ARQUITECTURA DE ALMACENAMIENTO PARA NUBES PRIVADAS QUE SOPORTEN
INFRAESTRUCTURA COMO SERVICIO (IAAS1)
81 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
CONCLUSIONES
En este trabajo, de acuerdo a los objetivos trazados, se obtuvo como resultado la propuesta de una
arquitectura de almacenamiento para Nubes Privadas que brinden IAAS con bajos costos de despliegue
y mantenimiento. La iSCSI SAN permite utilizar la infraestructura Ethernet y brinda elevados niveles de
desempeño y disponibilidad, apoyándose fundamentalmente en la topología de red propuesta, la
velocidad de los enlaces recomendada (Gigabit Ethernet o superior) y en el aislamiento del tráfico de
almacenamiento. El sistema NAS, por otra parte, añade a la solución una mayor flexibilidad,
escalabilidad y usabilidad, contribuyendo al desempeño de la solución evitando que el tráfico de datos
temporales o no críticos de la empresa circule por la red de almacenamiento. La unión de ambos
sistemas reduce significativamente los costos de despliegue y mantenimiento del SA,
fundamentalmente por el empleo de hardware de propósito general y de software SLCA como Openfiler
2.3, Heartbeat y DRBD.
Ing. Alejandro Santoyo González, Ing. Lilia Rosa García Perellada, Dr.C. Alain Abel Garófalo Hernández
82 Revista Telem@tica. Vol. 11. No. 3, septiembre-diciembre, 2012. ISSN 1729-3804
Referencias
[1] BUCKLE, P., "How to Configure Openfiler iSCSI Storage for VMware ESX 4". Xtravirt, (2009).
[2] CASTILLO, M.A. and ROCHA, A.S., "Implementación de un sistema de VoIP de alta disponibilidad
basado en Asterisk y Heartbeat". Facultad de Ingeniería en Electricidad y Computación. Escuela Superior
Politécnica del Litoral, (2011).
[3] GNS, S., "Software RAID & LVM under Linux". GNS Systems, (2010).
[4] HAAS, F., REISNER, P. and ELLENBERG, L., "The DRBD User's Guide". LINBIT HA Solutions GmbH,
(2011).
[5] IXSYSTEMS, "FreeNAS 8.0.3 User's Guide". (2012).
[6] LTD, O., "Openfiler Administration Guide". (2009).
[7] RED HAT, I., Red Hat Enterprise Linux 5: Administrador de volumen lógico de cluster, Red Hat, Inc.,
(2009).
[8] RODRÍGUEZ, A.E., "Diseño de un modelo para la implementación de Servidores Web de Alta
Disponibilidad". Facultad de Ciencias e Ingenierías Físicas y Formales. Universidad Católica de Santa
María (2008).
[9] TATE, J., LUCCHESE, F. and MOORE, R., "Introduction to Storage Area Networks". International
Business Machines Corp., (2006).
[10] TECHNOLOGIES., W.S., "Enterprise Storage Solution". (2008).