StorageGRID Webscale: almacenamiento de objetos para su organización

 

Como parte del lanzamiento de hace unas semanas anunciamos una nueva versión de nuestro software de almacenamiento StorageGRID, que ahora pasa a ser completamente orientado a objetos, y que nos propone una solución empresarial a este nuevo modelo de guardar y acceder a la información.

En el tema de almacenamiento de objetos soy un profano, así que aprovechando nuestro evento de formación NetApp Insight, estoy aprendiendo de este mundo, diferente, pero relacionado con el negocio al que tradicionalmente nos hemos dedicado.

Hace unos días preparé estas transparencias para una reunión, y creo que resumen la idea básica:

 

storagegrid0.jpg

 

Cuando hablamos de servicios en cloud, y pensamos en almacenamiento, normalmente estamos pensando en los datos que necesitamos para hacer funcionar a las aplicaciones; por ejemplo las tablas de una base de datos. En la mayoría de los casos necesitamos tener los datos cerca de las aplicaciones, y para eso utilizamos nuestras cabinas de almacenamiento de toda la vida … (más info sobre la movilidad de datos entre servicios cloud que nos proporciona Clustered ONTAP aquí).

Con el almacenamiento de objetos el modelo sería el siguiente:

 

Storagegrid1.jpg

 

Es una aplicación particular la que es capaz de acceder a los datos de uno o varios servicios de almacenamiento, y por la naturaleza de los datos, el servicio no necesita baja latencia para acceder a los mismos; se utilizan conexiones de IP convencionales, en muchos casos sobre conexiones en internet a proveedores de servicios públicos.

La aplicación no tiene por qué saber dónde están los datos, como se guardan los datos o cuantas copias tenemos. Una comparación de este tipo de servicios sería pensar en un parking de esos que los americanos llaman “valet” frente a un parking normal. En el normal tenemos que conducir con nuestro coche, buscar una plaza libre, aparcar y tomar nota de la planta y plaza que hemos ocupado, para luego poder volver a recuperar nuestro coche. La otra alternativa, la que se parece al almacenamiento de objetos, consiste en darle las llaves al aparcacoches en la puerta, y guardar el ticket que identifica de forma única a nuestro coche, y que nos permitirá recuperarlo cuando lo necesitamos. Algo parecido es lo que hacemos con el almacenamiento de objetos.

 

file0001411219641.jpg

 

Más información sobre almacenamiento de objetos en este pequeño libro "for dummies"

 

¿Por qué utilizamos este tipo de servicios? Básicamente para poder manejar de forma eficiente los grandes volúmenes de información que encontramos en diferentes tipos de aplicaciones, como pueden ser los datos médicos (radiografías, historiales, …), fotos o videos en una red social, datos de prosprecciones petrolíferas, datos de las llamadas de una operadora de telefonía, etc.

StorageGRID escala hasta 100 billones de objetos y 70 Petabytes y puede tener los datos en un solo espacio de nombres, distribuidos en hasta 16 CPDs a nivel mundial. Los datos se pueden replicar, manteniendo varias copias de los mismos, y gestionar el movimiento de los mismos entre diferentes tiers de almacenamiento, que pueden incluir la cinta como un último nivel de almacenamiento.

StorageGRID se implementa como un software que instalamos en servidores (virtuales normalmente) y que utiliza almacenamiento externo, que en esta versión puede ser de cualquier fabricante certificado. Se utilizan varios tipos de nodos, que permiten escalar horizontalmente la arquitectura, incluyendo los nodos de almacenamiento, de gestión, de archivo para utilizar cintas archivado y los gateways por los que acceden los clientes.

 

storagegrid2.jpg

 

Los protocolos de acceso por parte de estos clientes son CDMI (Cloud Data Management Interface) y S3 (el protocolo definido por Amazon para su servicio de almacenamiento de objetos). En versiones anteriores también se prestaba servicio de ficheros (CIFS y NFS), pero ha sido eliminado de esta versión para centrarnos en los protocolos de objetos, aunque hay algún gateway de terceros que puede integrarse.

Esto nos permite hacer el uso que me parece más sencillo para este servicio: reemplazar de forma local al almacenamiento en cloud utilizado por aplicaciones que han usado estos servicios por no encontrar este servicio dentro de la organización.

Entramos en el “Shadow IT”, aquellos señores que están pagando con su tarjeta de crédito un servicio en cloud porque les resulta más cómodo y rápido que pedírselo a su departamento de IT. Pues bien, con StorageGRID podemos darles una solución, de forma que sus aplicaciones vuelvan a tener los datos dentro de vuestros CPDs, y se apliquen las políticas de seguridad y disponibilidad que la organización considere.

Evidentemente también podemos pensar en arquitecturas que aprovechen tanto los servicios propios como los externos, dejando a la aplicación gestionar varias copias y/o niveles de servicio, por ejemplo basados en los metadatos de los objetos almacenados: si un objeto está identificado como “confidencial” lo almacenamos en nuestro servicio de StorageGRID local, en caso contrario lo almacenamos en Amazon S3.

La última cosa a mencionar es la capacidad de mover los datos (ILM) que tiene el propio StorageGRID. Esto nos permite mover los datos a lo largo de su ciclo de vida, utilizando diferentes niveles de almacenamiento, con diferentes niveles de rendimiento, políticas de retención para prevenir borrados, o forzando el borrado de los mismos tras un tiempo, verificar la integridad de los datos de forma periódica, etc, todo ello basado en los metadatos que nuestra aplicación haya aplicado a cada objeto.

StorageGRID Webscale se puede descargar ya de nuestra página web de soporte: http://mysupport.netapp.com/NOW/cgi-bin/software/?product=StorageGRID+Webscale&platform=All+Platforms

En cuanto tengamos tiempo lo montaremos en nuestro lab de Madrid, esto de los objetos creo que ha venido para quedarse.

Saludos,

Jamarmu