El sistema de archivos Google

The Google File System

Por Sanjay Ghemawatt, Howard Gobioff y Shun-Tak Leung

Traducido por Volkan Rivera


Resumen:


Nosotros hemos diseñado e implementado el Google File System, un sistema de archivos distribuido y escalable para aplicaciones distribuidas que accesen intensivamente a los datos. Éste provee tolerancia a fallos mientras mientras corre sobre computadoras de bajo costo, y es capaz de generar un alto rendimiento a un gran número de clientes.

Mientras compartimos muchos de los objetivos de otros sistemas de archivos distribuidos, nuestro diseño se basa en criterios obtenidos de la observación del flujo de datos de nuestras aplicaciones y el entorno tecnológico, tanto el actual como el futuro, que refleja un marcado alejamiento de algunas suposiciones iniciales de sistemas de archivos.  Esto nos ha llevado a reexaminar las opciones tradicionales para el diseño de sistemas de archivos y explorar nuevos puntos de vista radicalmente diferentes.

El sistema de archivos ha cumplido exitosamente nuestras necesidades de almacenamiento. Y es ampliamente usado en Google como la plataforma de almacenamiento para la generación y procesamiento de datos, usados por nuestros servicios así cómo también en nuestros trabajo de investigación y desarrollo que requiere grandes conjuntos de datos. El cluster más grande a la fecha provee cientos de terabytes de almacenamiento a través de miles de discos en un número equivalente de computadoras, y es accesado simultáneamente por cientos de cliente.

En este documento presentaremos los alcances del diseño del sistema de archivos para soportar aplicaciones distribuidas, discutiendo muchos de los aspectos de nuestro diseño y mostraremos reportes de nuestras mediciones tanto de micro-benchmark (pruebas de laboratorio) como su uso en el mundo real.

Categorías y descripción del tema:

D [4]: 3 – Sistema de archivos distribuido

Términos generales:

Diseño, confiabilidad, perfomance, medición

Palabras clave:

Tolerancia a fallos, escalabilidad, almacenamiento de datos, cluster de almacenamiento.



(*) los autores de este artículo pueden ser contactados en estas direcciones de correo:
sanjay (arroba) google.com
hgobioff (arroba) google.com
shuntak (arroba) google.com


3 comentarios en «El sistema de archivos Google»

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.