Seminario Grid: Grid as a tool for eScience

Una más, esta vez a cargo de Dominique Boutigny, director de CC-IN2P3 (No entiendo cómo logran los franceses manejar tantas siglas... Estoy impresionado).

De nuevo, la idea de los grids es servir de intermediario para el procesamiento de cantidades masivas de datos que permiten realizar investigación fundamental. Es el cambio de la computación centralizada a la computación distribuida.

En los 80s CERN producía 2TB de datos. En los 90s subió a 15TB, procesados en CERN. En el 2000, estamos hablando de 1PB de datos, con procesamiento distribuido en cinco sitios, con un poder equivalente a 4000CPU actuales. Ahora estamos hablando de 10 billones de colisiones de partícuas por año, que generan 10-15PB de datos, con miles de personas involucradas en los experimentos.

Si se apilaran CD-ROMs, la cantidad de información generada en un año tendría alrededor de 20Km de altura… Es indispensable usar enfoques GRID.

La idea de la computación en malla empezó a tomar fuerza en el mundo HEP (High Energy Particles) en 1999/2000. En 2001 CERN lanzó el proyecto European DataGrid.

Enabling Grids for E-sciencE (EGEE) es el sucesor de los esfuerzos iniciales. Mayor alcance, más participantes. La idea de EGEE es proveer servicios, no infraestructura. De esto se encarga el proyecto W-LCG, a través del desarrollo de un modelo de conexión jerárquico: La capa central (T0) se conecta a la siguiente capa (T1) mediante enlaces de 10Gb/s. A su vez, las instituciones en esta capa se conectan entre si y con otras capas mediante los enlaces provistos por las redes de alta velocidad locales.

El crecimiento exponencial de la cantidad de información es un reto técnico en almacenamiento (discos, cintas) y en provisión de energía eléctrica.

Pero el grid no se dedica sólo a física de partículas. TEGEE tiene una organización biomédica muy activa.

SRB es un data grid desarrollado por el San Diego SuperComputing Center. Permite almacenar, distribuir y reproducir datos en un entorno distribuido, gestiona metadatos y es una solución elegante para datos distribuidos.


Sobre el autor

Soy Diego Leal .

©2017 Diego E. Leal Fonseca. Partes de este sitio están disponibles bajo licencia Creative Commons BY-NC-SA

Log in with your credentials

Forgot your details?