El meu Web
Aplicación oficial 'El Tiempo de AEMET' (Android e iOS)
Contactar
Mapa web
Seguix-nos en Facebook
Seguix-nos en Twitter
AEMET blog.es
Seguix-nos en YouTube
RSS
IniciI+D+iInnovació tecnològicaDetalle

Sistemas de supercomputación

AEMET cuenta desde hace más de veinticinco años con sistemas de cálculo de altas prestaciones destinados a la ejecución de los modelos numéricos meteorológicos, climáticos y así como otras aplicaciones paralelas.

El actual sistema de supercomputación de AEMET está formado por un ordenador CRAY-X1E, cuya primera fase fue instalada en el año 2003. La última mejora de sus prestaciones tuvo lugar a mediados de 2008. La arquitectura de esta máquina combina las dos líneas tradicionales de CRAY: la vectorial paralela de memoria compartida y la masivamente paralela de memoria distribuida.

El componente básico computacional es el procesador desarrollado por CRAY denominado MSP (Multistreaming Processor). Cada MSP está formado por un módulo multichip que contiene 4 unidades de procesamiento escalar, P-chips, y 4 unidades de caché, E-chips. El entorno de programación utiliza el MSP para pasar el flujo de instrucciones y datos vectoriales a 4 unidades vectoriales "dual-pipe" y a 4 unidades de procesamiento superescalar.  La frecuencia de reloj de cada MSP es de 1,2 Ghz, siendo su rendimiento pico de 19,2 Gflops con aritmética de 64bits. Cada MSP posee 2MB de memoria caché.

Ordenador CRAY-X1E
Ordenador CRAY-X1E

Los procesadores MSP se agrupan en nodos. Cada uno de los nodos está formado por 8 procesadores vectoriales MSP que poseen una memoria compartida de 32GB controlada por unidades M-chip. Dos I-chip en cada nodo controlan el I/O a dispositivos de Entrada/Salida o redes externas a 4,8 GB/s. La figura  siguiente muestra esquemáticamente la configuración de un nodo con 4MSPs. Los nodos están interconectados entre sí formando un hipercubo. El ancho de banda a la red de interconexión es de 51,2 GB/s.

Configuración de un nodo del CRAY-X1E
Configuración de un nodo del CRAY-X1E

Los chips se refrigeran mediante pulverización de fluor inerte líquido (spray) que se recoge, condensa y recircula en un circuito cerrado que intercambia el calor con el exterior en un sistema de enfriamiento por agua.

El sistema operativo es UNICOS/mp con imagen única de sistema en todos los nodos.  Hay 1 nodo de soporte por cada 15 de aplicaciones. El nodo de soporte corre el sistema operativo y los comandos de usuario. El planificador de tareas PSCHED realiza las tareas de emplazamiento, balanceo de carga y  gestión de la ubicación de aplicaciones. PBSpro se utiliza como subsistema batch.  En lo que respecta a aplicaciones paralelas es posible utilizar programas que hacen uso de OpenMP y autoparalelización (dentro de un nodo, en memoria compartida), así como MPI, shmem y Co-Array FORTRAN (para ejecuciones en varios nodos con memoria distribuida).

En su configuración actual, el sistema instalado en AEMET consta de una cabina con un total de 128 procesadores vectoriales MSP repartidos en 16 nodos que proporcionan una potencia pico de cálculo teórica de 2,2Tflops, 512GB de memoria RAM y 9TB de capacidad nominal de espacio en disco local.  En la actualidad, la potencia sostenida por el modelo meteorológico HIRLAM ejecutado en modo MPI es de alrededor de 700Gflops.

El equipamiento adicional del sistema lo constituye una red de área de almacenamiento (Storage Area Network, SAN) heterogénea de clase III, formada por una librería robotizada ADIC escalar 100, de 14,4TB de capacidad y de 24TB en discos FC. El software de control de la SAN es StorNext SUITE de ADIC con clientes para Linux, IRIX, WINDOWS 2000, Solaris y AIX.

El rendimiento pico teórico disponible en AEMET desde el año 2008 es casi 580 veces superior al del anterior sistema de cálculo del entonces Instituto Nacional de Meteorología, el superordenador CRAY C94. Esto ha permitido, entre otros, aumentar significativamente desde entonces la pericia de las predicciones del modelo numérico meteorológico operativo de AEMET, debido fundamentalmente al aumento de su resolución espacial y a la mejora de la descripción del estado inicial atmosférico así como de la representación de los procesos físicos en el modelo.

Sin embargo, la capacidad actual es insuficiente para poder ejecutar en un entorno operativo el nuevo modelo de mesoescala no-hidrostático, Harmonie, desarrollado por los Consorcios de Predicción Numérica del Tiempo europeos ALADIN y HIRLAM, en el que AEMET participa. El nuevo sistema de supercomputación que sustituirá al actual proporcionará unas prestaciones que permitan ejecutar el modelo Harmonie no-hidrostático sobre un área que cubre la Península Ibérica y las Islas Baleares con una resolución de 2,5km en la horizontal y 60 niveles en la vertical para la predicción a corto plazo (hasta 36-48h) en un tiempo adecuado para su utilización en la predicción operativa.

Con objeto de calibrar las necesidades de cálculo necesarias para conseguir que los resultados de una aplicación (el modelo numérico meteorológico en el caso de AEMET) estén disponibles en un plazo de tiempo que permita su utilización operativa, se prepara el código de la aplicación y se somete a una serie de máquinas de referencia variando el número de procesadores. Conforme se aumenta el número de procesadores a utilizar, la aplicación disminuye su tiempo de ejecución. Esta escalabilidad de la aplicación depende del tipo de procesadores, la arquitectura del sistema de supercomputación y la codificación de la propia aplicación.

Pruebas de escalabilidad
Pruebas de escalabilidad

La figura muestra los resultados de las pruebas de escalabilidad realizadas por personal de AEMET utilizando el módulo de predicción del modelo Harmonie en una integración de 12h como aplicación base, en el marco del proyecto de renovación del sistema de supercomputación. Los ordenadores utilizados son los del Centro Europeo de Predicción a Medio Plazo (IBM Power6,  en azul) y del Servicio Meteorológico Finlandés (CRAY XT5, en rojo). La preparación del modelo numérico como aplicación base para este tipo de pruebas forma parte de las actividades de colaboración que se realizan en el Consorcio HIRLAM. Estas pruebas de eficiencia o benchmark las realizan también los ofertantes del servicio de supercomputación en el periodo de licitación del contrato de suministro.

Email
Compartir en Twitter
© AEMET. Autoritzat l'ús de la informació i la seua reproducció citant AEMET com a autora de la mateixa.
Aplicación oficial 'El Tiempo de AEMET' (Android e iOS)
Seguix-nos en Facebook
Seguix-nos en Twitter
AEMET blog.es
Seguix-nos en YouTube
RSS