Vous avez certainement vu un bandeau rouge affiché pendant quelque temps sur toutes les plateformes (HAL, Episciences et Sciencesconf) et annonçant une opération de maintenance programmée le 6 février. De quoi s’agissait-il ?
Ce sont en fait plusieurs opérations qui ont été menées ce jour-là et si vous avez constaté des perturbations, c’est que vous étiez connecté.e à une des plateformes entre 7h et 7h15. Celles-ci n’ont en tout cas duré que quelques secondes.
Évolution de l’infrastructure matérielle
L’infrastructure matérielle a beaucoup évolué en 2023 afin d’améliorer les performances et la sécurité des serveurs. Un serveur physique peut supporter plusieurs machines virtuelles qui gèrent chacune des services. Cela signifie que changer un serveur physique, d’autant plus s’il a une capacité accrue, nécessite la migration et la réorganisation de ces machines virtuelles. 90 machines virtuelles ont ainsi été migrées sans interruption de service courant 2023.
La migration de celles qui supportent les bases de données, par contre, implique l’arrêt de toute mise à jour sur les bases le temps de l’opération, et c’est ce qui a été effectué le 6 février dernier.
Pour information, un serveur ressemble à ça :
Chacun des 3 serveurs achetés en 2023 a une capacité de 1500 Go de mémoire vive.
Interventions sur le réseau
Un autre intervention a été réalisée le même jour, portant sur le réseau : il s’agissait d’opérer le passage à une taille du réseau permettant de gérer plus d’adresses IP. La partie réseau de l’infrastructure a elle aussi beaucoup évolué. Fin 2023, le passage à la fibre a notamment permis d’optimiser le trafic interne. Quant au trafic sortant, il est de 1 à 2 Gb/s.
Des interventions sont régulièrement menées pour intégrer des évolutions afin d’améliorer le service rendu, sans qu’il y ait d’interruption de service.
En quelques chiffres, l’infrastructure c’est 3 switchs et 2 sous-réseaux, environ 194 machines (virtuelles ou physiques), 1 NAS et 38 hyperviseurs (machines physiques hébergeant des machines virtuelles). Pour chacun des services (HAL, Sciencesconf, Episciences, etc.), le CCSD gère une plateforme de production, une de pré-production et une de test.
Ces évolutions de l’infrastructure matérielle s’inscrivent dans le work package 1 du projet Equipex+ HALiance. Ce work package a pour objectif de mettre à niveau et sécuriser l’infrastructure physique de HAL. Dans les faits, cela concerne l’ensemble de l’infrastructure du CCSD et bénéficie à toutes les plateformes.