FI6/98

Serveurs centraux T3D et Origin2000: Quelques nouvelles

par Jean-Michel Chenais, SIC, e-mail: Jean-Michel.Chenais@epfl.ch

La section Exloitation du SIC gère actuellement cinq serveurs de calcul: Pascal (serveur scalaire/vectoriel), T3D (serveur parallèle), Merope (successeur de Pascal), Orion et Eridan (serveurs parallèles). Cet article a pour but de rappeler les principales caractéristiques des serveurs T3D et Origin2000, et de brièvement relater quelques nouvelles.

T3D

Ordinateur massivement parallèle, à 256 processeurs, acquis en 1994 dans le cadre du projet PATP et du contrat de recherche entre l'EPFL et Cray Research. Bien rodé depuis plusieurs années, ce serveur tourne depuis de nombreux mois pratiquement très près des 100% de sa capacité globale de production.

Etant l'un des premiers ordinateurs massivement parallèles de cette taille sur le marché, il a fallu mettre au point avec les moyens du bord une méthode de sélection et de traitement des travaux afin d'optimiser au mieux les ressources de la machine. En effet, l'OS du T3D et le système batch NQE en particulier, tels que mis à disposition par Cray Reseach n'offraient que des primitives rudimentaires à partir desquelles un outil de gestion fiable et efficace a pu et dû être développé et mis en place.

L'accès aux processeurs du T3D est basé sur la partition virtuelle des ressources entre tous les travaux. Cette méthode permet de garantir l'accès exclusif aux ressources demandées (nombre de processeurs, volume de mémoire distribuée) jusqu'à la fin du travail, dès que celles-ci sont attribuées (space sharing).

Cette méthode garantit entre autres avantages la reproductibilité des temps d'exécution, condition essentielle pour faciliter la mesure de l'efficacité des codes parallèles et leur optimisation.

Pendant la durée du projet PATP, période consacrée au développement de nombreux codes, l'usage du T3D en interactif était essentiel et indispensable (pour des tests, sessions de mise au point, debug, etc.): ainsi jusqu'à 64 processeurs pouvaient être réservés en production pour l'interactif.

Depuis la fin de la période PATP, le nombre de projets sur T3D a diminué quelque peu: seuls tournent encore actuellement les gros codes de production. Pratiquement aucun nouveau développement n'est entrepris, et l'interactif a aussi fortement diminué (représentant moins d'un pour cent de la production totale sur un mois).

En conséquence, il a fallu adapter l'agencement des travaux.

Actuellement, les travaux batch sont sélectionnés et forcés automatiquement en machine afin d'occuper immédiatement une ressource de même type que celle qui se libère, sans plus tenir compte de certaines limites traditionnelles (priorité, âge du job, limites par usager, etc.).

Par ailleurs, une procédure automatique d'accès à l'interactif a été mise en place: un certain nombre de processeurs sont ainsi automatiquement mis à disposition de l'interactif dès que l'usager lance une application interactive sur T3D. Cette façon de faire permet de dédier les 256 processeurs au batch tant que manifestement aucune activité interactive n'a lieu, tout en laissant ouvert l'accès à l'interactif le cas échéant.

A noter enfin que les fenêtres de passage pour les jobs demandant 128 processeurs ont été, sur demande des utilisateurs, largement agrandies, pendant les nuits et les week-ends. La demande pour ce type de ressource reste donc toujours forte. Pour ces derniers mois, les jobs à 64 et 128 processeurs représentent plus de 80% du volume total de production calcul du T3D.

Le T3D, ainsi que Pascal, continuent pour le moment leur exploitation, et aux dernières nouvelles, jusqu'à la fin de l'année 1998.

Les serveurs successeurs sont: les machines Origin2000 (Orion et Eridan), le J90 (Merope), et les machines expérimentales Swiss-Tx.

Les serveurs Origin2000 (Orion et Eridan)

Ces nouvelles machines parallèles, issues de la compagnie Silicon Graphics sont Orion, (32 processeurs MIPS R10000 à 195 Mhz, 6 gbytes) et Eridan, (38 processeurs, 9 gbytes). Actuellement, la première tourne principalement en mode interactif (développement et tests) tandis que la deuxième est dédiée au batch (production contrôlée).

Pour mémoire, ces 2 serveurs tournent sous Irix 6.4. Ce type de machine est quelque peu hybride : chaque noeud est constitué de 2 cartes-mères à 2 CPUs communiquant avec une mémoire locale par un système de cross-bar (hub), que l'on peut interconnecter entre eux suivant une topologie de type hypercube. Même si la mémoire est physiquement distribuée, l'espace d'adressage est commun à toute la machine: le système est de type numa, pour non-uniform memory access, et la machine est dite shared memory.

La parallélisation se fait par PVM ou MPI, ou implicitement à l'aide des options de parallélisation automatique des compilateurs.

Ces 2 serveurs sont censés recevoir les applications parallèles du T3D.

A noter la mise en place récente du système dit Modules Package sur ces 2 serveurs. Il permet un accès aisé aux différents ensembles de produits mis à disposition, et regroupés sous les rubriques telles que MPT, MIPSpro, NQE. Les comptes utilisateur, à l'aide de ces utilitaires, sont définis d'office de façon que les variables d'environnement (telles que PATH, MANPATH, LD_LIBRARY, PVM_ROOT, PVM_ARCH, etc.) donnent immédiatement accès aux versions les plus récentes des produits. L'utilisateur n'est plus obligé de définir ces variables, et ne devrait plus le faire lui-même.

Des tests ont été dernièrement entrepris sous Irix 6.5, sur une machine 8 processeurs aimablement mise à disposition par Cray/SGI. Ces tests ont surtout porté sur les nouveaux produits actuellement développés sous ce système. Ils montrent une évolution intéressante des schedulers, de type prédictif et space sharing. Actuellement, il est possible d'envisager, dès l'installation des prochaines releases, de gérer les serveurs Origin de façon que les ressources demandées par les utilisateurs soient pré-réservées et attribuées de façon exclusive à chaque application (à la T3D).

Pour conclure, deux mots sur le système d'information installé sur Orion et Eridan (commande info): le titre de chaque nouvel article est affiché pendant la séquence de connexion (login), et demeure affiché tant qu'il n'a pas été lu, et qu'une certaine période de temps ne s'est pas écoulée (modulable par l'utilisateur, mais fixée par défaut à 14 jours). Lisez régulièrement ces articles, ils vous tiennent au courant des dernières nouveautés concernant les serveurs Origin2000, et peuvent vous apporter des informations utiles !


retour au sommaire du Flash informatique no 6/98
retour à la page principale des Flash informatique
Vos commentaires
© FI-6 du 7 juillet 1998