Ralf Gruber - e-mail: Ralf.Gruber@epfl.ch , SIC-EPFL

& Marie-Christine Sawley - e-mail: Marie-Christine.Sawley@epfl.ch, SIC-EPFL

Nous avons déposé au début de l'année une demande de soutien à la CTI (Commission pour l'Innovation et la Technologie) pour ce projet d'envergure. Pour le mener à bien, l'EPFL s'est assurée la participation de plusieurs partenaires de qualité: en sus de SCS et de DIGITAL (lire encadré en page 12), nous avons pu rassembler des spécialistes de l'ETHZ, du CSCS/SCSC, d'Oracle, de Sandia National Laboratory, d'Oak Ridge National Laboratory et un partenaire de McKinsey qui vont à divers degrés développer, adapter, tester, évaluer les machines prototypes et contribuer à les amener à maturité. Une première tranche (juin 98 à mai 99) du projet a été accordée.
Dans un marché où l'offre ne répond que partiellement à la demande, ce projet ouvre naturellement des perspectives prometteuses de commercialisation, c'est pourquoi un groupe agréé par la Direction de l'EPFL travaille actuellement à la création d'une entreprise pour le transfert de technologie des machines qui sont le résultat du projet. Ce startup est d'ailleurs une des conditions préalables posées par la CTI pour l'octroi de la seconde tranche de financement (juin 99 à mai 2000).
A l'heure actuelle, le projet Swiss-Tx est, à notre connaissance, le seul programme de développement d'ordinateur parallèle de puissance en Europe.
Dans un contexte de diminution constante des budgets informatiques, ces machines au prix de revient très intéressant permettent de continuer à offrir les ressources d'ordinateurs puissants -installés centralement ou dans les départements- aux chercheurs et ingénieurs d'une institution de recherche et d'enseignement comme la nôtre. En cela, la forte implantation de ce projet à l'EPFL s'inscrit dans la continuité du développement de compétences en calcul parallèle avancé, commencé dès 1993. Par son soutien actif , l'Ecole encourage ainsi la créativité de ses ingénieurs et chercheurs sur ces architectures qui préparent l'avenir.
Pour la réalisation et l'habillage des systèmes complets, il nous fallait recruter les compétences nécessaires. La partie clé de l'intégration des boxes du marché est bien évidemment l'existence d'un système de communication efficace. La Suisse a la chance d'avoir le groupe du Prof. Gunzinger de l'ETHZ et son entreprise SCS qui ont d'importantes compétences dans ces systèmes de communication. De plus, tout comme l'EPFL, le CSCS/SCSC a développé des logiciels pour des machines parallèles qu'il peut maintenant adapter à l'architecture des Swiss-Tx. Matériel et logiciel de base standard, réseau de communication exclusif et performant, management de ressources, environnement de programmes, test et évaluation par des applications scientifiques reconnues, chaque maillon contribue par sa propre valeur ajoutée à l'intégration finale de ce produit qui ne dément pas son label suisse clairement annoncé.
Avant de rentrer dans plus de détails sur les divers systèmes prévus dans le projet, nous allons donner un bref survol de la pierre angulaire du concept Swiss-Tx: le réseau de connexion entre les boxes.
La liaison rapide entre les boxes des machines Swiss-T0 et Swiss-T0(Dual) est garantie par l'EasyNet, commercialisé par SCS. Pour les machines Swiss-T1 et Swiss-T2, un crossbar 12x12 est en construction à l'ETHZ et au SCS. Ce crossbar va augmenter la bande passante par au moins un ordre de grandeur et réduire le temps de latence. Les deux réseaux se basent sur le concept du write-only, c.à.d. un processeur écrit directement dans la mémoire d'un autre processeur sans faire de copies intermédiaires. Une interface de communication rapide FCI (Fast Communication Interface) implémente certaines instructions de communication en hardware.
Pour tirer profit de ce concept performant, un sous-ensemble nommé MPI-lite des instructions standards de MPI est directement traduit en instructions FCI sans que l'utilisateur ne doive s'en occuper. En fait, MPI comporte environ 150 instructions, dont la plupart ne sont utilisées que très rarement, et son implantation n'est pas toujours faite d'une façon efficace, ce qui résulte souvent en des temps de latence trop grands. Grâce à la définition des instructions de base MPI-lite et par leur codage en hardware le temps de latence mesuré sur la machine Swiss-T0 tombe à 12µs (5µs pour FCI) en comparaison de 500µs si la communication se fait avec MPICH par le Fast Ethernet installé sur la Swiss-T0. Le réseau EasyNet atteint une bande passante de 35 MByte/s comparé à 10 MByte/s pour le Fast Ethernet. Il est prévu que pour fin 98 toutes les instructions de MPI seront disponibles. Dans sa version 1.0, MPI-lite inclut les instructions suivantes.
. MPI_Init, MPI_Finalize, MPI_Wtime, MPI_Abort . MPI_Size, MPI_Rank . MPI_Send, MPI_Ssend (restrictions plus bas) . MPI_Recv, MPI_IRecv (restrictions plus bas) . MPI_Wait . MPI_Barrier . MPI_Bcast (non optimisé encore, si possible ne pas utiliser) . MPI_Sendrecv
Ces instructions s'exécutent avec les restrictions suivantes:
La prochaine version contiendra également les fonctionalités suivantes:
Certains instructions MPI-II (MPI IO par exemple) demandées par les utilisateurs des machines Swiss-Tx seront ajoutées à terme.
L'approche que nous avons choisie prévoit de découpler le calcul et la communication, ce qui nous rend indépendant du fournisseur et du système d'exploitation. Ainsi, l'IFE de l'ETHZ a choisi de connecter par un EasyNet les 8 processeurs Pentium Pro qui tournent sous Linux, Swiss-T0 a des Digital Alpha avec DIGITAL Unix, Swiss-T0(Dual) aura des Alpha avec Windows NT. Comme particularité, les machines Swiss-Tx ont un système de fichiers distribués et un système d'archivage intégré par noeud de huit boxes, ce qui garantit que tous les composants (processeurs, mémoire, disques, archivage) sont multipliés par le nombre de noeuds installés: on peut donc parler d'une approche réellement extensible, scalable.
Le projet prévoit l'installation de quatre machines prototypes dont la dernière devrait atteindre un niveau de maturité tel qu'elle pourra être mise à disposition d'une communauté d'utilisateurs dans un centre de calcul. Le tableau suivant donne les paramètres des prototypes planifiés.
La première machine, la Swiss-T0, a déjà été installée au Service informatique central de l'EPFL en décembre 97 et acceptée fin mai 98 après avoir satisfait les conditions d'acceptation standard de l'EPFL. Ces conditions strictes demandent notamment que la machine inclue le système d'exploitation DIGITAL Unix, les compilateurs C, C++, F77, F90 et HPF, une librairie de communication basée sur MPI, les librairies mathématiques DXML, BLAS, LAPACK et SCALAPACK et doive atteindre une certaine performance. A l'exception d'un test particulier où la performance n'a pas pu être atteinte à cause de la mémoire cache trop petite, la performance du Swiss-T0 dépasse légèrement celle de l'Origin2000 de SGI et se compare bien avec le Cray-T3E (en prenant toujours 8processeurs de chacun de ces systèmes). La plupart des essais ont été faits en passant par le Fast Ethernet. Une description plus détaillée sur l'utilisation de l'EasyNet plus performant se trouve dans un chapitre spécial. Actuellement, la machine Swiss-T0 est ouverte à tous les ingénieurs qui sont impliqués dans le projet Swiss-Tx. Sa configuration est schématisée en Fig. 1.
Une demande d'octroi a été faite début juin pour le deuxième prototype Swiss-T0(Dual) qui devrait tourner sous Windows NT à partir d'août. Comme autre nouveauté, les boxes DIGITAL contiendront deux processeurs Alpha. La machine aura donc 16 processeurs toujours liés par un Fast Ethernet et un EasyNet. Il est prévu pour fin 98 de remplacer l'EasyNet par un crossbar 12x12 et les processeurs Alpha 21164 par des Alphas 21264 qui devraient être deux à trois fois plus performants. Si les essais sous Windows NT montrent qu'il y a des problèmes non solubles dans un délai acceptable, la machine sera basculée sous DIGITAL Unix et ouverte à l'exploitation.
La troisième machine, la Swiss-T1 (Fig. 2), est prévue initialement avec 64 processeurs (4 noeuds de 8 boxes à 2processeurs). Elle sera basée sur des processeurs Digital Alpha 21264 qui auront une bande passante de 8 fois celle des processeurs Alpha actuels. Pour recevoir le financement de la deuxième tranche du projet CTI, cette machine doit déjà atteindre un niveau de fiabilité d'utilisation suffisante pour être acceptée par une large communauté d'utilisateurs. Une fois acceptée par l'EPFL, la machine pourra être étendue à 128processeurs.
Fig. 3: Une des architectures possibles du Swiss-T2 avec 16 noeuds chacun ayant 32 processeurs à 2 Gflop/s. Une telle machine atteignant un Teraflop/s est planifiée pour début2000
La machine Swiss-T2, prévue pour début 2000, devrait contenir 512 processeurs, 256 GBytes de mémoire vive, plus de 5 Tbytes de disque et 16 TBytes pour l'archivage. Une des architectures possibles de cette machine est présentée dans la figure3.
Le projet Swiss-Tx permet de valoriser le savoir-faire des groupes suivants (après chaque responsable d'institut figure le nombre d'ingénieurs émargeant au financement accordé par la CTI pour un total de 500 hommes/mois):
Le management du projet Swiss-Tx s'articule comme suit:
In fine, les décisions de la Direction de l'EPFL se baseront sur les propositions du Managing Board et sur les recommandations d'un groupe formé d'ingénieurs et d'informaticiens extérieurs au projet Swiss-Tx, piloté par M. Michel Reymond et chargé de l'évaluation des offres, des systèmes et de la veille technologique.
Le projet Swiss-Tx recèle un potentiel important qui peut déployer ses ramifications sur de nombreux domaines.
Tout d'abord il intègre et adapte le savoir-faire suisse en matériel, en logiciel de base et applicatif pour réaliser des machines massivement parallèles basées sur des boxes. Il offre la possibilité de rester à la pointe en calcul scientifique de haute performance dans une période difficile de diminution constante du budget informatique des institutions financées par les fonds publics.
Dans un environnement de plus en plus demandeur de puissance et d'intelligence de traitement de l'information, nous pouvons très grossièrement distinguer trois catégories d'utilisateurs:
Traditionnellement, les systèmes HPC ont jusqu'ici plutôt répondu à la demande des deux premières catégories d'utilisateurs. Porté par un concept réellement novateur, l'acceptation de Swiss-Tx par le troisième segment pourrait être importante et ouvrir d'intéressantes perspectives dans de nouveaux marchés.
Alors que notre économie perçoit un souffle de renouveau bénéfique, et si les efforts pour faire démarrer l'entreprise aboutissent, des emplois seront créés et le transfert technologique des hautes écoles vers le monde industriel effectif.
Les hautes écoles de ce pays réunissent d'excellentes conditions pour devenir un exemple international pour le développement économique et social stimulé par le transfert de la haute technologie fruit de leur recherches. Elles ont tous les atouts pour jouer un rôle important sur la scène nationale et internationale: leurs compétences, leur infrastructure, les outils, et leur esprit d'ouverture et de coopération. Swiss-Tx les réunit toutes pour un projet gagnant.
| retour au sommaire du Flash informatique no 6/98 |
| retour à la page principale des Flash informatique |
| Vos commentaires |
| © FI-6 du 7 juillet 1998 |