Bonjour,
La prochaine session du séminaire Performance et Généricité du LRDE
(Laboratoire de Recherche et Développement de l'EPITA) aura lieu le
Mercredi 2 décembre 2009 (14h-16h30) en Amphi 4, KB.
Au programme :
Le processeur CELL : architecture et programmation
-- Jean-Luc Lamotte
Le processeur CELL BE développé par le consortium IBM, Sony et Toshiba a
eu un impact important dans le monde du calcul scientifique mais aussi
dans le monde du jeu. Il est le processeur de base de la première
machine à avoir atteint 1 Pflops et aussi celui de la Play Station 3 de
Sony. Pour arriver à ce niveau de performance, il intègre 9 coeurs
hétérogènes interconnectés par un bus. Le coeur principal (PPE)
appartient à la famille des PowerPC. Les 8 autres coeurs (SPE) sont
spécialisés pour le calcul. Après une présentation détaillée de
l'architecture du processeur, nous développerons son mode de la
programmation : lancement de threads de calcul sur les SPE, échange de
données, programmation SIMD.
Jean-Luc Lamotte est professeur à l'université P. et M. Curie (UPMC).
Ses travaux de recherche au sein du laboratoire d'informatique de Paris
6 (LIP6) dans l'équipe PEQUAN (PErformance et QUalité des Algorithmes
Numériques) du département CALSCI (calcul scientifique) portent sur le
calcul haute performance en intégrant la vitesse de calcul, mais aussi
la qualité numérique des résultats obtenus. Il enseigne notamment le
parallélisme dans la spécialité SAR du master d'informatique de l'UPMC.
http://www-pequan.lip6.fr/~lamotte/
La méthode multipôle rapide sur le processeur Cell : calcul du champ proche
-- Pierre Fortin
La méthode multipôle rapide (Fast Multipole Method, FMM) permet de
résoudre en temps linéaire le problème à N-corps, en astrophysique ou en
dynamique moléculaire par exemple. Nous présentons ici l'implémentation
sur le processeur Cell du calcul du champ proche de la FMM, ce qui
constitue un premier pas vers une implémentation complète de la FMM sur
ce processeur. Nous détaillerons les problèmes rencontrés, au niveau de
l'architecture comme au niveau de l'algorithmique, ainsi que les
diverses optimisations mises en place. Notre implémentation permet de
calculer jusqu'à 8,5 milliards d'interactions par seconde (115,8
Gflop/s) sur un processeur Cell, et jusqu'à 17 milliards d'interactions
par seconde sur un IBM QS20 (230,4 Gflop/s), pour des distributions
uniformes ou non uniformes de particules.
Pierre Fortin est maître de conférences à l'Université Pierre et Marie
Curie dans l'équipe PEQUAN (LIP6) depuis deux ans. Ses travaux de
recherche portent sur le calcul scientifique parallèle haute performance
et sur les simulations numériques pour le problème à N-corps. Depuis
septembre 2009, il est responsable de l'option "Calcul Intensif sur
Nouvelles Architectures Parallèles" à Polytech'Paris-UPMC.
http://www-pequan.lip6.fr/~fortin/
--
Daniela Becker