Nouvelle architecture permettant 1 PetaOp/s sur une puce

20 novembre 2019 //Par A Delapalisse
Nouvelle architecture permettant 1 PetaOp/s sur une puce
L’inventeur d’unités de traitement de tenseurs Groq (Mountain View, Californie) a annoncé ce qui serait la première architecture informatique capable de performances de 1 PetaOp / s (1 000.000.000.000.000 (ou un quadrillion) par seconde) sur une implémentation dans une simple puce unique.

L’implémentation de la nouvelle architecture pour IA, TSP (Tensor Streaming Processor), est selon la société, également capable d’effectuer jusqu’à 250 trillions d’opérations en virgule flottante par seconde (FLOPS).

«Les plus fabricants de GPU les plus en pointe ont indiqué à leurs clients qu’elles espéraient pouvoir offrir une performance PetaOp / s dans les prochaines années alors que Groq l’annonce dès aujourd’hui et établit ainsi une nouvelle norme de performance», déclare Jonathan Ross, Co-fondateur et PDG de Groq. "L'architecture Groq pour applications IA est beaucoup plus rapide que toutes les autres solutions disponibles pour l'inférence, en termes de temps de latence réduit et d'inférences par seconde. Nos interactions avec les premiers clients le confirment."
Selon la société, l’architecture offre un nouveau paradigme permettant d’obtenir à la fois une flexibilité de calcul et un parallélisme massif sans surcharge de synchronisation des architectures GPU et CPU traditionnelles. Cette architecture peut prendre en charge les modèles d'apprentissage automatiques traditionnels et nouveaux et est actuellement utilisée sur les sites de clients sur des systèmes x86 et non x86.

Inspirée par un esprit d’abord logiciel, la nouvelle architecture de traitement plus simple est conçue spécifiquement pour les exigences de performance de la vision par ordinateur, de l’apprentissage automatique et d’autres charges de travail liées à l’IA. La planification de l'exécution se fait par logiciel, libérant ainsi des fontionalités hardware qui seraient autrement dédiées à l'exécution d'instructions dynamique.

Le contrôle strict fourni par l’architecture permet un traitement déterministe particulièrement utile pour les applications où la sécurité et la précision sont primordiales. Comparée aux architectures traditionnelles complexes basées sur des processeurs, des GPU et des FPGA, la puce simplifie également la qualification et le déploiement.

"La solution Groq est idéale pour le traitement "deep learning" des inférences pour un large éventail d'applications", explique Dennis Abts, architecte en chef chez Groq, "mais même au-delà de cette énorme opportunité, la solution Groq est conçue pour une large gamme de charges


Vous êtes certain ?

Si vous désactivez les cookies, vous ne pouvez plus naviguer sur le site.

Vous allez être rediriger vers Google.