Intel Xe HPC und Intel Ponte Vecchio stoßen in neue KI-Sphären vor

geschätzter Leseaufwand: 4 Minuten

Ob in der Krebsforschung, in der Entwicklung umweltverträglicher Treibstoffe oder zum Erforschen des Weltalls: Überall dort, wo extrem leistungsfähige Rechner benötigt werden, will und wird Intel eine noch bedeutendere Rolle einnehmen. Dies soll mit einer Architektur gelingen, die sich Intel Xe HPC nennt. Was es damit auf sich hat, welche Beschleuniger damit einher gehen und welches erste Projekt davon profitieren wird, steht in diesem Beitrag.

Im Grunde ist es recht einfach: Basierend auf dem Wissen, das Intel über die Jahre mithilfe des skalierbaren Intel Xeon Prozessors erworben hat, wird in diesem Jahr die vierte Generation dieser Hochleistungs-CPU den Markt erklimmen. Gepaart wird dieses Stück Silizium mit einer neuen GPU-Architektur namens Intel Xe HPC und einer High-Performance-GPU, die sich Intel Ponte Vecchio nennt. In Summe soll das Supercomputer ermöglichen, die erstmals in einen Leistungsbereich vorstoßen, der in diesem Ausmaß bisher nicht wirklich denkbar war. Zumal sie im Grunde auf einer herkömmlichen Mikroprozessortechnik basieren. Nun ja, nur eben ein wenig leistungsfähiger als der klassische Desktop-PC.

[irp posts=“168611″ ]

Mit der Intel Xe HPC Architektur in neue 3D-Sphären

Intel hat schon immer ihre eigenen GPUs auf den Prozessoren verbaut, allerdings gab und gibt es Verbesserungspotential in Sachen Bandbreite und Rechenleistung. Diesen Umstand will der Chiphersteller gerne beheben, denn gerade in den zunehmend rechenintensiven Anwendungen aus den Bereichen KI und Machine Learning kommt es auf jedes einzelne MegaFLOP an.

Daher wurde eine vollständig neue GPU-Architektur entwickelt, die so performant werden soll, dass sie vorhandenen Technologien um Längen überlegen sein kann. Herausgekommen ist die Intel Xe HPC-Architektur, die genau die Leistungsdaten ermöglicht, die vor allem in Supercomputern erforderlich sind. Dabei setzt Intel auf bekannte und neue Techniken, auf denen die Xe HPC-Architektur basiert.

Dazu zählen unter anderem die sogenannten Xe-Kerne, in denen die Berechnungen stattfinden. Hierfür stattet Intel diese Einheiten mit jeweils 8 Vektor- und Matrix-Einheiten aus, sowie einem Cache, der 512 Kilobyte groß ist. 16 dieser Xe-Kerne ergeben eine sogenannte Slice, 4 dieser „Scheiben“ ergeben einen Stack. In Summe ermöglicht das bis zu 64 Xe-Kerne und 64 Raytracing-Einheiten. Darüber hinaus werden Stack-Paare möglich sein, woraus sich in Summe 8 Slices, 128 Rechenmodule und 8 Speicher-Controller ergeben.

[irp posts=“168685″ ]

Intel Ponte Vecchio ermöglicht bahnbrechende 3D- und KI-Berechnungen

Aus all diesen Zutaten und Komponenten setzt sich eine Intel’sche Hochleistungs-GPU zusammen, die viel mehr ist als nur ein typischer Grafikbeschleuniger. Ihr Name: Intel Ponte Vecchio. Ihre Leistungsdaten: beeindruckend.

Konkret wird diese SoC-Komponente aus mehr als einer Milliarde Transistoren und 47 verschiedenen Komponenten (sogenannten Tiles) bestehen, die allesamt mithilfe fünf unterschiedlicher Fertigungsverfahren gefertigt werden sollen. Darüber hinaus soll es möglich sein, die Leistungsfähigkeit dieser GPU an die jeweiligen Bedürfnisse der zugrunde liegenden Anwendungen anzupassen. Intel spricht bei der einfachsten Fertigungsvariante von einer Rechenleistung, die mit 45 TFLOPs beziffert wird. Eine enorme Zahl für ein Stück Silizium.

Intel Ponte Vecchio auf einen Blick

Intel Ponte Vecchio meets Aurora Supercomputer

Damit wird auch schnell klar, dass Intel Xe HPC und Intel Ponte Vecchio vor allem in den schnellsten Supercomputern des Planeten zum Einsatz kommen werden, die man sich nur vorstellen kann. Solch ein HPC-Computer soll im Argonne National Laboratory stehen und dort einer Vielzahl von Wissenschaftlern gute Dienste leisten. Dieses in der Nähe von Chicago beheimatete Forschungsinstitut ist direkt dem Energieministerium der Vereinigten Staaten unterstellt. Damit dürfte direkt klar werden, in welchen Anwendungsbereichen der Aurora Supercomputer und Intel Ponte Vecchio zum Einsatz kommen sollen.

[irp posts=“70247″ ]

Die Rede ist von der Erforschung neuer Energiequellen, von dem Entwickeln leistungsfähiger Katalysatoren für saubere Treibstoffe, und vieles mehr. Hierfür soll Aurora eine Rechenleistung aufweisen, die sich im Bereich von ExaFLOPS bewegen wird. Nur mal zur Einordnung: Ein ExaFLOP entspricht 10 hoch 18 FLOPS, also Fließkommaberechnungen pro Sekunde. Das sind 1.000 PetaFLOPS. In diesen Größenordnungen bewegen sich die aktuell schnellsten Supercomputer wie der Fugaka, der derzeit eine Rechenleistung von knapp einer halben Million TeraFLOPS schafft. Und das mit einem deutlich höheren Energieaufwand.

Aurora Supercomputer auf einen Blick

Alles in allem wird also dieses Gespann aus dem skalierbaren Intel Xeon Prozessor, der Intel Ponte Vecchio GPU und der Kreativität vieler Wissenschaftler für neue, bahnbrechende Lösungen sorgen. Für ein besseres Morgen.

[irp posts=“158337″ name=“Darum sind Intel und die Künstliche Intelligenz (KI) ein gutes Team“]

Mehr Informationen zum Aurora Supercomputer in Videoform

Disclaimer: Für das Verfassen und Veröffentlichen dieses Blogbeitrags hat mich die Firma Intel beauftragt. Bei der Ausgestaltung der Inhalte hatte ich nahezu freie Hand. 

Schreibe einen Kommentar