Heterogene Strategie auf dem Vormarsch

von: Dave Lammers

Angesichts der Verlangsamung traditioneller Märkte und der Skalierung nach dem Mooreschen Gesetz arbeitet die Halbleiterindustrie hart daran, sich selbst neu zu erfinden, um die Bedürfnisse neuer Märkte wie künstliche Intelligenz, autonome Fahrzeuge, das Internet der Dinge und andere zu erkennen.

Am faszinierendsten ist vielleicht die künstliche Intelligenz, deren Rechenparadigmen sich deutlich von den traditionellen Prozessor-Speicher-Ansätzen unterscheiden können. "Lange Zeit waren Mustererkennung und kognitive Aufgaben wie das Erkennen und Interpretieren von Bildern, das Verstehen gesprochener Sprache und die automatische Übersetzung Schwachpunkte für Computer", sagte Damien Querlioz, ein französischer Forscher, der auf der jüngsten Internationalen Elektronenbautagung in San Francisco über "Emerging Device Technologies for Neuromorphic Computing" sprach.

Seit etwa 2012 hat sich der Fortschritt in der KI beschleunigt, sowohl in der Trainings- als auch in der Inferenzphase, aber der Stromverbrauch ist immer noch eine große Herausforderung, wenn herkömmliche Rechnerarchitekturen verwendet werden. Querlioz, Forscher am französischen Nationalen Labor CNRS, nannte ein anschauliches Beispiel: das berühmte Go-Spiel, das 2016 zwischen Googles AlphaGo und Lee Sedol, einem Weltmeister in diesem Spiel, gespielt wurde. Sedols Gehirn verbrauchte während des Wettkampfs etwa 20 Watt, während AlphaGo schätzungsweise mehr als 250.000 Watt benötigte, um seine CPUs und GPUs am Laufen zu halten.

Seitdem wurden bei Google und anderswo zwar Leistungsverbesserungen vorgenommen, aber die Bemühungen um neue, weniger stromhungrige Geräte für die neuromorphe Datenverarbeitung werden immer intensiver.

Ted Letavic, Senior Fellow für strategisches Marketing bei GlobalFoundries, sagte, er denke über KI in Etappen nach, eine Zeitachse, die von der Verbesserung herkömmlicher Rechentechnologien zu radikal neuen Geräten und Architekturen führt, die viel weniger Strom verbrauchen. Auf der gesamten Zeitachse wird fortschrittliches Packaging eine Schlüsselrolle spielen.

"Wir können bestehende Technologien nutzen und Derivate hinzufügen, indem wir DTCO (Design Technology Co-Optimization) einsetzen, um bis auf die Ebene der Bitzellen zu optimieren", so Letavic. Die Technologen von GF entwickeln Möglichkeiten zur Reduzierung des Stromverbrauchs und zur Steigerung der Leistung für die 14/12-nm-FinFET-Plattform, darunter Dual Work Function SRAMs, schnellere und stromsparende Multiply-Accumulate-Elemente (MAC), Zugriff auf SRAM mit höherer Bandbreite und andere. Die FD-SOI-basierten FDX-Prozesse verbrauchen auch viel weniger Strom, insbesondere wenn Back-Biasing-Techniken eingesetzt werden. Mit diesen Technologien im Werkzeugkasten des Entwicklers können die Kunden laut Letavic "die der KI inhärenten Elemente mit einem viel geringeren Stromverbrauch neu entwerfen, als wenn sie direkt zu 7 nm übergehen würden".

Parallel zu diesen DTCO-Verbesserungen laufen weltweit Forschungs- und Entwicklungsarbeiten für eingebettete Speicher- und In-Memory-Compute-Lösungen auf der Grundlage von Phase-Change-Memory (PCM), Resistive RAM (ReRAM) und Spin-Torque-Transfer-Magnetic RAM (STT-MRAM) sowie FeFET. Ein PCM-basierter Chip, der am IBM Almaden Research Center unter der Leitung von Jeff Welser entwickelt wurde, hat große Fortschritte gemacht, so Querlioz auf der IEDM-Tutorial-Sitzung, und auch STT-MRAM- und ReRAM-basierte KI-Prozessoren sind sehr vielversprechend. "Wir haben jetzt ein riesiges Potenzial, die Elektronik für kognitive Aufgaben und Mustererkennung neu zu erfinden", sagte Querlioz.

Laut Letavic treibt der langfristige Bedarf an einer Reduzierung des Stromverbrauchs, insbesondere bei der Inferenzverarbeitung, eine Vielzahl von Start-ups zur Entwicklung neuer KI-Lösungen an. GF arbeitet eng mit mehreren von ihnen sowie mit den langjährigen Partnern AMD und IBM zusammen.

"Wir können mit DTCO-Verbesserungen des von-Neumann-Computings nur so weit kommen. Der nächste Schritt, der über disaggregierte Logik und Speicher hinausgeht, ist die Umstellung auf Compute-in-Memory und analoges Computing", sagte Letavic. Außerdem müssen die Befehlssatzarchitekturen (ISAs), die der Industrie seit 35 Jahren gute Dienste geleistet haben, durch neue Software-Stacks und Algorithmen ersetzt werden. "Wenn wir zu domänenspezifischen Berechnungen übergehen, muss jemand die Software neu erfinden. IBM hat einige wirklich gute Erkenntnisse über den Software-Stack", sagte er.

"Alle müssen diesen Schritt in Richtung KI gemeinsam gehen. Die Foundries werden Hand in Hand mit den führenden Kunden gehen, und wir können die Algorithmen nicht von der Technologie trennen", sagte Letavic und bezog sich dabei auf die enge Zusammenarbeit bei STCO (System Technology Co-Optimization). "STCO ist eine natürliche Erweiterung von DTCO auf dem Weg in die vierte Ära des Computing. Auf dem Weg zum domänenspezifischen Computing ist dies eine Entwicklung, die wir alle gemeinsam vollziehen werden."

Verpackungen helfen, Kosten zu senken

Während die Fortschritte auf dem Gebiet des Siliziums - einschließlich Dual-Work-Function-Metalle im Gate-Stack, FD-SOI und STT-MRAM - die Leistung verbessern werden, sagt Letavic, dass das Packaging eine ebenso große Rolle spielen wird, da die Unternehmen dazu übergehen, heterogene Bauelemente zu verbinden, die mit dem optimalen Prozess für jede Funktion hergestellt werden. "Ich denke, dass 2,5D und 3D nach 20 Jahren der Diskussion zum Mainstream werden. Wir werden bei der Verpackung eine ebenso große, wenn nicht sogar größere Differenzierung sehen wie bei den Siliziumströmen."

Quelle: GF

Kevin Krewell, leitender Analyst bei Tirias Research, sagte, dass die Arbeit, die mit Advanced Micro Devices geleistet wird, GF einen Vorteil verschafft, wenn Unternehmen zwei oder mehr Chiplets in einem einzigen Gehäuse unterbringen. Zuvor hatten AMD und Intel einen AMD Radeon-Grafikprozessor mit einer Intel-CPU in einem einzigen Gehäuse kombiniert. Jetzt verstärkt AMD seine Epyc-Server-CPU-Linie durch den Einsatz der Infinity-Fabric-Verbindungstechnologie von AMD. Der kommende "Rome"-Serverprozessor wird über mehrere CPU- und Cache-Speicher-Chips verfügen, die mit einem von GF gefertigten 14-nm-Chiplet verbunden sind, das die E/A-Verbindungen zu DRAM und PCI-Bus bereitstellt.

Durch die Aufteilung von Aufgaben und die Verwendung des optimalen Prozesses für jede Funktion werden Chiplets, die über Hochgeschwindigkeitsverbindungen verbunden sind, die Art und Weise verändern, wie Prozessoren für verschiedene Märkte entwickelt werden, sagte Krewell und wies darauf hin, dass Nvidia, Intel und andere Hochgeschwindigkeits-Chip-to-Chip-Verbindungen unterstützen.

"Ich erwarte, dass wir mehr davon sehen werden, wenn wir eine Mischung von Prozessknoten in einem Chiplet-Design verwenden. Vor allem die E/A-Funktionen lassen sich nicht gut auf 7 nm skalieren, und selbst bei 7 nm nehmen diese Funktionen viel Platz in Anspruch. Manchmal ist es sinnvoll, die E/A-Funktionen in einem älteren Chip unterzubringen. In der Vergangenheit wurden PC-Chipsätze in einem N-minus-1-Prozess hergestellt, als Teil einer Strategie zur Auslastung der Produktionsstätten. Es ist sehr sinnvoll, diese Funktionen in den richtigen Prozessknoten einzubauen, der die E/A verarbeiten kann und in dem sie pro Transistor nicht so teuer sind", so Krewell.

Letavic sagte, dass die Systemhersteller eine heterogene Integration fordern, bei der verschiedene Formen des fortschrittlichen Packaging zum Einsatz kommen, wie Interposer, vertikale Through-Silicon-Vias (TSVs), spezielle Laminate, Fan-outs und andere. Diese Strategie wird auch den photonischen Verbindungen zugute kommen, da die Optoelektronik höhere Bitraten liefern kann, als einige elektrische Verbindungen unterstützen können.

Bob O'Donnell, leitender Analyst des Marktforschungsunternehmens TECHnalysis, sagte, dass die Chiplet-Strategie noch einen weiten Weg vor sich hat, bis branchenweite Standards festgeschrieben sind. Bis dahin werden Unternehmen wie AMD und andere ihre eigenen internen Technologien nutzen, um mehrere Chiplets in SoCs zu verbinden.

"Ab einem bestimmten Punkt wird die Komplexität überwältigend, und dann beginnen die Unternehmen, wieder nach Vereinfachung zu suchen. Das Problem besteht darin, ein fruchtbares Ökosystem zwischen mehreren Anbietern zu schaffen, das es den Verpackungsunternehmen ermöglicht, verschiedene Teile von mehreren Unternehmen zu verpacken. Diese Standards sind noch nicht festgeschrieben worden."

O'Donnell sagte, dass das Bestreben, die optimale Technologie für jede Funktion zu verwenden, vor allem durch die hohen Kosten für das Design und die Herstellung großer SoCs in einem 7-nm-Prozess motiviert ist, zum Beispiel.

"Das Grundkonzept von Chiplets besteht ironischerweise darin, dass wir Dinge auseinandernehmen, die in der Vergangenheit integriert waren. Die Industrie war in der Lage, Systeme in weniger Komponenten zu integrieren, bis hin zu SoCs, die fast alles in einem einzigen Chip enthalten. Aber jetzt gibt es eine Verlangsamung, weil es aus technischer Sicht einfach viel schwieriger ist. Die Entwicklungskosten bei 7nm sind extrem hoch, und die Herausforderungen aus Sicht der Fertigung sind einfach verrückt."

Letavic sagte, dass fortschrittliches Packaging Vorteile "auf Chipebene und auf Systemebene" bieten wird. Wir sehen dies bereits in den Rechenzentren. Es wird sich durchsetzen, und es wird noch mehr werden.

Über den Autor

Dave Lammers

Dave Lammers

Dave Lammers schreibt für Solid State Technology und ist Blogger für die Foundry Files von GF. Dave Lammers begann über die Halbleiterindustrie zu schreiben, als er Anfang der 1980er Jahre im Tokioter Büro von Associated Press arbeitete, einer Zeit des schnellen Wachstums der Branche. 1985 wechselte er zur E.E. Times, für die er in den folgenden 14 Jahren von Tokio aus über Japan, Korea und Taiwan berichtete. Im Jahr 1998 zogen Dave, seine Frau Mieko und ihre vier Kinder nach Austin, um ein texanisches Büro für die E.E. Times einzurichten. Als Absolvent der University of Notre Dame erwarb Dave einen Master-Abschluss in Journalismus an der University of Missouri School of Journalism.