Tipps & Praxis

Neural Accelerators: Der Turbo für KI-Aufgaben

Der neue M5-Chipsatz von Apple verfügt über sogenannte Neural Accelerators in der GPU – doch was leisten sie eigentlich?

Von Sven T. Möller 16.06.2026 - 11:00 Uhr

Apples M5-Chip stellt gegenüber dem M4 einen deutlichen Sprung dar und bietet bis zu 30 Prozent mehr Grafikleistung sowie bis zu 15 Prozent höhere Multithread-Performance beim 10-Kern-CPU-Modell. Als er als Herzstück des neuen 14-Zoll-MacBook Pro, des iPad Pro und von Apple Vision Pro vorgestellt wurde, horchte die Tech-Branche auf – auch wegen der integrierten Neural Accelerators.

Sommer-Angebot

Turbo Boost

Sowohl der M4 als auch der M5 nutzen eine Neural Engine mit 16 Kernen, doch laut Geekbench AI ist die des M5 rund zehn Prozent schneller. Da KI-Aufgaben insgesamt bis zu viermal schneller ausgeführt werden, wird deutlich, dass die Neural Accelerators einen entscheidenden Beitrag leisten und einen Großteil der Arbeit übernehmen.

Diese machen einen Unterschied – aber sind nicht ganz neu. Im September 2025 stellte der Konzern aus Cupertino den A19 Pro für die iPhone-17-Serie vor; auch dieser Chip verfügt über Neural Accelerators. Wie beim M5 sind sie in jeden GPU-Kern integriert und steigern nicht nur die Grafikleistung, sondern auch die On-Device-Performance für Künstliche Intelligenz (KI).

Apple nannte konkrete Zahlen. Demnach liefert die 10-Kern-GPU des M5 mehr als die vierfache GPU-Spitzenleistung im Vergleich zum M4 und sogar mehr als das Sechsfache der Leistung für KI-Berechnungen gegenüber dem M1. Möglich wird das durch die gezielte Optimierung der Matrixmultiplikation – einer mathematischen Operation, die grundlegend für Künstliche Intelligenz, maschinelles Lernen und moderne Rechenprozesse insgesamt ist.

Laut Apple ist nun jeder Rechenblock des aktuellen M5 für KI optimiert. (Bild: Apple)

Matrixmultiplikation kennt man vielleicht aus der Schule: Dabei werden Zahlenfelder, sogenannte Matrizen, nach festen Regeln miteinander multipliziert. KI-Modelle arbeiten mit ganzen Schichten solcher Matrizen, weil sich Daten damit besonders effizient strukturieren lassen. So können sehr viele Berechnungen in einem einzigen Schritt ausgeführt werden. Durch das Erkennen von Mustern und das Treffen von Vorhersagen sind Machine-Learning-Modelle in der Lage, Aufgaben wie Bilderkennung oder Sprachverarbeitung zu übernehmen. Für Tech-Unternehmen lautet das Ziel dabei immer: diese Prozesse so schnell wie möglich auszuführen.

Verteiltes KI-Computing

Die Einführung von Neural Accelerators im A19 Pro und im M5 ist Teil einer umfassenderen Hinwendung zu verteiltem KI-Computing. Bei Apple wird die KI-Last nicht vollständig von der Neural Engine übernommen, sondern auf die GPU verteilt. Das ist sinnvoll, weil Workflows so nicht ständig durch eine einzelne Recheneinheit laufen, wo Engpässe entstehen können. Stattdessen lassen sich Aufgaben auf verschiedene GPU-Kerne verteilen, was das System effizienter und schneller macht.

Intels Core-Ultra-Prozessoren sind darauf ausgelegt, eine hohe Leistung bei Aufgaben rund um künstliche Intelligenz zu liefern. (Bild: Intel)

Auch die Konkurrenz setzt auf GPUs mit Hardwarebeschleunigung für KI-Workloads sowie auf dedizierte Neural Processing Units (NPUs). Intels Core-Ultra-Chips verfügen über KI-Beschleunigung, bei der CPU, GPU und NPU zusammenarbeiten. Die Anforderungen von KI sorgen dafür, dass Chip-Hersteller nach Wegen suchen, Leistung und Effizienz auszubalancieren. Eine Kombination aus spezialisierten Beschleunigern und universellen Rechenkernen ist dabei ein zentraler Ansatz.

Verarbeitung auf dem Gerät

Apple Intelligence verarbeitet solche Daten auf zwei Arten: direkt auf dem Gerät oder durch das Senden an ein entferntes Intelligenzsystem namens Private Cloud Compute (PCC). Beide Methoden gelten als sicher und datenschutzfreundlich; Apple bezeichnet PCC sogar als „die fortschrittlichste Sicherheitsarchitektur, die jemals für Cloud-KI im großen Maßstab eingesetzt wurde“. Dennoch bevorzugt Apple die Verarbeitung auf dem Gerät selbst und spricht hier vom „Grundpfeiler für die Sicherheit und den Schutz von Nutzerdaten“. Die Neural Accelerators tragen entscheidend dazu bei, weil sie es ermöglichen, deutlich mehr Berechnungen direkt auf unterstützten Geräten auszuführen.

Johny Srouji, Apples Senior Vice President für Hardware Technologies, erklärte dazu: „Mit der Einführung von Neural Accelerators in der GPU liefert der M5 einen enormen Leistungsschub für KI-Workloads.“ Tatsächlich beschleunigt die Technologie die Verarbeitung KI-gestützter Abläufe deutlich und ermöglicht es, große Sprachmodelle lokal auf dem Gerät auszuführen, was die Abhängigkeit von Cloud-Infrastrukturen senkt.

Die Neural Accelerators sorgen dafür, dass die auf Diffusionsmodellen basierende Bildgenerierung direkt auf dem Gerät – etwa in Apps wie „Draw Things“ – deutlich schneller abläuft. (Bild: Apple)

Apple zufolge ermöglicht die Technik auch das schnellere Ausführen sogenannter Diffusionsmodelle, die vor allem bei Computer-Vision-Aufgaben und der Bildgenerierung zum Einsatz kommen. Da diese auf physikalischen Prinzipien basieren, sind Diffusionsmodelle besonders rechenintensiv. Eine GPU, die KI-Modelle effizient direkt auf dem Gerät ausführen soll, muss daher Milliarden von Berechnungen pro Sekunde bewältigen und Rechenpfade mit geringerer Genauigkeit wie FP16 (16-Bit-Gleitkomma) oder INT8 (8-Bit-Integer) unterstützen.

Der A19 Pro und der M5 sind dafür optimiert. Ersterer basiert auf der Apple-10-Architektur, die die FP16-Leistung gegenüber früheren Generationen verdoppelt, während selbst der Basis-M5 FP16-Berechnungen schneller ausführt als der M4 Pro. Das bedeutet, dass unterstützte iPhones und Macs Apps wie „Draw Things“ ausführen können – eine Bildgenerierungs-KI, die vollständig offline arbeitet.

Arbeitsteilung

Die Neural Accelerators können über Apples APIs Machine-Learning-Frameworks ausführen und übernehmen so Aufgaben wie Frame-Generierung und Grafik-Upscaling mit MetalFX. Bei früheren Apple-Silicon-Chips hätte das die Neural Engine erledigt – die Entlastung gibt ihr Raum für andere Aufgaben.

Zukunft beschleunigen

Entwickler können die Neural Accelerators gezielt nutzen, da sie sich direkt über die mit Metal 4 eingeführten Tensor-APIs programmieren lassen. Die native Unterstützung von Tensoren ermöglicht es, Matrixmultiplikationen direkt aus Compute-Shadern auf der GPU auszuführen, was mehr Kontrolle und höhere Geschwindigkeit bei KI- oder grafikintensiven Aufgaben bringt. Zudem ist die GPU-Architektur eng mit Apples weiteren Frameworks wie Core ML und Metal Performance Shaders verzahnt, sodass Apps insgesamt von Leistungsgewinnen profitieren.

Da die Neural Accelerators durch die Neural Engine im A19 Pro und im M5 ergänzt werden, bringen Apples Fortschritte enorme Rechenleistung direkt zu dir. Laut Apple lassen sich damit bestimmte Aufgaben schneller und effizienter erledigen, etwa das Erstellen einer Persona oder das Umwandeln von 2D-Fotos in räumliche Szenen auf der Apple Vision Pro. Auch Image Playground und andere KI-Werkzeuge werden spürbar beschleunigt. Die GPU ins Zentrum der KI-Verarbeitung zu rücken, dürfte Apple Intelligence über Jahre hinweg zugutekommen.

Sven T. Möller // Layouter & Redakteur

Wenn jemand bei der Mac Life Ordnung ins Chaos bringt, dann ist es Sven T. Möller – und das gleich in doppelter Hinsicht. Als Layouter gibt er jeder Ausgabe ihre unverwechselbare Gestalt, als Redakteur sorgt er dafür, dass Apple-Themen mit der nötigen Tiefe behandelt werden. Sven ist seit Mitte der 2000er Jahre an Bord und damit eines der echten Urgesteine des Teams. Smarthome beschäftigt ihn als Eigenheimbesitzer mit besonderer Ernsthaftigkeit – und gelegentlich auch Frustration. Außerdem ist er mit Leidenschaft Musikhörer, wobei „hören“ bei Sven gerne auch als „beschallen“ interpretiert werden darf: Tests etwa für Bluetooth-Lautsprecher verantwortet er, frei nach dem Motto „je größer und lauter, desto besser“. Sven ist Mitbegründer und Co-Host des Apple-Podcasts Schleifenquadrat.