GTC 2026: Nvidia setzt 1.000 Milliarden Dollar auf die Ära der Inferenz
Jensen Huang gibt Auftragseingänge von 1.000 Milliarden Dollar bis 2027 bekannt. Hinter der Zahl vollzieht sich ein strategischer Wandel: KI wird nicht mehr trainiert, sondern ausgeführt.

1.000 Milliarden Dollar Auftragsvolumen bis 2027. Diese Zahl verkündete Jensen Huang am Sonntagabend auf der Bühne der GTC 2026 in San Jose. Das Volumen entspricht einer Verdopplung gegenüber dem Vorjahr.
Zunächst aber eine Erklärung zum Begriff im Titel. Was bedeutet Inferenz? Beim Training eines KI-Modells handelt es sich um einen einmaligen Aufwand: Milliarden von Datenpunkten werden verarbeitet, damit das Modell lernt. Massiv, aber zeitlich begrenzt. Die Inferenz ist das, was danach kommt. Das Modell läuft, antwortet, handelt, kontinuierlich, für Millionen von Nutzern gleichzeitig. Ein Wasserhahn, der rund um die Uhr offen steht. Und langfristig ist es die Inferenz, die den Großteil der Energie und Rechenkapazität verbraucht. Nicht das Training.
Was Jensen Huang am Sonntag demonstrierte: Die Prioritäten haben sich grundlegend verschoben. Drei Jahre lang konzentrierte sich das KI-Wettrennen auf die Frage, wer das größte Modell trainiert. Rohe Rechenkraft, immer mehr GPUs. Jetzt geht es um die Ausführung. Nvidia hat diese Verschiebung früher erkannt als der Wettbewerb und die gesamte Strategie entsprechend neu ausgerichtet, mit 1.000 Milliarden Dollar im Auftragsbuch als Beweis.
Die Chips, die alles verändern
Zwei zentrale Hardware-Ankündigungen. Zunächst Vera Rubin, die neue GPU-Architektur: 1,3 Millionen Komponenten pro Chip, zehnfach höhere Energieeffizienz als die Vorgängergeneration (Grace Blackwell), fünffach schneller bei der Inferenz. Auslieferung im zweiten Halbjahr 2026. Dann Groq 3, der erste Chip aus der Übernahme von Groq Ende 2025 für schätzungsweise 16 bis 18 Milliarden Euro. Es handelt sich um eine LPU (Language Processing Unit), ausschließlich auf Inferenz spezialisiert: Sie kann kein Modell trainieren, führt bestehende Modelle aber 35-mal effizienter pro Watt aus. GPUs fürs Training, LPUs für die Ausführung: Nvidia kontrolliert beide Ebenen des Ökosystems.
KI verlässt den Bildschirm
Die GTC 2026 markiert auch den Moment, in dem KI die Cloud verließ und die physische Welt berührte.
Nvidia und Disney präsentierten einen Olaf-Roboter, der sich autonom bewegen und mit Parkbesuchern interagieren kann, angetrieben von Newton, einer Open-Source-Physik-Simulationsengine, entwickelt mit Google DeepMind. Ein Werkzeug, das es ermöglicht, Roboter in einer virtuellen Welt zu trainieren, bevor sie in der realen Welt eingesetzt werden.
Im Transportsektor kündigte Uber die Einführung seiner autonomen Fahrzeugflotte auf Basis der Plattform Nvidia Drive AV an. Los Angeles und San Francisco ab 2027. 28 Städte auf vier Kontinenten bis 2028. Autonomes Fahren ist kein Messeversprechen mehr. Es ist ein industrieller Zeitplan.
Und dann NemoClaw. Die Unternehmensplattform für KI-Agenten, basierend auf dem Open-Source-Framework OpenClaw. Jensen Huang verglich sie mit Linux, mit Kubernetes. Sein genauer Wortlaut: "Every company needs an OpenClaw strategy." KI-Agenten werden so alltäglich wie Websites. Nvidia will die Grundlagen liefern, Hardware und Software, vom Chip bis zum Agenten auf dem Arbeitsplatzrechner.
Die Fragen, die niemand stellt
Ein Moment des Innehaltens ist angebracht. Denn hinter den Ankündigungen und dem Applaus existiert eine komplexere Realität.
Ein einziger Anbieter für eine ganze Industrie
Nvidia dominiert den Markt für KI-Chips mit beispielloser Intensität. 71 Milliarden Euro Umsatz in einem einzigen Quartal, 77 Prozent Wachstum im Jahresvergleich. Elf aufeinanderfolgende Quartale mit über 55 Prozent Wachstum. Diese Dominanz ähnelt der Position von Microsoft in den 1990er-Jahren oder Google in den 2010er-Jahren. Nur dass es diesmal um die physische Infrastruktur der künstlichen Intelligenz geht.
Wenn Nvidia hustet, bekommt die gesamte KI-Branche einen Schnupfen.
Energie: Der Elefant im Raum
Rechenzentren überall, Millionen von KI-Agenten im Dauerbetrieb, Racks, die so viel Strom verbrauchen wie eine Kleinstadt. Jensen Huang erwähnte sogar die Möglichkeit von Rechenzentren im Weltraum. Wer darüber nachdenkt, Server in den Orbit zu schicken, um Energie zu finden, hat ein Problem, das über ein Detail hinausgeht. Es ist die Mauer.
75.000 Menschen, 7,5 Millionen Agenten
Huangs Vision für die nächsten zehn Jahre: Nvidia mit 75.000 Mitarbeitern und 7,5 Millionen KI-Agenten. Ein Verhältnis von einem Menschen zu hundert Agenten. Keine Metapher. Ein Unternehmensziel. Und wenn Nvidia dieses Verhältnis umsetzt, werden seine Kunden nachziehen.
Fazit
Die GTC 2026 ist keine gewöhnliche Technologiemesse. Sie markiert den offiziellen Übergang der KI von der Forschungsphase in die industrielle Phase. Das Training war die Goldmine. Die Inferenz ist die Fabrik, die das Erz verarbeitet, Tag und Nacht, auf planetarer Ebene.
Die Frage lautet nicht mehr, ob KI die Wirtschaft transformieren wird. Sie lautet: Wer wird diese Infrastruktur nutzen, und zu welchen Konditionen.



