An den US-amerikanischen Börsen wurden am Wochenende über eine Billion US-Dollar (1 T$) vernichtet. Davon entfielen allein rund 600 Milliarden US-Dollar auf NVIDIA, dessen Kurs zwischenzeitlich um 17 % absackte. Der Grund: ein neues generatives KI-Modell eines chinesischen Hedgefonds-Unternehmens namens DeepSeek. Die Reaktion der Anleger war auf die extreme Effizienzsteigerung zurückzuführen, die während des Trainings…

Written by

×

DeepSeek, NVIDIA und Jevons-Paradox: Warum effizientere Modelle am Ende mehr kosten

An den US-amerikanischen Börsen wurden am Wochenende über eine Billion US-Dollar (1 T$) vernichtet. Davon entfielen allein rund 600 Milliarden US-Dollar auf NVIDIA, dessen Kurs zwischenzeitlich um 17 % absackte. Der Grund: ein neues generatives KI-Modell eines chinesischen Hedgefonds-Unternehmens namens DeepSeek.

Die Reaktion der Anleger war auf die extreme Effizienzsteigerung zurückzuführen, die während des Trainings des DeepSeek-Modells realisiert wurde. Während OpenAIs GPT-4o rund 95 Millionen US-Dollar an Trainingskosten verschlungen hat, verkündete DeepSeek, ihr V3-Modell mit nur 5,8 Millionen US-Dollar trainiert zu haben. Auch bei den Input-Kosten überzeugt DeepSeek durch Effizienz: Während eine Million Tokens bei GPT-4o etwa 2,50 US-Dollar kosten, liegen diese Kosten bei DeepSeek bei lediglich 0,14 US-Dollar

Anleger gehen nun davon aus, dass diese neue Generation von KI-Modellen so effizient laufen wird, dass alle großen Player – von OpenAI über Anthropic, Microsoft, xAI etc. – in den vergangenen Monaten zu viel in Chips investiert haben. Da die neuen Modelle offensichtlich weniger Compute benötigen, war der Kurs von NVIDIA überbewertet. Klingt logisch.

Doch wie wir bereits mehrfach festgestellt haben: Geschichte wiederholt sich zwar nicht, aber sie reimt sich. Als James Watt Ende des 18. Jahrhunderts seine im Vergleich zu Vorgängermodellen deutlich effizientere Dampfmaschine auf den Markt brachte, galt dies als Erleichterung für die britische Wirtschaft. Viele Briten befürchteten damals angesichts der zusammenschmelzenden Kohlereserven eine wirtschaftliche Krise und gingen davon aus, dass eine effizientere Dampfmaschine den Kohleverbrauch senken würde.

William Jevons schrieb jedoch bereits 1865, dass dem nicht so sein würde. Er stellte fest, dass der verbesserte Wirkungsgrad von Watts’ Dampfmaschine Kohle zu einer kostengünstigeren Energiequelle machte, was dazu führte, dass die Dampfmaschine in einer Vielzahl von Industrien verstärkt eingesetzt wurde. Dies wiederum erhöhte den gesamten Kohleverbrauch, selbst wenn die benötigte Kohlemenge für eine einzelne Anwendung sank.

Klingt das vertraut? Jevons schrieb: „Es ist eine Verwirrung der Begriffe zu glauben, dass die sparsame Nutzung von Brennstoff gleichbedeutend mit einem verringerten Verbrauch ist. Das genaue Gegenteil ist der Fall.“

Fortschritte in der Effizienz moderner Large-Language-Models wie DeepSeek R1 senken den Bedarf an Compute – und machen sie dadurch massentauglich. DeepSeek R1 ist insofern ein Paukenschlag in der aktuellen Entwicklung, da es die Möglichkeit für personalisierte KI-Anwendungen auf Endgeräten wie Smartphones eröffnet. Die Folge wird eine sprunghafte Ausweitung von KI-Anwendungen in allen Bereichen sein. Das bedeutet: Die Nachfrage nach Chips und Computing-Power wird steigen – und zwar enorm.

Deutschland und die EU werden massiv in den Ausbau der Infrastruktur für das KI-Zeitalter investieren müssen. Die USA haben gerade mit Projekt Stargate 500 Milliarden US-Dollar für die amerikanische KI-Infrastruktur angekündigt (in etwa das jährliche BIP von Saudi Arabien). China hat in den letzten Jahren hunderte Milliarden Dollar in die KI- und Chip-Industrie investiert. Wenn man die aktuell geplanten Vorhaben der EU zusammenzählt, wird diese zwischen 2020 und 2030 vermutlich um die 200 Milliarden Euro in Forschung und Entwicklung von Künstlicher Intelligenz, Quantencomputing und angrenzenden Industrien investieren. Diese Summe umfasst sowohl direkte EU-Investitionen (über Horizon Europe, Digital Europe und die KI-Innovationsfonds) als auch die breitere Mobilisierung privater und nationalstaatlicher Investitionen innerhalb der EU.

Auch wenn anzunehmen ist, dass sich diese Investitionen aufgrund des aktuellen Wettlaufs mit China und den USA noch erhöhen werden – sie können schlicht nicht mit der Spending Power der beiden größten Wirtschaftsmächte der Welt mithalten, die längst erkannt haben, was die Schlüsseltechnologie KI für unser aktuelles Jahrhundert bedeutet. Die Amerikaner würden sagen: „Get behind or get left behind.“ Die EU muss darauf achten, im digitalen Zeitalter nicht technologisch abgehängt zu werden. Wir stehen vor einer Entscheidung: Bleiben wir Zuschauer in der größten technologischen Revolution seit der Industrialisierung – oder hören wir endlich auf, in Milliarden zu denken, während andere in Billionen investieren?

One response to “DeepSeek, NVIDIA und Jevons-Paradox: Warum effizientere Modelle am Ende mehr kosten”

  1. Von Moore’s Law zu Trump’s Law: Wer die Chips hat, hat die Macht – The New Normal Avatar

    […] im letzten Beitrag zum Jevons-Paradoxon beschrieben, wird eine Verbesserung in der Effizienz von Large-Language-Models nur dazu führen, dass deren […]

    Like

Leave a reply to Von Moore’s Law zu Trump’s Law: Wer die Chips hat, hat die Macht – The New Normal Cancel reply