Zum Inhalt springen
Strategie & Management

KI-Kosten senken: Was der Lindy-Wechsel zu Deepseek lehrt

Warum ein Startup komplett von Claude wegging und woran Sie erkennen, ob sich ein Modellwechsel für Sie rechnet

Lukas GörögLukas Görög4 Min. Lesezeit
KI-Kosten senken: Was der Lindy-Wechsel zu Deepseek lehrt
KI-Kosten senken: Was der Lindy-Wechsel zu Deepseek lehrt

Wer seine KI-Kosten senken will, sollte den Fall Lindy genau lesen: Das US-Startup hat seinen kompletten Betrieb von Anthropics Claude auf das chinesische Modell Deepseek umgestellt, weil die Ausgaben für Modellaufrufe die eigenen Personalkosten überstiegen. CEO Flo Crivello bezeichnet den Schritt laut The Decoder als "eine Frage des Überlebens". Die Lehre daraus ist nicht, dass jeder zu Deepseek wechseln sollte. Sie liegt in der Frage, ab wann Inferenzkosten zum strategischen Risiko werden.

Bei klassischer Software fallen Kosten einmal an und skalieren danach kaum mit der Nutzung. Bei KI-Produkten ist es umgekehrt. Jede Anfrage kostet Geld, und je erfolgreicher das Produkt, desto höher die Rechnung. Genau dieser Mechanismus traf Lindy.

Warum stiegen Lindys KI-Kosten über die Personalkosten?

Weil Lindy KI-Agenten anbietet, die im Hintergrund laufend Aufgaben abarbeiten. Solche Produkte erzeugen ein hohes Aufrufvolumen pro Kunde, und teure Premium-Modelle multiplizieren sich entsprechend. Als die Inferenzkosten die Lohnsumme überstiegen, war das für ein junges Unternehmen kein Komfortproblem, sondern eine existenzielle Marge.

Der Auslöser ist kein Einzelfall. Marktforscher prognostizieren laut heise, dass KI-gestütztes Coding bis 2028 teurer werden könnte als das Entwicklergehalt, das es ersetzen soll. Aus der Produktivitätsverheißung wird dann eine Kostenfalle, sobald der Verbrauch ungebremst wächst.

Mein Eindruck aus der Beratungspraxis: Viele Teams kalkulieren KI-Kosten mit dem Verbrauch eines Prototyps und nicht mit dem eines Produktivsystems unter Last. Zwischen beiden liegt oft ein Faktor von zehn oder mehr. Wer das nicht früh durchrechnet, erlebt die böse Überraschung erst auf der Cloud-Rechnung.

Lohnt sich ein Wechsel zu Deepseek für jeden?

Nein. Deepseek ist deutlich günstiger als die westlichen Spitzenmodelle und für viele Aufgaben gut genug, aber der Preis ist nur eine von mehreren Variablen. Entscheidend sind Antwortqualität für Ihren konkreten Fall, Latenz, Verfügbarkeit und vor allem die Frage, wo Ihre Daten verarbeitet werden. Ein pauschaler Wechsel löst das eine Problem und schafft womöglich ein neues.

Deepseek hat in den vergangenen Monaten kräftig aufgeholt. Der Anbieter kündigte ein leistungsstärkeres Update seiner V3-Reihe an, das in mehreren Benchmarks näher an die Konkurrenz rückt, wie ActuIA berichtet. Solche Werte stammen aber meist vom Hersteller und unter günstigen Bedingungen. Behandeln Sie sie als Hinweis, nicht als Beweis, und testen Sie an Ihren eigenen Aufgaben.

Bei chinesischen Modellen kommt für Unternehmen im DACH-Raum eine zusätzliche Ebene dazu: Datenschutz, Hosting-Standort und regulatorische Einordnung. Wer Deepseek über eine in der EU gehostete Variante oder lokal betreibt, hat eine andere Ausgangslage als jemand, der direkt gegen die chinesischen Server fährt. Diese Unterscheidung entscheidet oft mehr als der Preis pro Token, wie auch die Debatte um kostengünstige chinesische Sprachmodelle und ihre Marktanteile zeigt.

Wie senken Unternehmen KI-Kosten strategisch?

Indem sie aufhören, ein einziges Modell für alles zu nutzen, und stattdessen nach Aufgabe routen. Die teure Spitzenleistung braucht man nur für einen Bruchteil der Anfragen. Der Rest läuft auf günstigeren Modellen, oft ohne spürbaren Qualitätsverlust. Vor jeder Tool-Entscheidung steht die Messung des tatsächlichen Verbrauchs.

  1. Verbrauch messen: Erfassen Sie, welche Anfragen wie viel kosten und welche das Volumen treiben. Ohne diese Daten ist jede Optimierung Raten.
  2. Aufgaben klassifizieren: Trennen Sie einfache Routine (Zusammenfassen, Klassifizieren) von anspruchsvollen Aufgaben (komplexes Reasoning, Code-Architektur).
  3. Modelle abstufen: Schicken Sie Routine an günstige Modelle wie Deepseek, anspruchsvolle Fälle an Premium-Modelle wie Claude oder GPT.
  4. Caching und Kürzung nutzen: Wiederkehrende Prompts cachen, Kontextfenster knapp halten. Beides senkt Kosten ohne Modellwechsel.
  5. Lock-in vermeiden: Bauen Sie Ihre Anwendung so, dass ein Anbieterwechsel Tage und nicht Monate dauert.

Wenn Sie als Führungskraft vor genau dieser Entscheidung stehen und die Optionen nüchtern gegeneinander abwägen wollen, lohnt ein Blick auf einen praxisorientierten Vergleich der wichtigsten KI-Tools für das Management. Sinnvoll ist das vor allem dann, wenn mehrere Modelle infrage kommen und Sie eine fundierte Auswahl statt einer Bauchentscheidung treffen wollen. Wer bereits ein klar definiertes System produktiv betreibt, braucht eher eine technische Lastmessung als einen Überblicksworkshop.

Was bedeutet der Lindy-Fall für Ihr Unternehmen?

Er zeigt, dass die Modellwahl keine einmalige Architekturentscheidung ist, sondern eine laufende betriebswirtschaftliche. Die Preise, die Qualität und die Verfügbarkeit der Anbieter verschieben sich im Quartalstakt. Ein Modell, das heute optimal ist, kann in sechs Monaten zu teuer oder zu schwach sein.

Aus meiner Sicht ist die wichtigste Konsequenz nicht der Wechsel selbst, sondern die Beweglichkeit. Unternehmen, die ihre KI-Schicht austauschbar bauen, können auf Preissprünge reagieren, ohne ihr Produkt neu zu schreiben. Wer sich dagegen fest an einen Anbieter koppelt, übergibt diesem die Kontrolle über die eigene Marge.

Der nächste Schritt für die meisten Teams ist kein Modellwechsel, sondern eine ehrliche Kostenanalyse: Welche Anfragen treiben Ihre Rechnung, und welche davon brauchen wirklich das teuerste Modell? Häufig liegt die größte Ersparnis nicht im Anbieter, sondern im eigenen Architekturdesign.

Zurück zur Ausgangsfrage: Ab wann werden Inferenzkosten zum strategischen Risiko? Sobald sie schneller wachsen als der Umsatz, den die KI erzeugt. Lindy hat diesen Punkt früh erreicht und konsequent reagiert. Für Ihr Unternehmen entscheidet sich der Nutzen nicht daran, welches Modell gerade die besten Benchmarks vorzeigt, sondern daran, wie genau Sie wissen, was jede Anfrage kostet und welche davon den Preis wert ist.

Häufige Fragen

Welche Risiken bringt ein Wechsel zu Deepseek mit sich?

Neben möglichen Kostenvorteilen gibt es Risiken: Datenschutzfragen bei chinesischen Anbietern, abweichende Antwortqualität bei komplexen Aufgaben und Abhängigkeit von einem Modell mit eigenem politischem und regulatorischem Umfeld. Ein Wechsel sollte daher nie allein über den Preis entschieden werden, sondern Qualität, Compliance und langfristige Verfügbarkeit gleichwertig einbeziehen.

Wie kann ich meine KI-Inferenzkosten realistisch kalkulieren?

Rechnen Sie nicht mit dem Verbrauch eines Prototyps, sondern mit dem eines Produktivsystems unter Last – oft liegt dazwischen ein Faktor zehn oder mehr. Schätzen Sie Aufrufvolumen pro Nutzer, multiplizieren Sie es mit dem Preis pro Anfrage und planen Sie Wachstum ein. So vermeiden Sie die böse Überraschung auf der Cloud-Rechnung.

Gibt es Alternativen zum kompletten Modellwechsel, um Kosten zu senken?

Ja. Statt komplett zu wechseln können Sie günstigere Modelle nur für einfache Aufgaben einsetzen und teure Premium-Modelle für komplexe Fälle reservieren. Auch Caching, kürzere Prompts, Batch-Verarbeitung und das Begrenzen unnötiger Agenten-Aufrufe reduzieren das Volumen. Ein hybrider Ansatz senkt oft die Rechnung, ohne die Qualität durchgängig zu opfern.

Warum sind KI-Agenten besonders kostenintensiv?

KI-Agenten arbeiten im Hintergrund laufend Aufgaben ab und erzeugen dadurch ein hohes Aufrufvolumen pro Kunde. Jede einzelne Anfrage kostet Geld, und mit teuren Premium-Modellen multiplizieren sich diese Kosten schnell. Je erfolgreicher und aktiver das Produkt, desto höher die Rechnung – genau dieser Mechanismus traf das Startup Lindy.

Ab wann werden Inferenzkosten zum strategischen Risiko?

Kritisch wird es, sobald die laufenden Kosten für Modellaufrufe einen wesentlichen Teil der Marge auffressen oder, wie bei Lindy, die Personalkosten übersteigen. Bei klassischer Software fallen Kosten einmal an; bei KI-Produkten steigen sie mit der Nutzung. Wer das nicht früh durchrechnet, riskiert, dass aus der Produktivitätsverheißung eine Kostenfalle wird.

Wie hilft eine Schulung dabei, KI-Tools wirtschaftlich auszuwählen?

Führungskräfte müssen Modelle nicht nur technisch, sondern auch nach Kosten, Compliance und Einsatzzweck vergleichen können. Ein praxisorientierter Workshop vermittelt, welche Tools sich für welche Aufgaben eignen und wie man Verbrauch und Marge im Blick behält. So lassen sich teure Fehlentscheidungen vermeiden, bevor sie auf der Rechnung sichtbar werden.

0 Kommentare
Teilen

Diskussion

Kommentare werden vor der Veröffentlichung moderiert.

Noch keine Kommentare. Schreiben Sie den ersten.