Die KI-Produktivitätssteuer: Wann KI Sie wirklich beschleunigt (und wann nicht)

Das Produktivitätsversprechen gegenüber der Realität

Das Versprechen ist überall. Kombinieren Sie ein LLM mit einem Wissensarbeiter und sehen Sie zu, wie sich der Output verdoppelt. Stapeln Sie eine Copilot-Lizenz auf jeden Mitarbeiter und reiten Sie auf der Produktivitätswelle. Das Narrativ ist so laut, dass es sich anfühlt, als würde man die Schwerkraft infrage stellen, wenn man es hinterfragt.

Dann begannen die Daten einzutreffen. Im Juli 2025 veröffentlichte METR „Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity“, eine randomisierte kontrollierte Studie mit 16 erfahrenen Entwicklern, die an realen Issues in ihren eigenen großen Open-Source-Repositories arbeiteten. Das Ergebnis: Entwickler, die KI-Tools nutzten, brauchten 19 % länger zur Erledigung der Aufgaben als Entwickler ohne KI. Dieselben Entwickler glaubten im Nachhinein, KI habe sie 20 % schneller gemacht. Diese Lücke zwischen Wahrnehmung und Realität, etwa 39 Prozentpunkte, ist die Produktivitätssteuer in einer einzigen Grafik.

Die Copilot-Einführungen bei Microsoft haben ähnlich gemischte Bilder hervorgebracht. Studien des BetterUp Labs und des Stanford Social Media Lab aus 2024 und 2025 fanden Gewinne bei einigen eng umrissenen Aufgaben (Zusammenfassen von Meetingnotizen, Verfassen standardisierter E-Mails), aber Verluste bei anderen, sowie ein besorgniserregendes Signal, dass KI-Nutzung Arbeit hin zu „Workslop“ verschiebt, also Output mit geringem Aufwand, den andere Menschen anschließend bereinigen müssen. Das Gesamtbild ist keine Produktivitätsrevolution. Es ist eine Produktivitäts-Umverteilung, mit Gewinnern und Verlierern je nach Aufgabe.

Warum fühlt sich KI also so schnell an? Weil der sichtbare Teil schnell ist. Die Generierung erfolgt augenblicklich. Der unsichtbare Teil, also das Schreiben des Prompts, das Verifizieren, das erneute Prompten, das Aufräumen subtil falschen Outputs, das ist der Punkt, an dem die Rechnung fällig wird. Nennen Sie es die Produktivitätssteuer. Es ist die Zeit, die Sie für KI bezahlen und die nicht im Chatfenster auftaucht.

Die drei versteckten Kosten jeder KI-Aufgabe

Jede KI-Aufgabe wird mit drei Posten geliefert. Die meisten Nutzer bemerken den dritten erst, wenn er zubeißt.

Die Prompt-Erstellungssteuer ist das, was Sie zahlen, bevor die Generierung beginnt. Für eine komplexe Aufgabe könnte ein brauchbarer Prompt 200 bis 600 Wörter umfassen, plus Kontext-Dump, plus Beispiele. Das sind 30 bis 120 Sekunden Tippen oder Kopieren. Das NBER-Working-Paper „How People Use ChatGPT“ von OpenAI (September 2025, basierend auf 1,5 Millionen Konversationen) ergab, dass 49 % der Nachrichten „Asking“ statt „Doing“ sind. Das heißt, die Nutzer suchen meist Informationen statt Aufgaben zu delegieren. Auch das Suchen kostet Vorbereitungszeit, und diese Zeit ist nicht umsonst.

Die Verifikationssteuer ist das, was Sie zahlen, nachdem die Generierung endet. Sie lesen den Output. Sie prüfen die Fakten. Sie testen den Code auf Plausibilität. Sie gleichen die Quellenangabe ab. Für eine 300-Wort-Antwort kann eine sorgfältige Verifikation 60 bis 180 Sekunden dauern. Bei Code dauert es länger. Bei allem, worunter Sie Ihren Namen setzen würden, dauert es noch länger. Das Vectara Hallucination Leaderboard, das verfolgt, wie oft Consumer-LLMs beim Zusammenfassen von Quelldokumenten Fakten erfinden, zeigt Halluzinationsraten von etwa 1 % bis 10 %, je nach Modell und Aufgabe. Im Schnitt führt eine von zwanzig Antworten in die Irre. Das Überspringen der Verifikation verschiebt die Kosten lediglich von „Ihrer Zeit“ auf „Ihren Ruf“.

Die Nacharbeitssteuer ist die unerwartete Rechnung. Der Output ist zu 80 % korrekt, aber der Ton stimmt nicht, oder das Format ist falsch, oder es wurde ein Paper zitiert, das nicht existiert, oder es wurde selbstbewusst eine Zahl behauptet, die nachweislich fünf Jahre veraltet ist. Jetzt prompten Sie entweder erneut (weitere 30 Sekunden) oder schreiben um (weitere 2 Minuten). Bei Aufgaben, deren Antwort Sie ohnehin kannten, kostet Nacharbeit meist mehr, als es selbst zu erledigen. Genau das ist METRs Entwicklern passiert: Sie verbrachten mehr Zeit mit Prompten und Überprüfen, als sie für das Schreiben des Codes selbst gebraucht hätten.

Addieren Sie diese drei zusammen, und eine „5-Sekunden-KI-Antwort“ wird routinemäßig zu einer 3-minütigen Interaktion. Multiplizieren Sie das mit 30 KI-Nutzungen pro Tag, und Sie haben anderthalb Stunden, die allein für die Produktivitätssteuer draufgehen.

Die Worth-It-Matrix: Eine 2x2, die Sie im Kopf durchspielen können

Die Entscheidung, ob man KI einsetzt, ist zweidimensional, nicht eindimensional. Die meisten Menschen denken nur über die Schwierigkeit der Aufgabe nach. Sie sollten zusätzlich über die Verifikationskosten nachdenken.

Die Komplexität der Aufgabe ist, wie lange die Aufgabe ohne KI dauern würde. Die Verifikationskosten sind, wie lange Sie brauchen, um zu bestätigen, dass eine KI-generierte Antwort korrekt ist. Diese sind voneinander unabhängig. Einen Absatz ins Spanische zu übersetzen, ist für Sie schwer (hohe Komplexität) und günstig zu verifizieren, wenn Sie Spanisch lesen können (niedrige Verifikationskosten). Eine kurze, freundliche Antwort an einen Kollegen zu schreiben, ist für Sie leicht (niedrige Komplexität) und leicht zu verifizieren (niedrige Verifikationskosten), aber der KI-Overhead allein übersteigt die Zeit, die Sie sonst gebraucht hätten.

	Günstig zu verifizieren	Teuer zu verifizieren
Schwere Aufgabe	KI glänzt. Übersetzungen, strukturierte Extraktion, Entwürfe in unbekannten Formaten, Code in einer Sprache, die Sie lesen, aber nicht flüssig schreiben.	Deep-Work-Zone. Strategie-Memos, neuartige Recherche, Code in sicherheitskritischen Pfaden. Das Halluzinationsrisiko der KI plus Ihre Verifikationskosten übersteigen oft das Selbermachen.
Leichte Aufgabe	Lassen Sie die KI weg. Kurze E-Mails, Formatierungskorrekturen, alles unter 60 Sekunden. Die Prompt-Steuer übersteigt die Arbeit.	Auf jeden Fall ohne KI. Vertrautes Schreiben in Ihrer eigenen Stimme, Entscheidungen, die von Kontext abhängen, den nur Sie haben. KI ist hier reiner Overhead.

Der Zweck der Matrix ist, eine einzige Entscheidung automatisch zu machen: Wenn Sie in der Zeile „Leichte Aufgabe“ sind, ist die Standardeinstellung „keine KI“. Die beiden oberen Quadranten sind dort, wo KI ihren Wert beweist, und auch die teilen sich auf. Schwer plus teure Verifikation ist der heikelste Fall, weil die Versuchung am größten ist (die Aufgabe ist ja schwer), aber die Kosten ebenfalls am höchsten sind. Eine vertiefte Lektüre dazu, wann das „Denken für Sie“ durch KI auf die Kognition selbst zurückschlägt, finden Sie in The AI Thinking Trap.

Sieben Aufgaben, bei denen KI Sie fast immer ausbremst

Manche Aufgaben verlieren grundsätzlich. Es lohnt sich, sie als „Keine-KI-Liste“ auswendig zu lernen, denn bei diesen Aufgaben zur Chatbox zu greifen, ist eine Muskelerinnerung, die die meisten Wissensarbeiter sich noch nicht abgewöhnt haben.

Aufgabe	Warum KI verliert	Was stattdessen tun
Kurze E-Mails (unter 80 Wörter)	Prompt + Verifikation kosten mehr als die Antwort zu tippen.	Tippen Sie sie. Nutzen Sie einen Snippet-Expander, falls es wirklich repetitiv ist.
Formatierungskorrekturen (Großschreibung, Listenabstände)	Die Korrektur ist mechanisch und 10 Sekunden entfernt. KI fügt Roundtrip-Latenz hinzu und „verbessert“ vielleicht Dinge, die Sie nicht angefordert haben.	Nutzen Sie Ihren Editor. Suchen-und-Ersetzen schlägt KI bei bekannten Mustern.
Ihre eigene Stimme bei vertrauten Themen	KI flacht die Stimme zum LLM-Mittelwert ab. Sie brauchen länger, sie zu entflachen, als frisch zu schreiben.	Schreiben Sie selbst. Nutzen Sie KI nur für Kritik im Anschluss.
Entscheidungen unter 60 Sekunden	Die Entscheidung ist fertig, bevor der Prompt es ist.	Entscheiden Sie. Vertrauen Sie der 80-%-Antwort, die Ihr Gehirn bereits produziert hat.
Entscheidungen, die von privatem Kontext abhängen	Den Kontext in die KI zu laden dauert länger als die Entscheidung.	Entscheiden Sie mit dem Kontext, den Sie ohnehin schon haben.
Aktives Lernen (Abruf, Problemlösen)	Karpickes Forschung zur Retrieval-Praxis und Bjorks Rahmenwerk der „desirable difficulties“ zeigen beide, dass anstrengender Abruf Gedächtnis aufbaut. KI löst die Schwierigkeit auf und das Gedächtnis gleich mit.	Erst kämpfen. KI nur einsetzen, nachdem Sie den Abruf versucht haben.
Kreative Arbeit, bei der Reibung der Wert ist	Ein erster Entwurf, den Sie selbst geschrieben haben, auch ein schlechter, ist näher an Ihren echten Ideen als ein polierter KI-Entwurf, den Sie zurückentwickeln müssen.	Hässlich entwerfen. Mit Hilfe überarbeiten. Generierung nicht auslagern.

Der Eintrag zum Lernen verdient besonderes Gewicht. Eine Studie von Karpicke und Roediger aus 2008 („The Critical Importance of Retrieval for Learning“) zeigte, dass Studierende, die das Abrufen von Informationen übten, eine Woche später 50 % mehr behielten als Studierende, die dasselbe Material erneut studierten. KI ist eine Wiederholungsmaschine. Sie reicht Ihnen die Antwort. Jedes Mal, wenn Sie das zulassen, überspringen Sie die Abruf-Wiederholung, die das Gedächtnis aufgebaut hätte. Einen fokussierten Entscheidungsrahmen dazu finden Sie in Claude vs ChatGPT for Learning.

Sechs Aufgaben, bei denen KI sich wirklich auszahlt

Die Kehrseite ist real. Manche Aufgaben profitieren so sehr von KI, dass es albern wäre, sie wegzulassen. Sie haben eine gemeinsame Struktur: Die Aufgabe ist schwer, die Verifikation ist günstig, und der Output ist strukturiert genug, dass Fehler schnell auffallen.

Aufgabe	Warum KI gewinnt	Prompt-Gerüst
Synthese aus 5+ Quellen	30 Seiten zu lesen und eine kohärente Zusammenfassung zu produzieren, ist langsam für Menschen, schnell für LLMs. Verifikation ist schnell, wenn Sie die Quellen nebeneinander halten.	„Hier sind 5 Quellenausschnitte. Erstelle eine 200-Wort-Synthese, die die Punkte X, Y, Z abdeckt. Belege jede Aussage mit Quellennummer.“
Entwürfe unbekannter Formate	Förderanträge, juristische Schreiben, Sprint-Planungsdokumente, die Sie noch nie geschrieben haben. Das Format selbst ist der schwere Teil.	„Entwirf ein [Format] für [Zweck]. Zielgruppe: [X]. Ton: [Y]. 400 Wörter.“
Übersetzung (wenn Sie die Zielsprache lesen, aber nicht schreiben)	Asymmetrische Verifikation: Sie können sofort gegenlesen.	„Übersetze Folgendes ins [Sprache]. Bewahre Register und Idiomatik, wo möglich.“
Code außerhalb Ihrer Komfortzone	Ein Bash-Einzeiler, eine Regex, eine SQL-Window-Function. Sie können es ausführen und sehen, ob es funktioniert.	„Schreibe ein [Sprache]-Snippet, das [X tut]. Füge 1 Testfall hinzu, den ich in den REPL einfügen kann.“
Strukturierte Extraktion (CSV, JSON aus unstrukturiertem Text)	LLMs sind hervorragend bei formatgebundener Extraktion. Sie können per Schema validieren.	„Extrahiere die folgenden Felder aus diesem Text als JSON: [Feldliste]. Wenn ein Feld fehlt, nutze null.“
Sokratische Kritik Ihres eigenen Entwurfs	Sie haben es geschrieben, Sie kennen es. Die Aufgabe der KI ist nur, Löcher zu bohren. Die Verifikation lautet „Stimme ich der Kritik zu?“.	„Auditiere diesen Entwurf, wie es ein Lektor täte. Identifiziere die 3 schwächsten Aussagen und warum.“

Beachten Sie den roten Faden: In jedem Gewinn-Fall sind Sie weiterhin der Autor der Arbeit. Die KI erledigt eine Teilaufgabe, deren Output Sie schnell auf Plausibilität prüfen können. Wenn die KI das Denken übernimmt, explodieren die Verifikationskosten und die Aufgabe rutscht zurück in die untere Hälfte der Matrix. Mehr dazu, wie die Qualität des vorgeschalteten Kontexts darüber entscheidet, ob diese Prompts tatsächlich funktionieren, finden Sie in Context Engineering.

Das Problem der Verifikationslatenz

Hier ist das schmutzige Geheimnis von KI-Produktivitätsbehauptungen: Die meisten „Zeitersparnis“-Zahlen werden vor der Verifikation gemessen. Der Nutzer generiert einen Entwurf, erklärt die Aufgabe für erledigt und macht weiter. Die Verifikationskosten werden nach hinten verschoben, meist an das zukünftige Selbst des Nutzers, wenn ein Fehler in der Produktion, in einem Meeting oder vor einem Kunden auftaucht.

Verifikationslatenz ist die Lücke zwischen dem Zeitpunkt, an dem KI Output produziert, und dem Zeitpunkt, an dem Sie entdecken würden, dass er falsch ist. Bei Code ist die Latenz kurz: Er läuft oder er läuft nicht. Bei Prosa kann die Latenz Stunden oder Tage betragen, besonders wenn der Fehler eine selbstbewusst formulierte falsche Tatsache ist. Das Vectara Hallucination Leaderboard, das misst, wie oft Zusammenfassungsaufgaben Details erfinden, die nicht in der Quelle stehen, verortet Top-Consumer-Modelle im Bereich von 1 % bis 3 % und schwächere Modelle im Bereich von 5 % bis 10 %. Eine Fehlerquote von 3 % klingt klein, bis Sie merken, dass das bedeutet, ungefähr einer von 30 Absätzen enthält eine erfundene Tatsache. Wenn Sie ein 12-Absatz-Briefing schreiben, rechnen Sie mit einem bedeutenden Fehler in 40 % der Fälle.

Die echte Produktivitätsrechnung muss die Verifikation einschließen. Wenn eine Aufgabe von Hand 5 Minuten dauert und mit KI 2 Minuten, haben Sie 3 Minuten „gespart“, aber nur, wenn Verifikation umsonst ist. Wenn die Verifikation 90 Sekunden dauert, beträgt Ihre echte Ersparnis 90 Sekunden. Wenn die Verifikation 4 Minuten dauert (weil das Thema technisch ist und Sie Zitate nachverfolgen müssen), haben Sie eine Minute verloren. METRs Entwicklerstudie fand genau dieses Muster: KI generierte Code schnell, aber das Lesen und Beheben fraß die Ersparnis und mehr. Einen strukturierten Weg, Modell-Output zu verifizieren, ohne all die gesparten Minuten zu verbrennen, finden Sie im LLM Hallucination Detection Playbook.

Eine nützliche Faustregel: Verifikation sollte nicht mehr als 30 % der Zeit beanspruchen, die KI zu sparen behauptet. Wenn doch, sind Sie ins Negative gerutscht und sollten die Aufgabe wahrscheinlich selbst machen.

Ihr eigenes KI-Zeit-Audit aufbauen

Theorie ist billig. Das Heilmittel gegen KI-Übernutzung sind Daten zu Ihrem eigenen Verhalten. Hier ist eine 7-Tage-Übung, die mit peinlicher Präzision aufdeckt, wo KI Ihnen hilft und wo sie die Produktivitätssteuer ist.

Tag 0: Öffnen Sie eine Notizdatei oder eine Tabelle. Drei Spalten: Zeitstempel, Aufgabenbeschreibung, „Was hätte ich ohne KI getan?“. Optional eine vierte Spalte: geschätzte gesparte oder verlorene Minuten.

Tage 1 bis 7: Jedes Mal, wenn Sie ChatGPT, Claude, Gemini oder ein anderes KI-Tool öffnen, halten Sie es fest. Filtern Sie nicht. Lassen Sie die trivialen Fälle nicht aus. Vor allem die trivialen nicht, denn das sind die, die Ihren Tag still aushöhlen. Halten Sie für jeden Eintrag fest, wofür Sie die KI tatsächlich genutzt haben (eine Slack-Antwort schreiben, ein Dokument zusammenfassen, eine E-Mail entwerfen) und was Ihre Alternative gewesen wäre (selbst tippen, das Dokument überfliegen, eine Vorlage nutzen).

Tag 8: Auswertung. Schätzen Sie für jede Zeile die netto gesparten oder verlorenen Minuten. Seien Sie ehrlich. Wenn Sie KI für eine 3-Sätze-Antwort genutzt haben, die per Tippen 30 Sekunden gedauert hätte, halten Sie -1 Minute fest (Prompt + Verifikation dauerten länger als das Tippen). Wenn Sie KI genutzt haben, um ein 600-Wörter-Dokument in eine Sprache zu übersetzen, die Sie nicht schreiben, halten Sie +20 Minuten fest.

Die meisten, die diese Übung durchführen, finden zwei Überraschungen. Erstens nutzen sie KI etwa doppelt so oft, wie sie dachten. Zweitens sind irgendwo zwischen 30 % und 50 % dieser Nutzungen netto-negativ oder ein Nullsummenspiel. Beim Audit geht es nicht darum, KI aufzugeben. Es geht darum, das untere Drittel der Nutzungen zu streichen, die, bei denen die Produktivitätssteuer den Produktivitätsgewinn übersteigt. Allein das sind in der Regel 30 bis 60 Minuten pro Tag, die zurückgewonnen werden.

Einen KI-schlanken Workflow gestalten

Sobald das Audit Ihnen Daten liefert, ist die Neugestaltung geradlinig. Standardmäßig keine KI. Eskalieren Sie nur, wenn die Matrix sagt, dass es sich lohnt.

Die Heuristik „standardmäßig keine KI“ kehrt die aktuelle Kultur um, die „standardmäßig KI“ lautet. Die meisten Wissensarbeiter öffnen ChatGPT, bevor sie entschieden haben, ob die Aufgabe das überhaupt rechtfertigt. Drehen Sie die Reihenfolge um: Beginnen Sie die Aufgabe und greifen Sie erst zur KI, wenn Sie auf einen echten Reibungspunkt stoßen. Ein echter Reibungspunkt ist „Ich kenne das Format dieses Dokuments nicht“, nicht „das ist mäßig lästig“. Lästigkeit plus KI ergibt meist Lästigkeit plus Steuer.

Für die Aufgaben, die KI rechtfertigen, gestalten Sie auf niedrige Verifikationskosten hin. Das bedeutet, dem Modell das benötigte Quellmaterial zu geben (damit es nichts erfinden muss), strukturierten Output zu verlangen (damit Fehler auffallen) und die Verifikationsfläche vor sich zu behalten. Genau hier verdient sich Glasps Web-Highlighter seinen Platz in einem KI-Workflow. Wenn Sie die Schlüsselpassagen aus einem Artikel oder PDF bereits markiert haben, muss das AI-Chat-Feature nicht raten, was Ihnen wichtig ist. Der Kontext ist vorab geladen. Dieselbe Logik gilt für YouTube Summary: Das Transkript ist die Quelle der Wahrheit, und das Modell fasst etwas Verifizierbares zusammen, statt aus einem vagen Titel zu erfinden.

Der Rhythmus, den wir empfehlen, nachdem wir Tausenden von Glasp-Nutzern bei dieser Arbeitsweise zugesehen haben, lautet: erst markieren, dann prompten. Markieren Sie, während Sie lesen oder schauen. Bauen Sie ein kleines, quellenbasiertes Korpus auf. Wenn Sie dann Synthese, Kritik oder Extraktion brauchen, prompten Sie gegen dieses Korpus. Die Verifikationskosten brechen ein, weil die Quelle direkt da ist. Das Halluzinationsrisiko sinkt, weil das Modell echtes Material zur Erdung hat. Die Produktivitätssteuer sinkt, weil der Prompt nicht versucht, Kontext zu importieren, der Kontext ist schon im Raum.

Das ist ein KI-schlanker Workflow. Weniger KI, besser eingesetzt, bei den Aufgaben, bei denen die Mathematik tatsächlich aufgeht.

Häufig gestellte Fragen

Bremst KI mich tatsächlich aus?

Möglicherweise, bei einem nennenswerten Anteil Ihrer Aufgaben. METRs Studie vom Juli 2025 mit erfahrenen Open-Source-Entwicklern fand eine Verlangsamung von 19 % bei der Nutzung von KI-Tools, obwohl die Nutzer berichteten, sich 20 % schneller zu fühlen. Die Wahrnehmungslücke ist die Gefahr. Die einzige verlässliche Methode, das herauszufinden, ist ein persönliches Zeit-Audit (siehe Abschnitt 7) über eine Woche. Die meisten stellen fest, dass 30 % bis 50 % ihrer KI-Nutzungen ein Nullsummenspiel oder netto-negativ sind.

Wann sollte ich ChatGPT vs. Claude vs. einfach selbst machen einsetzen?

Entscheiden Sie in zwei Schritten. Schritt eins: Führen Sie die Worth-It-Matrix durch. Wenn die Aufgabe kurz, vertraut oder die Verifikationskosten hoch sind, machen Sie es einfach selbst. Schritt zwei: Wenn KI gerechtfertigt ist, wählen Sie das Modell anhand der Aufgabe. Claude tendiert dazu, bei Long-Context-Analyse und strukturiertem Schreiben zu gewinnen. ChatGPT tendiert dazu, bei schnellem Hin und Her und Tool-Nutzung zu gewinnen. Gemini gewinnt, wenn Sie es in Google Workspace integriert brauchen. Das Modell ist weniger wichtig als die Entscheidung, KI überhaupt einzusetzen.

Warum fühle ich mich mit KI schneller, auch wenn ich es nicht bin?

Weil sich die Generierung schnell anfühlt. Tokens streamen zu sehen vermittelt ein starkes Gefühl von Fortschritt, während die Zeit für das Schreiben des Prompts und die Verifikation diffus und leicht zu vergessen ist. METRs Entwickler berichteten von einem gefühlten 20-%-Speedup, während sie messbar 19 % langsamer waren, eine 39-Punkte-Illusion. Das Gehirn schreibt dem sichtbaren Teil der Schleife zu viel Wert zu und unterschätzt die unsichtbaren Teile. Das Audit behebt das, indem es die unsichtbare Zeit sichtbar macht.

Sollte ich aufhören, KI zum Schreiben zu nutzen?

Differenziert betrachtet. Hören Sie auf, sie für kurzes, vertrautes Schreiben in Ihrer eigenen Stimme zu nutzen (Antworten, interne Updates, alles unter 80 Wörtern). Der Output flacht Ihre Stimme ab und der Roundtrip kostet mehr als das Tippen. Nutzen Sie sie weiter für unbekannte Formate (Förderanträge, juristische Schreiben, Formate, die Sie weniger als fünfmal geschrieben haben), Übersetzungen und strukturierte Extraktion. Und nutzen Sie sie für die Kritik Ihrer eigenen Entwürfe, bei der Sie Autor bleiben und die KI nur Sparringspartner ist.

Wie lange sollte die Verifikation einer KI-Antwort dauern?

Knüpfen Sie die Verifikationszeit an die Tragweite. Für Output mit niedriger Tragweite (eine Slack-Nachricht, eine persönliche Notiz) genügen 5 bis 15 Sekunden. Für mittlere Tragweite (ein Dokument, das Ihr Team lesen wird) 30 bis 90 Sekunden, wobei mindestens ein Fakt stichprobenartig überprüft wird. Für hohe Tragweite (alles extern Veröffentlichte, Code in Produktion, Aussagen über Zahlen) sollte die Verifikation mindestens so lange dauern, wie das Ding selbst zu schreiben gedauert hätte. Wenn die Verifikation durchgängig mehr als 30 % der Zeit beansprucht, die KI zu sparen behauptet, zahlen Sie die Produktivitätssteuer in voller Höhe.

Fazit

KI ist nicht umsonst. Sie kostet Prompt-Zeit, Verifikationszeit und gelegentlich eine Nacharbeitsrechnung. Bei den richtigen Aufgaben übersteigen die Gewinne die Kosten bei Weitem. Bei den falschen Aufgaben fressen die Kosten still den Tag. Die Belege aus 2025 sind klar genug, dass „immer KI nutzen“ keine vertretbare Standardeinstellung mehr für ernsthafte Wissensarbeit ist.

Der praktische Schritt ist klein. Führen Sie das Audit eine Woche lang durch. Beobachten Sie, wo KI sich auszahlt und wo sie besteuert. Streichen Sie das untere Drittel der Nutzungen. Standardmäßig keine KI bei kurzer, vertrauter Arbeit unter 60 Sekunden. Eskalieren Sie zur KI bei schwerer, strukturierter, leicht zu verifizierender Arbeit. Erst markieren, dann prompten. Das Ergebnis ist nicht weniger KI in Ihrem Leben. Es ist KI, die sich tatsächlich bezahlt macht.