Was funktioniert, was nicht, und warum der messbare Geschäftseffekt in den meisten Unternehmen ausbleibt.
KI ist in Unternehmen angekommen. Messbarer Geschäftseffekt deutlich seltener. Die Lücke dazwischen erklärt sich nicht durch schlechte Tools, sondern durch fehlende Prozesse, unklare Verantwortlichkeiten und überzogene Erwartungen.
In den Unternehmen, mit denen ich arbeite, ist KI selten das transformative Werkzeug, als das es auf Bühnen beschrieben wird. Es steht auf Roadmaps. Es taucht in Strategiepapieren auf. In der operativen Realität sehe ich es kaum. Und ich arbeite nicht mit Nachzüglern, sondern mit Unternehmen, die aktiv in digitales Marketing investieren.
Was bei mir den Ausschlag gegeben hat, KI anders zu betrachten, war nicht McKinsey. Es war ein Kaffeegespräch im Coworking Space und ein Pitch, bei dem wir uns selbst überholt haben. Dazu gleich mehr. Erst die Datenlage.
Die Datenlage
McKinsey meldete 2025 in zwei Global Surveys breite Nutzung, aber begrenzten Geschäftseffekt: 88 Prozent der Befragten nutzen AI regelmäßig in mindestens einer Funktion, 71 Prozent nutzen GenAI regelmäßig. Aber nur 39 Prozent berichten überhaupt einen EBIT-Effekt aus AI, und mehr als 80 Prozent sehen keinen greifbaren EBIT-Effekt durch GenAI auf Unternehmensebene. Eine NBER-Erhebung unter fast 6.000 CFOs, CEOs und Executives aus den USA, Großbritannien, Deutschland und Australien zeichnet ein ähnliches Bild: Über 80 Prozent der Firmen berichten in den letzten drei Jahren keinen Effekt von AI auf Produktivität oder Beschäftigung. PwC meldet für 2026 ergänzend, dass 56 Prozent der CEOs weder Umsatz- noch Kostenvorteile aus AI sehen.
Wichtig dabei: Wenn ich hier „KI im Marketing” schreibe, meine ich überwiegend generative KI. Sprachmodelle, Bildgeneratoren, die Tools seit ChatGPT. Predictive AI (Lead Scoring, Attribution, Forecasting) ist ein anderes Feld mit anderer Reifekurve. Ein Großteil der Versprechen bezieht sich auf GenAI, ein Großteil des nachweisbaren ROI kommt bisher aus klassischem Machine Learning.
Was tatsächlich funktioniert
KI bringt messbare Ergebnisse nicht bei Transformationsprojekten, sondern bei klar abgegrenzten Aufgaben mit definiertem Prozess und menschlicher Prüfung.
Fünf Bereiche, in denen ich das konsistent sehe:
- Analyse und Synthese: Kundenbewertungen auswerten, Kampagnendaten interpretieren, Wettbewerbslandschaften sortieren, Interviewnotizen verdichten. Was vorher einen halben Tag dauerte, geht in ein bis zwei Stunden. Die KI denkt dabei nicht besser. Sie sortiert schneller. Ein Feldexperiment mit über 5.000 Support-Agents zeigte 14 Prozent höhere Produktivität im Schnitt, bei weniger erfahrenen Kräften sogar 34 Prozent (Brynjolfsson et al., NBER 2023). Das Muster sehe ich bei Analyse-Aufgaben im Marketing genauso: KI hebt vor allem den Boden an. Top-Performer gewinnen weniger dazu.
- Synthetische Personas: Auf Basis von CRM-Daten, Kundenfeedback und Marktinformationen Zielgruppenprofile bauen, das funktioniert brauchbar als Startpunkt. In B2B-Kontexten mit fünf bis zehn Rollen im Buying Center liefert KI einen Startpunkt, der früher Wochen gebraucht hätte: wahrscheinliche Stakeholder, typische Einwände, unterschiedliche Informationsbedürfnisse von technischen und kaufmännischen Entscheidern. Kein Ersatz für echte Nutzerforschung, aber nützlich, wenn noch keine Primärdaten vorliegen.
- Prozessgebundene Content-Arbeit: Textvarianten, Betreffzeilen, Briefings, CTA-Optimierung. Funktioniert dort, wo es ein Briefing gibt, klare Qualitätskriterien und jemanden, der prüft.
- Design und Werbemittel: Bildgenerierung und Bewegtbild nutzen wir mittlerweile viel. Für Social-Media-Visuals, Anzeigenmotive, Storyboard-Entwürfe oder Konzeptvisuals liefert KI brauchbare Ergebnisse, die vorher entweder teuer eingekauft oder gar nicht produziert worden wären. Bei markenprägenden Motiven oder komplexen Erklärformaten bleibt der menschliche Anspruch höher.
- Kampagnenvorbereitung: Szenarien durchspielen, Hypothesen formulieren, Messaging-Varianten skizzieren. Ein Marketing-Lead kann in einer Stunde drei Kampagnen-Hypothesen durchdenken, für die vorher ein halber Workshop-Tag nötig war. Die Entscheidung bleibt beim Menschen. Sie hängt von Kontext ab, den kein Sprachmodell hat: interne Prioritäten, Budgetlage, politische Dynamiken, Timing.
Der gemeinsame Nenner
KI arbeitet auf strukturierten Inputs. Der Output wird geprüft. Der Prozess war vorher da. KI beschleunigt ihn, sie erfindet ihn (noch) nicht.
Was nicht funktioniert
Die meisten KI-Misserfolge, die mir in Marketing-Organisationen begegnen, sind keine Technologiefehler. Drei Muster sehe ich immer wieder:
- Texten ohne Prozess: Wer erwartet, ein Sprachmodell produziere auf Knopfdruck Fachartikel, Produkttexte oder Thought-Leadership-Beiträge, bezahlt mit Qualität. Output mittelmäßig, weil Input mittelmäßig, weil niemand definiert hat, was „gut” heißt. KI-gestütztes Texten funktioniert, wenn der Prozess klar ist, das Briefing substanziell und die Überarbeitung eingeplant. Besonders in B2B, wo Fachkompetenz und Branchenkenntnis im Text erkennbar sein müssen, reicht „prompten und publizieren” nicht.
- Automatisierung ohne Kontext: KI über Kampagnen laufen lassen ohne strategische Einordnung. Ein Sprachmodell kann eine Anzeigenvariante schreiben. Ob die zum Positionierungsziel passt, ob sie die richtige Phase im Buying Cycle trifft, ob die Botschaft gerade die richtige ist, das kann es nicht einschätzen.
- Piloten ohne Anschluss: Ein Team testet ein Tool, die Ergebnisse sehen gut aus, es gibt eine Präsentation. Dann passiert nichts. Kein Budget für Integration, keine definierten Verantwortlichkeiten, keine Prozessanpassung.
Die Fähigkeitsgrenze ist durchwachsen
Alle drei Muster haben eine gemeinsame Ursache: Unternehmen überschätzen, was KI in ihrem konkreten Kontext leisten kann. Ein Feldexperiment mit 776 Professionals bei Procter & Gamble zeigt, warum. Einzelpersonen mit KI erreichten zwar das Leistungsniveau von Teams ohne KI, und KI half, fachliche Silos aufzubrechen. Aber gleichzeitig wurden die Ergebnisse homogener (Dell’Acqua et al., HBS 2025).
Die Forscher hatten schon 2023 beschrieben, dass die Fähigkeitsgrenze von KI „gezackt” verläuft: Aufgaben, die oberflächlich ähnlich aussehen, können auf der richtigen oder falschen Seite liegen. Genau das erklärt, warum Pilotprojekte funktionieren, aber der Regelbetrieb scheitert, warum Textentwürfe brauchbar sind, aber fertige Fachartikel nicht, und warum Kampagnenautomatisierung ohne Kontext generisch bleibt.
Für operative Effizienz ist das Nivellieren oft nützlich. Für Markenarbeit, Positionierung und alles, was Unverwechselbarkeit braucht, ein echtes Risiko.
Warum es auf Unternehmensebene nicht ankommt
BCG bestätigt das auf breiterer Basis: Nur 5 Prozent der Unternehmen setzen KI systematisch in Kernfunktionen ein und erzeugen dabei substanziellen Wert. 35 Prozent skalieren und beginnen Wert zu realisieren. 60 Prozent schöpfen bislang kaum materiellen Wert (BCG 2025). Frühere BCG-Arbeiten fassen den Erfolgshebel als 70/20/10 zusammen: 70 Prozent in Menschen und Prozesse, 20 Prozent in Technologie, 10 Prozent in den Algorithmus (BCG 2024).
Eine weitere NBER-Studie benennt das Muster explizit: Führungskräfte nehmen Produktivitätsgewinne wahr, die größer sind als das, was sich in den Umsatzzahlen messen lässt. Die Forscher sprechen von einer Produktivitätsparadoxie. Robert Solow beobachtete 1987, dass Computer überall sichtbar seien, nur nicht in den Produktivitätsstatistiken. Bei KI wiederholt sich das gerade.
Wo sich Investition lohnt
Die bessere Frage ist nicht ob, sondern wo und unter welchen Voraussetzungen.
- Datenarbeit und Analyse: Überall, wo Marketing-Teams heute manuell synthetisieren und vergleichen, liegt ein konkreter Hebel. Wettbewerbsanalysen, Kampagnen-Reportings, Auswertung von Kundenfeedback, Zusammenfassungen aus Discovery-Calls. Das sind unsichtbare Stunden, die in keinem Projektplan auftauchen.
- Content-Workflow: KI ersetzt nicht das Schreiben. Sie macht den Prozess drumherum schneller: Recherche, Briefing-Erstellung, Variantenbildung, Optimierung bestehender Texte. Mit einem klaren Vier-Augen-Prinzip, also einem Menschen, der jedes KI-Ergebnis prüft und freigibt, funktioniert das robust. Ohne dieses Prinzip produziert es mittelmäßigen Output in höherer Geschwindigkeit. Viele Unternehmen verwechseln „schneller produzieren” mit „besser produzieren”.
- Kampagnenplanung als Sparring: KI eignet sich gut, um Hypothesen zu schärfen, bevor Budget fließt. Zielgruppen-Szenarien durchspielen, Messaging-Alternativen gegeneinander abwägen, Einwand-Kataloge für den Vertrieb vorbereiten. Der Wert liegt nicht im Output selbst, sondern darin, dass das Team schneller zu einer begründeten Entscheidung kommt.
Die entscheidende Voraussetzung
Diese drei Felder haben eine gemeinsame Voraussetzung, und McKinsey benennt sie explizit: Workflow Redesign. Von 25 getesteten Faktoren hat die Neugestaltung von Workflows den stärksten Einfluss darauf, ob Unternehmen EBIT-Wirkung aus KI erzielen. Vor dem Tool-Kauf steht eine ehrliche Bestandsaufnahme der eigenen Abläufe.
86 Prozent der befragten Führungskräfte in McKinseys State of Organizations 2026 sagen, ihre Organisation sei nicht vorbereitet, KI in den Arbeitsalltag zu integrieren. Das Tool ist da. Die Organisation ist es nicht.
Zwei Beispiele aus der Praxis
Ein Marketing-Pitch
Kürzlich hatten wir einen klassischen Pitch. Kampagnen, Website, ein nachhaltiges B2B-Verbrauchsprodukt mit zwei unterschiedlichen Zielgruppen: Einkäufer einer großen Kette, denen es um Zahlen und Konditionen geht, und inhabergeführte Betriebe, die aus Überzeugung nachhaltig einkaufen.
Die Aufgabe: Ein Konzept-Framework, das beide Zielgruppen bedient. Nur die Argumentation und Ansprache ändern sich, der Seitentyp bleibt gleich.
Ich habe meinen Part komplett KI-gestützt erarbeitet. Customer Journey Mapping, Kreativkonzept, Format-Mapping, Personas, Prototypen. Alles Schritt für Schritt iteriert, nicht auf Knopfdruck. Mein Kollege hat im Pitch dann live einen Agenten gezeigt, der Research, Zielgruppenanalyse und Personas autonom erarbeitet und eine sehr gute erste Landingpage in 20 Minuten vor den Augen des Kunden gebaut hat.
Im kleinen Rahmen funktioniert das. Aber wenn es darum geht, das im Alltag umzusetzen, wird es schwieriger. Content Creator, UX-Konzepter, Designer, Content-Strategen, jeder bringt einen anderen Wissensstand und eine andere Haltung zum Thema mit. Die alle mitzunehmen wird unsere Aufgabe.
Ein Coworking-Space-Nachbar
Im Coworking Space sitze ich neben einem Kollegen aus der Daten-Research-Abteilung eines großen Energieunternehmens. Komplett fachfremd, kein Marketing. Er hat mit ChatGPT gearbeitet.
Durch Kaffeegespräche und Über-die-Schulter-Schauen konnte ich ihm zeigen, wie wir KI einsetzen, und helfen, Prozesse bei sich aufzubauen. Der entscheidende Schritt war der Wechsel auf Claude Code, ein KI-Tool, das direkt mit lokalen Dateien und Skripten arbeiten kann. Klingt technischer als es ist, über die Desktop-App ist der Einstieg machbar. Aber das spezifische Tool ist zweitrangig. Was den Unterschied gemacht hat, war ein gutes Playbook und die Bereitschaft, sich einzuarbeiten.
Er hat ein internes Tool gebaut, das jetzt seine ganze Abteilung verwendet. An seiner vorherigen Firma: über zwei Jahre Entwicklungszeit für etwas Vergleichbares. Dieses Mal drei Wochen. Das alte Tool lief seit fünf Jahren unangetastet mit bekannten Schwachstellen, die wir im neuen Prozess gleich mit gelöst haben. Was er vorher mit verschiedenen Skripten und dutzenden Excel-Tabellen zusammengezogen hat, Standortdaten, Berechnungen, verschiedene Datenquellen, läuft jetzt in einem Tool, das sein Team direkt nutzen kann. Damit haben sie sich einen echten Marktvorteil verschafft.
Der Impuls kam nicht aus dem Unternehmen. Er kam aus dem Austausch im Coworking Space. Keine Schulung, kein Onboarding-Dokument. Sondern jemand, der daneben sitzt, live zeigt, wie er arbeitet, und Zeit hat für Rückfragen, die in keinem Tutorial vorkommen.
Was das in der Praxis heißt: sich zusammen an Themen ransetzen. Sich gegenseitig über die Schulter schauen. Ohne Scham zeigen, dass man der KI etwas diktiert und schreiben lässt. Oder eine Frage stellt, auf die man eigentlich selbst die Antwort kennen müsste. Genau da passiert der Lerneffekt. Nicht im Webinar, sondern wenn zwei Leute gemeinsam an einem echten Problem sitzen.
Dieser Artikel ist dafür ein gutes Beispiel. Er ist KI-gestützt geschrieben.
Wo anfangen
Wenn ich mit Teams über KI spreche, frage ich eigentlich immer dasselbe: Gibt es für das, was ihr tun wollt, einen vordefinierten Prozess oder Ablauf, der auch mal aufgeschrieben wurde? Meistens nicht. Dann fange ich einfacher an: Wie macht ihr das? Erzählt mal Schritt für Schritt, im Detail. Und dann schreiben wir das auf. Wer das lieber erstmal alleine machen will: Beschreib der KI, was du vorhast, und frag, was fehlt. Die Antwort ist nicht immer perfekt, aber sie gibt eine Richtung. Und wenn du unsicher bist, ob die Richtung stimmt, frag jemanden, der schon etwas weiter ist.
Transparenzhinweis: Briefing, Tonalität, Quellenprüfung, jede Iteration und jede Entscheidung über Framing und Struktur lagen bei mir. Der Prozess entscheidet, nicht das Tool.