Prompt-Tracking: Wie messbar ist AI-Sichtbarkeit wirklich?

Neue Tools versprechen Transparenz über Markenpräsenz in ChatGPT und Co. Die Realität ist komplizierter.

Unter ein Prozent. So viel macht die gesamte Nutzung von KI-Tools an der Desktop-Aktivität in den USA aus, Stand Ende 2025. Das sind die Zahlen aus dem Datos/SparkToro-Report Q4 2025. Google dominiert die Suche weiterhin klar, auch wenn die exakten Anteile je nach Messgröße variieren.

Anteil an US-Desktop-Suchaktivität – Diagramm zeigt KI-Tools mit unter einem Prozent gegenüber Google
Anteil an US-Desktop-Suchaktivität · Quelle: Datos/SparkToro, Q4 2025

Das sind die Proportionen, die man kennen sollte, bevor man über AI-Sichtbarkeit redet. Denn in vielen Gesprächen, die ich mit Marketing- und Produktverantwortlichen führe, schwingt eine Dringlichkeit mit, die mit diesen Zahlen nur schwer zusammenpasst. „Tauchen wir in ChatGPT auf?” ist eine berechtigte Frage. Aber wer daraus schließt, dass hier die nächste große Budget-Umschichtung stattfinden muss, überschätzt die heutige Reichweite dieser Kanäle.

Die Daten zeigen auch: AI wirkt derzeit eher additiv als substitutiv. Die Nutzung von KI-Tools wächst, aber sie ersetzt die klassische Suche nicht. Gleichzeitig suchen Google-Nutzer in den USA pro Person rund 20 Prozent weniger als im Vorjahr, und 56 Prozent aller Desktop-Suchen bei Google enden ohne externen Klick. Die Landschaft verschiebt sich, aber langsamer und anders als die lautesten Stimmen auf LinkedIn behaupten. Auch wenn der Anteil in Tech-affinen B2B-Zielgruppen höher ausfallen dürfte als im Massenmarkt: Die Grundregel bleibt bestehen.

Trotzdem lohnt es sich, jetzt mit dem Messen anzufangen. Nicht weil der Kanal schon groß genug wäre, um Budgets zu rechtfertigen, sondern weil man Veränderungen nur erkennen kann, wenn man eine Baseline hat. Die Frage ist, wie belastbar die Messung heute sein kann und was man dafür an Vorarbeit braucht.

Prompt-Tracking ist kein Keyword-Tracking

Im klassischen SEO gibt es eine klare Währung: Suchvolumen, Wettbewerb, Rankingposition. Das Messsystem ist seit 20 Jahren eingespielt. Prompt-Tracking versucht etwas Vergleichbares für KI-Antworten zu bauen und steht dabei vor komplett anderen Voraussetzungen.

Es gibt kein öffentliches Suchvolumen für Prompts. Niemand weiß, wie oft eine bestimmte Frage in ChatGPT gestellt wird. Jede Antwort hängt vom Kontext ab: Nutzerhistorie, Standort, Modellversion, Tageszeit. Und die Ergebnisse sind volatil — dieselbe Frage liefert morgen eine andere Antwort, mit anderen Quellen und anderen Markenempfehlungen.

Prompt-Tracking ist im Grunde eher mit Word-of-Mouth-Monitoring vergleichbar als mit Keyword-Tracking. Bei Keywords misst man, wie viele Menschen danach suchen. Bei Prompts misst man, ob eine KI die eigene Marke in ihrer Antwort berücksichtigt, wenn eine bestimmte Frage gestellt wird. Die Frage, ob überhaupt gefragt wird und wie oft, bleibt ein blinder Fleck.

Warum der Einstieg in der Praxis oft scheitert

Wenn ich Prompt-Tracking für ein Unternehmen aufsetze, beginne ich mit zwei Grundunterscheidungen: Brand- und Non-Brand-Fragen getrennt, und das Ganze entlang der Customer Journey aufgeteilt. Das klingt überschaubar. In der Praxis zeigt sich aber schnell, wie viel Vorarbeit oft fehlt.

Nehmen wir zwei Beispiele aus unterschiedlichen Branchen.

B2B-Software: Ein Anbieter von ERP-Systemen hat mindestens drei Zielgruppen mit komplett unterschiedlichen Fragen. Der CFO fragt nach Kosten und ROI. Der IT-Leiter will wissen, welche Schnittstellen es gibt, wie die Datenmigration funktioniert und ob das System on-premise läuft. Der Fachabteilungsleiter fragt, ob das Tool seine konkreten Workflows abbilden kann. Ein Prompt-Set für dieses eine Produkt könnte so aussehen:

PhaseCFOIT-LeiterFachabteilungsleiter
Awareness”Wie lassen sich Prozesskosten in der Fertigung durch Software senken?""Welche ERP-Architekturen eignen sich für hybride IT-Landschaften?""Wie kann ein ERP-System die Produktionsplanung vereinfachen?”
Consideration”Welche ERP-Systeme haben die niedrigsten Total Cost of Ownership?""Welche ERP-Systeme bieten REST-APIs und SAP-Integration?""Welches ERP-System bildet mehrstufige Fertigungsprozesse am besten ab?”
Decision”Was kostet [Marke] ERP für ein mittelständisches Unternehmen?""[Marke] vs. [Wettbewerber] ERP Sicherheit und Hosting""Erfahrungen mit [Marke] ERP in der Lebensmittelindustrie?”

Das sind 9 Prompts für ein Produkt. In der Praxis kommen Varianten dazu, regionale Unterschiede, Branchenspezifika. 20 bis 40 Prompts pro Produkt sind realistisch.

Industrie: Dieselbe Mechanik gilt für physische Produkte. Ein Hersteller von Industriepumpen hat einen Anlagenbauer, der nach technischen Spezifikationen und Zertifizierungen fragt, einen Einkäufer, der Lieferzeiten und Ersatzteilverfügbarkeit wissen will, und einen Nachhaltigkeitsverantwortlichen, der nach Energieeffizienz fragt. Auch hier: drei Zielgruppen, drei Prompt-Cluster, und das für jede Phase der Customer Journey.

Bei einem Unternehmen mit dutzenden Produkten wird das schnell teuer, bei den Tool-Kosten und beim Aufwand.

Aber das eigentliche Problem liegt eine Ebene tiefer. Viele Unternehmen, mit denen ich spreche, haben ihre Zielgruppen-Personas nicht sauber definiert. Sie kennen ihre Customer Journey nicht im Detail. Und dann sollen sie plötzlich Prompts formulieren, die abbilden, wie verschiedene Käufertypen in verschiedenen Entscheidungsphasen fragen? Das funktioniert nicht.

Prompt-Tracking setzt Klarheit über Zielgruppen und Kaufprozesse voraus. Wer diese Basis nicht hat, muss sie erst schaffen, bevor Monitoring überhaupt Sinn ergibt.

Wie man die Grundlagen erarbeitet

Der Weg dahin muss nicht aufwendig sein. Was ich in der Praxis empfehle:

  1. Die drei bis fünf wichtigsten Buyer Personas identifizieren. Nicht als umfangreiche Persona-Dokumente, sondern als knappe Profile: Wer entscheidet, wer beeinflusst, was ist die zentrale Fragestellung jeder Rolle? Beim ERP-Beispiel oben wären das CFO, IT-Leiter und Fachabteilungsleiter. Im Gespräch mit dem Vertrieb lässt sich das meistens in ein bis zwei Stunden klären.

  2. Die Customer Journey in drei Phasen skizzieren. Awareness (Problem erkannt, noch kein Produkt im Blick), Consideration (Optionen werden verglichen) und Decision (konkreter Kauf steht an). Für jede Persona und jede Phase ein bis zwei realistische Fragen formulieren. Das ergibt ein erstes Prompt-Set, das überschaubar bleibt, aber die relevanten Achsen abdeckt.

  3. Brand und Non-Brand trennen. Auf der einen Seite Fragen, in denen der Markenname vorkommt (“Was kostet [Marke] ERP für den Mittelstand?”), auf der anderen Seite generische Fragen (“Welche ERP-Systeme eignen sich für mittelständische Fertigungsunternehmen?”). Die Non-Brand-Fragen sind strategisch wichtiger, denn sie zeigen, ob die eigene Marke in generischen Empfehlungsantworten auftaucht, ohne dass jemand explizit nach ihr sucht.

Wer diese drei Schritte durchlaufen hat, kommt auf ein Prompt-Set von vielleicht 30 bis 50 Fragen. Das ist ein sauberer Startpunkt. Nicht perfekt, aber belastbar genug, um erste Muster zu erkennen.

Die Tool-Frage

Der Markt für AI-Visibility-Tools ist Anfang 2026 unübersichtlich. Spezialisierte GEO-Tools wie Peec AI oder Profound, Erweiterungen etablierter SEO-Suiten wie Ahrefs Brand Radar oder Sistrix, API-basierte Ansätze wie DataForSEO. Alle messen etwas Ähnliches, aber mit unterschiedlichen Methoden und kaum Vergleichbarkeit untereinander. Einen ausführlichen Vergleich spare ich mir hier, weil er bei Erscheinen schon veraltet wäre.

Was sich dagegen lohnt zu verstehen, ist ein Unterschied, der in der Praxis oft übersehen wird: Google AI Overviews und AI Mode leben innerhalb der Google-Suche. Sie lassen sich mit bestehenden SEO-Tools teilweise abbilden, weil sie an konkrete Suchanfragen gekoppelt sind. Chatbot-Antworten von ChatGPT, Perplexity oder Gemini als eigenständige Produkte sind eine andere Kategorie. Höhere Volatilität, weniger messbarer Traffic, aber die Interaktion geht tiefer. Wer in einer detaillierten, fünfminütigen Unterhaltung mit ChatGPT als Lösung empfohlen wird, hat einen anderen Einfluss auf die Kaufentscheidung als Position 3 in einer AI Overview.

Die ehrliche Bestandsaufnahme: Kein Tool liefert heute, was Google Search Console für SEO liefert. Die gesamte Branche misst kontrollierte Stichproben unter definierten Bedingungen, nicht die Realität aller Nutzeranfragen.

Was sich trotzdem lohnt

Was ich sehe, wenn ich Prompt-Tracking bei Unternehmen einführe: Der größte Wert liegt nicht in den absoluten Zahlen, sondern in den Mustern, die sichtbar werden.

  • Baseline aufbauen: Wer erst in einem Jahr anfängt zu messen, hat keine Vergleichswerte. Ein stabiler Prompt-Katalog mit 30 bis 50 Fragen zu den wichtigsten Produkten, monatlich ausgewertet, reicht als Startpunkt. Die absolute Genauigkeit ist zweitrangig, was zählt, ist die Veränderung über die Zeit.
  • Brand/Non-Brand-Trennung auswerten: Sie zeigt auf einen Blick, ob ein Unternehmen nur dann in KI-Antworten vorkommt, wenn jemand explizit danach fragt, oder ob es auch bei generischen Empfehlungsfragen auftaucht. Wer in den Non-Brand-Antworten fehlt, hat ein Positionierungsproblem, kein SEO-Problem.
  • Quellenanalyse vor Mention-Zählung: Welche Websites werden als Grounding Sources zitiert? Eine Semrush-Analyse von 325.000 Prompts über ChatGPT Search, Google AI Mode und Perplexity zeigt: LinkedIn ist eine der meistzitierten Plattformen, und vor allem längere LinkedIn-Artikel tauchen überproportional häufig als Quelle auf. Für Unternehmen, die auf LinkedIn publizieren, ist das ein konkreter Ansatzpunkt.
  • First-Party-Daten nicht vergessen: Prompt-Tracking ist nur eine Seite der Messung. Die andere sind die eigenen Analytics. Google Search Console zählt AI Overviews und AI Mode bereits in Klicks und Impressions mit. ChatGPT-Search-Referrals kommen mit utm_source=chatgpt.com und lassen sich in GA4 sauber tracken. Wer eine Custom Channel Group für AI Assistants anlegt, sieht dort schon heute, wie viel Traffic tatsächlich über KI-Systeme kommt. Das ist keine Stichprobe, sondern echte Outcome-Daten.

Sparen kann man sich dagegen:

  • Vom ersten Tag an jedes Produkt und jeden Markt abzudecken. Lieber mit fünf bis zehn Kategorien starten und nach 30 Tagen auswerten, wo die Lücken liegen.
  • Tägliches Monitoring. Wöchentlich oder monatlich reicht.
  • Die Metapher eines „AI-Rankings” als neue Kennzahl. Sie erzeugt Erwartungen an Stabilität und Vergleichbarkeit, die dieses Feld nicht einlösen kann.

Was als Nächstes passieren muss

Prompt-Tracking ist 2026 ein nützliches Frühwarnsystem. Kein Steuerungsinstrument. Der Unterschied ist wichtig.

Damit aus Monitoring echte Steuerung wird, müssen zwei Dinge passieren:

  1. Das Volumenproblem braucht bessere Lösungen. Erste Proxies existieren: Ahrefs leitet Prompt-Popularität aus Suchvolumen ab, Semrush weist geschätzte AI-Nachfrage aus. Aber ein plattformübergreifender, unabhängig verifizierter Nachfrage-Standard für AI-Prompts fehlt noch.
  2. Die Branche braucht so etwas wie eine Prompt-Taxonomie, die über einzelne Tool-Ökosysteme hinaus funktioniert.

Bis dahin gilt: Anfangen, pragmatisch bleiben, die Daten mit Vorsicht interpretieren. Für den Anfang ist das nicht wenig.