Dokumentation

Methodik des AI Search Citation Optimizer

Was der Citation Optimizer misst

Wenn jemand ChatGPT eine Recherchefrage stellt, antwortet das Modell nicht aus dem Gedächtnis. Es führt eine Suche durch, sortiert die Ergebnisse, liest die besten Seiten und setzt eine Antwort aus den Passagen zusammen, denen es vertraut. Jeder dieser Schritte ist eine Entscheidung: suchen oder nicht, diese Route oder jene, diese Seite behalten oder verwerfen, diese Passage übernehmen oder überspringen.

Der AI Search Citation Optimizer modelliert diesen Weg als Abfolge von Gates. Ein Gate ist eine einzelne Pass-, Warn- oder Fail-Entscheidung, die die Pipeline zwischen der Frage eines Nutzers und einer finalen Zitation trifft. Da jedes Gate auf einen bekannten oder annähernd bekannten Algorithmus abbildet, können wir einen Inhalt durch jedes Gate laufen lassen und Ihnen genau zeigen, wo er bestehen bleibt und wo er herausfällt.

Das Ergebnis ist eine Ampel: grün, wo Ihr Inhalt ein Gate passiert, gelb, wo er gefährdet ist, rot, wo er scheitert. Zu jeder Warnung und jedem Fehlschlag gehört eine konkrete, umsetzbare Empfehlung. Das ist der Unterschied zwischen einem Tool, das Ihnen sagt, wo Sie stehen, und einem, das Ihnen sagt, was zu tun ist.

Diese erste Version modelliert die ChatGPT-Pipeline für B2B-typische Rechercheanfragen. Weitere Pipelines folgen; siehe Weitere Pipelines unten.


Warum eine Pipeline und kein Prompt-Tracker

Die meisten Tools für AI-Sichtbarkeit schicken Prompts an ein Modell und berichten, was zurückkommt. Das zeigt Ihren aktuellen Stand, beruht aber auf einem beweglichen Ziel. KI-Antworten sind nicht deterministisch; sie schwanken je nach Sitzung, Nutzer und Personalisierung. Mehr Prompts verringern das Rauschen, beseitigen es aber nie, und sie sagen nie, was Sie ändern sollten.

Die Retrieval-Pipeline ist anders. Bei Rechercheanfragen nutzt ChatGPT Retrieval-Augmented Generation (RAG): Es durchsucht das Web, sortiert Ergebnisse, liest Seiten und bewertet Passagen nach Relevanz. Anders als der finale Wortlaut einer Antwort folgen diese Retrieval-Schritte veröffentlichten, wiederholbaren Algorithmen. Sie sind messbar, und Sie können dafür optimieren. Genau das tut der Citation Optimizer.


Die acht Gates

Ein Lauf beginnt mit einem Fan-out — einer echten Suchanfrage, die die Pipeline der Plattform selbst erzeugt hat und die aus Ihrem AI-Visibility-Bericht stammt — und einer Seite (Ihre Live-URL, ein Entwurf oder ein Earned-Media-Fragment). Die Gates laufen der Reihe nach. Die ersten drei beschreiben die Anfrage, gegen die der Lauf bewertet wird; die letzten fünf bewerten Ihren Inhalt.

Gate 1 — Löst die Anfrage eine Suche aus?

Manche Fragen beantwortet ChatGPT direkt aus den Trainingsdaten, ohne Suche und damit ohne Zitationsmöglichkeit. Dieses Gate bestätigt, dass die Anfrage eine ist, die Retrieval auslöst. Bei einem getrackten Fan-out ist die Antwort bereits bekannt: Die Anfrage existiert, weil die Plattform danach gesucht hat. Bei einer selbst eingegebenen Freitext-Anfrage beurteilt ein leichtgewichtiges Modell die Suchwahrscheinlichkeit. Dieses Gate warnt nur; es blockiert nie.

Gate 2 — Wird die Anfrage auf die Recherche-Pipeline geleitet?

ChatGPT verwendet für unterschiedliche Absichten unterschiedliche Pipelines. Eine Shopping-Anfrage, eine News-Anfrage und eine B2B-Rechercheanfrage werden verschieden behandelt. Diese Version modelliert die Recherche-Text-Pipeline, daher prüft dieses Gate, ob die Anfrage dorthin geleitet wird. Bei einem getrackten Fan-out ist die Route bestätigt; bei Freitext klassifiziert ein leichtgewichtiges Modell die Absicht. Dieses Gate warnt, statt zu blockieren, sodass Sie auch bei einer themenfremden Anfrage Inhaltsempfehlungen erhalten.

Gate 3 — Fan-out-Bestätigung

Dieses Gate ist informativ. Es zeigt den echten, beobachteten Fan-out, gegen den der Lauf bewertet wird, woher er stammt und welche Wettbewerberseiten bereits dafür ranken. Wir erfinden bewusst keine Anfragen und erzeugen keine semantischen Varianten. Ein Lauf ist nur so vertrauenswürdig wie die Anfrage dahinter, daher verwenden wir die selbst beobachteten Fan-outs der Plattform wortgetreu. Eine Freitext-Anfrage wird immer klar als unbestätigt gekennzeichnet.

Gate 4 — Erster Kandidatenfilter (die SERP)

Bevor ChatGPT Ihre Seite lesen kann, muss Ihre Seite im Pool der Ergebnisse stehen, die seine Suche zurückgibt. Dieses Gate ruft die organischen Suchergebnisse für den Fan-out ab und prüft, ob Ihre Domain in den Top 30 rankt. Eine Lücke hier ist keine Sackgasse; sie ist meist Ihr wichtigster Befund. Daher ist dieses Gate ehrlich, aber nicht blockierend: Wenn Sie noch nicht ranken, zeigt es Ihnen die Seiten, die ranken (das Vorbild), und Ihre nächstgelegene bestehende Seite (den Ausgangspunkt zum Verbessern), und die Pipeline bewertet Ihren Inhalt weiter, sodass Sie dennoch einen vollständigen Satz Empfehlungen erhalten.

Gate 5 — Abrufen und in Chunks teilen

ChatGPT liest Seiten in kleinen Passagen, nicht als ganze Dokumente. Dieses Gate ruft Ihre Seite ab, wandelt sie in sauberen Text um und teilt sie in Token-Fenster, um zu prüfen, dass kohärente, zitierbare Passagen existieren. Seiten, die nicht erreichbar, blockiert oder zu dünn zum Chunking sind, scheitern hier, weil es nichts zu lesen gibt. Dies ist ein hartes Gate.

Gate 6 — Semantisches Embedding und neuronales Reranking

Retrieval gleicht nicht über Schlüsselwörter ab, sondern über Bedeutung. Dieses Gate bettet Ihre beste Passage und die Anfrage in denselben Vektorraum ein und misst ihre Ähnlichkeit. Anschließend läuft ein quelloffener neuronaler Reranker, der den Cross-Encoder annähert, den ChatGPT verwendet, um eine schärfere, direkte Relevanzbeurteilung zu treffen. Wenn Sie eine Ranking-Lücke haben, wird Ihre Passage gegen die Wettbewerberseiten gerankt, die tatsächlich ranken, sodass der Vergleich real ist. Sehr geringe Relevanz scheitert hier.

Gate 7 — Tiefenlesen-Audition

Die Seiten, die das Reranking überstehen, werden genauer geprüft. Dieses Gate kombiniert Passagenrelevanz, Publisher-Autorität (aus denselben Daten wie der AI Placement Value Score) und Inhaltsqualität zu einem Gesamturteil darüber, ob Ihre Seite einen Platz unter den Finalisten verdient.

Gate 8 — Synthese-Bereitschaft

Schließlich setzt das Modell seine Antwort aus den Gewinnerpassagen zusammen. Dieses Gate prüft, ob Ihre Passage bereit ist, übernommen zu werden: Ist sie eigenständig genug, um für sich zu stehen, beantwortet sie die Frage zuerst, statt den Kern zu vergraben, und ist sie dicht an relevanten Entitäten? Die Eigenständigkeit wird an der Kernpassage beurteilt; Antwort-zuerst und Entitätsdichte am breiteren Fenster, das das Modell tatsächlich liest.


Was forschungsbasiert ist und wo wir annähern

Der Citation Optimizer baut auf veröffentlichter Forschung dazu auf, wie sich KI-Zitations-Pipelines verhalten, sowie auf forensischer Analyse echten ChatGPT-Retrieval-Verkehrs. Wir machen deutlich, welche Teile fundiert sind und welche Schätzungen.

Forschungsbasiert:

  • Die Gate-Abfolge selbst. Der Pfad Suche → Route → Retrieval → Reranking → Lesen → Synthese ist über Primärquellen dokumentiert und in der Netzwerk-Log-Analyse echter Retrievals reproduziert.
  • Das Chunk-Modell. Wir teilen Inhalte in ~200-Token-Fenster, die an Satz- und Strukturgrenzen ausgerichtet sind, das Ziel, das OpenAIs dokumentiertes Retrieval-Tooling verwendet, und wir auditionieren jede Passage zusammen mit ihren Nachbarn (derselbe Satzfenster-Ansatz wie beim AI Placement Quality Score). Wir entfernen bewusst keine Boilerplate vor dem Chunking, weil die echte Pipeline das auch nicht tut.
  • Position und Antwort-zuerst-Bias. Stark zitierte Inhalte stellen ihre Antwort nach vorne; Passagen, die spät auf einer Seite vergraben sind, werden deutlich seltener zitiert. Das Synthese-Gate spiegelt dies wider.

Wo wir annähern:

  • Der Reranker. ChatGPTs exakter Cross-Encoder ist proprietär. Wir verwenden einen quelloffenen neuronalen Reranker, der sich ähnlich verhält. Die relative Reihenfolge, die er erzeugt, ist getreu; die absoluten Werte stammen aus unserem Modell, nicht aus ChatGPT.
  • Die Anfrage-Gates. Bei Freitext-Anfragen beurteilen wir mit einem leichtgewichtigen Modell die Suchwahrscheinlichkeit und Absicht. Das sind Schätzungen und warnen, statt zu blockieren. Getrackte Fan-outs überspringen das Raten vollständig.
  • Schwellenwerte. Die genauen Grenzwerte einer Plattform sind unbekannt. Unsere sind gegen beobachtetes Verhalten kalibriert und verschieben sich, wenn sich die Pipelines weiterentwickeln. Jeder Lauf hält die Modellversion fest, unter der er bewertet wurde, sodass alte und neue Werte interpretierbar bleiben.

Vom Score zum Rewrite

Das Scoring zeigt, wo Inhalte herausfallen. Der Optimizer schließt anschließend den Kreis.

Für jede Warnung und jeden Fehlschlag erzeugt der Optimizer eine Empfehlung, die auf der Inhaltsvorlage für Ihren Seitentyp basiert (Produkt, Startseite, informativ, Pressemitteilung oder allgemein). Sie können diese Empfehlungen selbst umsetzen oder den Optimizer ein Rewrite erstellen lassen: einen überarbeiteten Entwurf, der die Antwort nach vorne stellt, Passagen strafft und für Zitation umstrukturiert, samt überarbeitetem Titel, Meta-Beschreibung und seitengerechten strukturierten Daten (JSON-LD). Das Rewrite erfindet niemals Fakten, Statistiken oder Qualifikationen; es arbeitet mit dem, was Ihr Inhalt bereits belegt.

Jedes Rewrite enthält unbegrenztes Neu-Scoring, sodass Sie überarbeiten und erneut prüfen können, bis die Seite bereit ist. Der Optimizer verfolgt die Verbesserung über die Iterationen hinweg und sagt Ihnen, wann der Inhalt veröffentlichungsreif ist oder ein Plateau erreicht hat, damit Sie wissen, wann Sie aufhören können.


Den Kreislauf aus einem KI-Assistenten steuern (MCP)

Der gesamte Kreislauf aus Score → Rewrite → Neu-Score steht einem verbundenen KI-Assistenten über den Spyglasses MCP-Server zur Verfügung, sodass Sie Inhalte im Gespräch statt per Klick durch das Dashboard optimieren können.

Der Server liegt unter https://www.spyglasses.io/api/mcp und authentifiziert sich über OAuth mit Ihrem Spyglasses-Konto. Seine Citation-Tools bilden einen Kreislauf, den der Assistent für Sie ausführt:

  • list_tracked_fanouts — der Einstiegspunkt: die echten Fan-outs, für die Ihre Property getrackt wird, mit der höchsten Wirkung zuerst, jeweils als Ranking-Lücke markiert oder nicht.
  • match_pages_for_fanout, list_property_pages, list_placements / get_placement — die Seite, den Entwurf oder das Earned Placement auswählen, das optimiert werden soll.
  • score_citation_pipeline — bewerten; gibt eine Lauf-ID zum Abfragen zurück.
  • get_pipeline_run — die Gate-Ergebnisse, Empfehlungen und ein Bereitschaftsurteil lesen, das dem Assistenten sagt, ob er erneut überarbeiten oder aufhören soll.
  • revise_content / get_revision — ein Rewrite erstellen und lesen.
  • rescore_revision — den überarbeiteten Inhalt neu bewerten und so den Kreis schließen.

Scoring und Überarbeitung laufen als Hintergrundjobs, daher startet der Assistent die Arbeit und fragt die Ergebnisse ab. Jedes Tool ist auf Ihre eigenen Properties beschränkt, und es wird niemals etwas in Ihrem Namen veröffentlicht. Zur Einrichtung siehe Mit Ihren Berichten chatten.


Weitere Pipelines auf der Roadmap

Diese Version modelliert die ChatGPT-Recherche-Pipeline, weil sie am besten dokumentiert ist und ihre Gates am wiederverwendbarsten sind. Dasselbe Gate-Framework lässt sich auf andere Assistenten erweitern, und die folgenden Pipelines sind für das 3. Quartal 2026 geplant:

  • Google AI Overviews
  • ChatGPT Business, Pro und Deep Research
  • Claude
  • Google AI Mode und Gemini

Jede wird den Gate-Scoring-Ansatz wiederverwenden; viele Gates teilen Dienste mit der ChatGPT-Pipeline. Bis eine Pipeline modelliert ist, bewertet der Optimizer ausschließlich gegen ChatGPT und kennzeichnet andere Plattformen als noch nicht bewertbar.


Was dieses Tool ist — und was nicht

Was es ist:

  • Ein forschungsbasiertes Modell einer echten Retrieval-Pipeline, Gate für Gate bewertet, mit einer konkreten Empfehlung für jede Schwäche.
  • Ehrlich bei Lücken. Eine Seite, die noch nicht rankt, erhält trotzdem einen vollständigen Satz Inhaltsempfehlungen und einen Blick auf die Seiten, die sie schlagen muss.
  • Reproduzierbar. Jeder Lauf hält fest, gegen welche Anfrage er bewertet wurde, woher die Anfrage stammt und unter welcher Modellversion er lief.

Was es nicht ist:

  • Eine Garantie für Zitation. Jedes Gate zu passieren bedeutet, dass die strukturellen Faktoren vorhanden sind. Es garantiert nicht, dass eine Plattform Ihre Seite für eine bestimmte Anfrage an einem bestimmten Tag zitiert; KI-Antworten bleiben nicht deterministisch.
  • Ein Schlüsselwort-Generator. Der Optimizer bewertet gegen echte, beobachtete Fan-outs, nicht gegen erfundene Anfragen. Eine Freitext-Anfrage ist immer erlaubt, wird aber immer als unbestätigt gekennzeichnet.
  • Eine statische Kennzahl. Wenn sich die Pipelines ändern, ändern sich die Gates, Schwellenwerte und der Reranker mit. Die Modellversion auf jedem Lauf hält historische Werte interpretierbar.