Die meisten Google Ads Accounts haben ein Copy-Problem. Nicht, weil die Texte schlecht geschrieben sind. Sondern weil niemand weiß, warum ein Anzeigentext funktioniert — und deshalb nicht systematisch mehr davon produzieren kann.
Bei 5 Anzeigen in 2 Kampagnen ist das kein Drama. Da schreibt der Account Manager frische Headlines, testet ein paar Wochen, fertig. Aber ab einer gewissen Größe — 50+ Anzeigen, mehrere Kampagnen, quartalsweise Refreshes — wird “jedes Mal von vorne anfangen” zum strategischen Problem. Ihr verliert Learnings, wiederholt Fehler, und jede neue Iteration startet bei Null statt auf den Ergebnissen der letzten aufzubauen.
Für genau diese Accounts haben wir ein System gebaut. Heute zeigen wir, wie es funktioniert.
Warum wir das öffentlich machen? Weil “wir nutzen KI” mittlerweile jede Agentur auf ihrer Website stehen hat. Der einzige Weg, den Unterschied zu zeigen, ist: zeigen, wie es tatsächlich funktioniert.
Das Problem: Warum die meisten RSAs unter ihrem Potenzial bleiben
Ein typischer RSA-Workflow in einer Agentur:
- Account Manager schreibt 15 Headlines basierend auf dem Briefing
- Senior reviewt, ändert drei Wörter
- Alles geht live
- Google testet Kombinationen
- Nach 4 Wochen: “H3 ist Best Performer.” Aber warum? Keine Ahnung.
- Nächste Iteration: Wieder von vorne. Neues Bauchgefühl.
Was fehlt: Ein System, das versteht, welcher psychologische Hebel in H3 gewirkt hat — und diesen Hebel gezielt in neuen Varianten einsetzt.
Genau das haben wir gebaut.
Die Anatomie einer RSA: Drei Jobs, nicht 15 Headlines
Unsere Grundthese: Jede Anzeige — egal ob 30-Sekunden-Video oder RSA mit 30 Zeichen pro Headline — hat drei Jobs.
| Job | RSA-Position | Aufgabe |
|---|---|---|
| Hook | Pin 1 (H1/H2) | Aufmerksamkeit verdienen. Die Suche stoppen. |
| Beweis | Pin 2 (H3/H4) | Glaubwürdigkeit liefern. Skepsis abbauen. |
| Abschluss | Pin 3 (H5/H6) + Descriptions | Zum Handeln bewegen. Risiko nehmen. |
Das klingt simpel. Ist es auch. Aber die Implikation ist radikal: Wenn du weißt, welcher Job versagt, musst du nicht die ganze Anzeige neu schreiben. Du reparierst den einen Job.
H3 performt gut, aber die CTR ist trotzdem niedrig? Das Problem ist wahrscheinlich nicht H3 — sondern H1 (der Hook holt die Leute nicht rein). H1 hat hohe Impressionen aber wenige Klicks? Der Hook funktioniert, aber der Beweis überzeugt nicht.
Die Taxonomie: 792 mögliche Kombinationen statt Bauchgefühl
Hinter jedem RSA-Konzept stehen drei Dimensionen. Jede Dimension hat definierte Optionen. Das macht Anzeigentexte messbar, vergleichbar und reproduzierbar.
Dimension 1: Hook Types (psychologische Trigger)
Der Hook ist die erste Headline, die der Suchende sieht. Seine einzige Aufgabe: die nächsten 2 Sekunden verdienen. Nicht verkaufen, nicht erklären — nur stoppen.
Unser System kennt über 10 definierte Hook-Typen, jeder basierend auf einem spezifischen psychologischen Mechanismus. Ein paar Beispiele:
- Verlustaversion: “Der Google Ads Fehler, der Sie 40% Budget kostet” — der Suchende will den Verlust vermeiden
- Neugier: “Was Top-Performer anders machen” — Insider-Wissen, das man nicht verpassen will
- Identität: “Für Marketing-Leiter, die Ergebnisse liefern müssen” — spricht das Selbstbild an
- Direkter Schmerz: “Zu wenig Leads aus Google Ads?” — trifft den Nerv ohne Umwege
Der Punkt ist nicht, dass es genau diese Hooks gibt — sondern dass jeder Hook ein Tag bekommt. Und dieses Tag verfolgt ihn durch seinen gesamten Lebenszyklus: von der Generierung über die Performance-Messung bis zur nächsten Iteration.
Dimension 2: Value Props (JTBD-Outcomes)
Die Value Prop beantwortet: Was hat der Suchende davon? Nicht Features, sondern Outcomes nach dem Jobs-to-be-Done-Framework. Unser System arbeitet mit über einem Dutzend definierter Outcome-Typen — von “Problem lösen” über “Zeit sparen” bis “Status gewinnen.”
Dimension 3: Beweis-Strategien (Glaubwürdigkeits-Taktiken)
Der Beweis macht die eigentliche Überzeugungsarbeit. Hier entscheidet sich, ob der Suchende skeptisch bleibt oder sich öffnet. Jede Beweis-Strategie hat eine spezifische Taktik: die eine erklärt wie etwas funktioniert, die andere zeigt wer es schon nutzt, eine dritte nimmt Risiko vom Tisch.
Die Mathematik: Über 10 Hooks × 12+ Value Props × 6 Beweis-Strategien = hunderte theoretische Kombinationen. Das ist der Concept-Space, den unser System durchsucht. Kein Mensch testet das manuell. Kein Mensch muss — genau dafür ist das System da.
Die vier Concept-Strategien: Vom Gewinner zum nächsten Gewinner
Jetzt wird es praktisch. Wenn wir für eine Anzeigengruppe neue RSAs generieren, bekommt jedes Konzept eine Strategie — eine Anweisung, woher Hook, Value Prop und Beweis-Typ kommen sollen.
Strategie 1: Winner Replay 🏆
Was: Nimm die bewährte Hook×VP-Kombination und schreibe frischen Copy damit.
Wann: Wenn Account-Daten zeigen, dass eine bestimmte Kombination (z.B. pain-point × solve-problem) konstant hohe ROAS liefert.
Warum nicht einfach die alte Anzeige lassen? Weil Ad Fatigue real ist und Google frische Signale braucht. Der psychologische Hebel bleibt gleich — aber die Worte sind neu.
Strategie 2: Winner Twist 🧪
Das ist die Strategie, die alles verändert hat.
Nehmen wir an, eure Top-Combo ist pain-point × solve-problem mit mechanism-Beweis. 8,2x ROAS. Großartig.
Jetzt die Frage: Was genau treibt diese Performance? Ist es der pain-point-Hook? Die solve-problem-Value-Prop? Oder die Kombination?
Winner Twist beantwortet das. Eine Dimension ändern, den Rest fixieren:
| Test | Hook | Value Prop | Was wir lernen |
|---|---|---|---|
| Baseline (Winner) | pain-point | solve-problem | 8,2x ROAS |
| Twist A | secret | solve-problem | Liegt’s am Hook? |
| Twist B | pain-point | save-time | Liegt’s an der VP? |
Wenn Twist A bei 7,8x ROAS landet und Twist B bei 4,1x — wissen wir: Die Value Prop solve-problem ist der Performance-Treiber. Der Hook ist austauschbar. Das verändert die gesamte Copy-Strategie für diesen Account.
Warum das bei RSAs besser funktioniert als “behalte die guten Headlines”:
Google Ads zeigt dir, welche Headlines “Best” oder “Good” performen. Aber eine Headline performt nie isoliert — sie ist immer Teil einer Kombination mit anderen Headlines und Descriptions. Wenn H1 gut aussieht, könnte das daran liegen, dass H3 (die du ersetzen willst) sie erst stark gemacht hat.
Winner Twist umgeht das Problem: Wir testen nicht auf Headline-Ebene, sondern auf Konzept-Ebene. Eine Abstraktionsebene höher. Das ist robuster.
Strategie 3: Gap Explorer 🔍
Was: Teste eine Hook×VP-Kombination, die im Account noch nie gelaufen ist.
Wann: Wenn das System erkennt, dass bestimmte psychologische Hebel noch komplett ungetestet sind. Vielleicht hat der Account noch nie einen identity-Hook probiert — obwohl die Zielgruppe (CMOs, die sich beweisen müssen) dafür prädestiniert wäre.
Wie: Das System analysiert die Tag-Matrix aller existierenden Ads und findet die Lücken automatisch.
Strategie 4: Fresh Take ✨
Was: KI wählt frei — keine Vorgaben für Hook oder VP.
Wann: Für die wilden Ideen. Die Angles, auf die wir nie gekommen wären. Manchmal sind die besten Performer die, die niemand erwartet hat.
Der Mix macht’s
Pro Refresh generieren wir mehrere Konzepte gleichzeitig — in einem kalibrierten Mix aus allen vier Strategien. Wie ein Investment-Portfolio: Ein Teil repliziert Bewährtes, ein Teil testet kontrollierte Variationen, ein Teil exploriert Neuland. Das Verhältnis passt sich automatisch an die Datenlage des Accounts an.
Bevor ein Text live geht: Persona-Screening
Jedes generierte Konzept durchläuft ein Buying Committee Screening. KI-Personas — aufgebaut aus echten Kundengesprächen, nicht aus Templates — bewerten jeden Draft über mehrere Dimensionen: Bleibt der Blick hängen? Trifft es einen echten Schmerzpunkt? Würde ich draufklicken? Klingt das anders als die Konkurrenz?
Konzepte, die durchfallen, werden nicht verworfen — sie werden mit spezifischem Feedback regeneriert. “Die CFO-Persona findet den Hook zu aggressiv” ist ein präziseres Briefing als “schreib nochmal was Neues.”
Der eigentliche Wert: Die Tag-Matrix als wachsendes Asset
Die Taxonomie als Denkmodell kann jeder verstehen. Das ist auch gewollt. Was nicht so einfach nachzubauen ist: die Dateninfrastruktur, die das System antreibt.
Was im Hintergrund passiert
Jede Anzeige im Account — nicht nur die neuen, auch die bestehenden 50, 80 oder 120 — wird mit Tags versehen: Welcher Hook-Typ? Welche Value Prop? Welche Beweis-Strategie? Diese Tags werden mit den Asset-Level Performance-Daten aus Google Ads verknüpft: Impressionen, CTR, Conversion-Rate, ROAS — pro Headline, pro Description.
Das ergibt eine Tag-Matrix: eine wachsende Datenbank, die zeigt, welche psychologischen Hebel bei genau dieser Zielgruppe, in genau diesem Funnel-Stage, mit genau dieser Beweis-Strategie funktionieren. Oder eben nicht.
Warum das schwer zu replizieren ist
Bestehende Ads retroaktiv taggen klingt trivial — ist es aber nicht. Eine Headline wie “Professionelle Betreuung für Ihr Unternehmen” gleichzeitig nach Hook-Typ, Value Prop und Beweis-Strategie zu klassifizieren, erfordert ein System, das den psychologischen Intent hinter dem Copy versteht. Bei 80+ Anzeigen manuell? Viel Spaß am Wochenende. Automatisiert? Da steckt Entwicklungsarbeit drin.
Und selbst wenn die Tags stehen: Die Verknüpfung mit Performance-Daten auf Asset-Level, die Aggregation über Anzeigengruppen hinweg, die Erkennung von Gewinner-Mustern und Lücken in der Matrix — das ist keine Spreadsheet-Aufgabe. Das ist ein System.
Der Compound-Effekt
Nach 3 Monaten beginnt das System, Muster zu erkennen, die kein Mensch sieht. Welche Hook-Typen in diesem spezifischen Account überdurchschnittlich performen. Welche Beweis-Strategien bei BOFU-Kampagnen besser greifen als bei TOFU. Welche Kombinationen noch komplett ungetestet sind — obwohl die Datenlage vermuten lässt, dass sie funktionieren könnten.
Jede Iteration macht die nächste besser. Die Winner von Q1 informieren die Twists von Q2, die Gaps von Q2 werden die Winner von Q3.
Nach 6 Monaten hat ein Account ein proprietäres Playbook — nicht in einem Google Doc, sondern als lebendige Datenstruktur, die jede neue Entscheidung informiert. Das ist ein Asset, das kein Agenturwechsel replizieren kann. Weil es nicht in Köpfen steckt, sondern im System.
Warum das bei großen Accounts den Unterschied macht
Bei 5–10 Anzeigen braucht ihr kein System. Da reicht ein guter Texter und gesunder Menschenverstand. Aber ab einem bestimmten Punkt kippt die Dynamik:
10–30 Anzeigen: Ihr wisst noch ungefähr, was ihr getestet habt. Refreshes sind manuell machbar.
30–50 Anzeigen: Erste Redundanzen. Niemand erinnert sich, ob der identity-Hook schon in der MOFU-Kampagne lief. Manche Angles werden dreifach getestet, andere nie.
50+ Anzeigen: Ohne Taxonomie ist das Chaos. Jeder Refresh startet bei Null. Learnings gehen verloren, weil sie an Headlines kleben statt an psychologischen Mustern. Account Manager wechseln, und das implizite Wissen geht mit.
Genau hier wird die Taxonomie zum Wettbewerbsvorteil. Jede Anzeige ist getaggt. Jedes Pattern ist dokumentiert. Jeder Refresh baut auf dem vorherigen auf — egal wer ihn durchführt. Das ist der Unterschied zwischen “wir testen Ad Copy” und “wir haben ein System, das mit jedem Test klüger wird.”
In der Praxis sieht das so aus: Ein Account mit 80 Anzeigen in 12 Anzeigengruppen bekommt quartalsweise einen systematischen Refresh. Das System erkennt, dass identity-Hooks in 3 von 12 Anzeigengruppen nie getestet wurden, dass mechanism-Beweise in BOFU-Kampagnen 40% besser performen als social-proof, und dass die Kombination secret × unfair-advantage in keiner einzigen Anzeige vorkommt. Das sind keine Vermutungen — das sind Datenlücken, die das System automatisch findet.
Das Prinzip “eine Variable isolieren, den Rest fixieren” ist aus der Wissenschaft bekannt als kontrolliertes Experiment. Wir haben es für Google Ads RSAs operationalisiert.
Ist das der richtige Ansatz für euch?
Ehrliche Antwort: Nicht für jeden.
Wenn ihr 3 Kampagnen mit je 2 Anzeigengruppen habt und alle paar Monate mal neue Headlines schreibt — braucht ihr das nicht. Ein guter Texter reicht.
Wenn ihr hier nickt, schon eher:
“Wir haben 50+ Anzeigen und jeder Refresh fühlt sich an wie von vorne anfangen.” → Euch fehlt die Abstraktionsebene. Ihr testet Headlines, aber lernt nichts über die Muster dahinter. Die Taxonomie macht jede Iteration zum Input für die nächste.
“Unser Account Manager hat gewechselt und alle Learnings sind weg.” → Implizites Wissen (“dieser Hook funktioniert bei der Zielgruppe”) geht verloren, wenn es in Köpfen statt in Tags steckt. Ein getaggter Account überlebt jeden Personalwechsel.
“Wir geben 10k+ pro Monat für Search aus und optimieren Bidding und Keywords — aber Copy ist immer noch Bauchgefühl.” → Die meisten Accounts optimieren 80% der Hebel (Budget, Bidding, Keywords, Targeting) und ignorieren den einen, der laut Google für 15% der Ad Rank-Berechnung verantwortlich ist: Ad Copy Quality.
“Wir testen viel, aber nach 20 Tests wissen wir nicht mehr als nach 2.” → Ohne Tags compound-et nichts. Mit Taxonomie wird jeder Test zum Datenpunkt in einer wachsenden Matrix.
Häufige Fragen
Funktioniert das nur für B2B?
Die Taxonomie funktioniert für jede Branche. Die Hook Types und Value Props sind universelle psychologische Prinzipien. Allerdings haben wir das System für B2B optimiert — wo längere Sales Cycles und mehrere Entscheider (Buying Committee) eine systematische Herangehensweise besonders wertvoll machen.
Ab welcher Account-Größe lohnt sich das?
Das System entfaltet seinen Wert ab ca. 30+ Anzeigen über mehrere Kampagnen hinweg, die regelmäßig refresht werden. Darunter ist der manuelle Aufwand geringer als der Systemaufwand. Budget-seitig braucht ihr genug Daten pro Anzeigengruppe für statistisch belastbare Asset-Performance — in der Praxis ab ca. 5.000 € Monatsbudget für Search. Die Taxonomie als Denkmodell könnt ihr aber ab Tag 1 nutzen.
Ersetzt KI den Texter?
Nein. KI generiert Varianten basierend auf der Taxonomie — aber die strategischen Entscheidungen (welche Hooks testen wir zuerst? Wie aggressiv darf der Ton sein?) treffen wir. Die KI ist das Instrument. Die Taxonomie ist die Partitur. Wir dirigieren.
Wie unterscheidet sich das von “ChatGPT schreib mir Anzeigentexte”?
In etwa so wie ein Orchester sich von jemandem unterscheidet, der Klavier spielen kann. ChatGPT kann Ad Copy schreiben. Aber es weiß nicht, welche Hook×VP-Kombination in eurem Account bei welchem Funnel-Stage performt, welche Personas auf welche Beweis-Typen reagieren, und welche Lücken in eurer Test-Matrix noch offen sind. Unser System weiß das — weil es auf echten Account-Daten sitzt.
Kann ich das selbst aufbauen?
Das Denkmodell — drei Dimensionen, jede Anzeige taggen — könnt ihr sofort anwenden. Allein die Übung, bestehende RSAs nach psychologischem Hebel zu klassifizieren, wird euch Muster zeigen.
Die Infrastruktur dahinter — retroaktives Tagging von 80+ Anzeigen, Verknüpfung mit Asset-Level Performance-Daten, automatische Gap-Erkennung, Persona-Screening, datengetriebene Concept-Auswahl — das ist ein anderes Projekt. Wir haben Monate daran gebaut.