Alle Artikel
KI & Automatisierung

Wie wir KI-Ads erstellen: Der komplette Workflow Schritt für Schritt

Hinter den Kulissen unseres Ad-Studio-Workflows: Von der Persona über Gemini Vision AI bis zum 5-Dimensionen-Scoring. So entstehen B2B-Anzeigen mit System statt Bauchgefühl.

von Robert Blessing | zuletzt aktualisiert:
Wie wir KI-Ads erstellen: Der komplette Workflow Schritt für Schritt

Coca-Cola generiert Holiday-Ads mit AI. H&M erstellt Digital Twins für Fashion-Shoots. Virgin Voyages baut personalisierte Video-Avatare. Enterprise-Marken investieren Millionen in KI-gestützte Kampagnen.

Alles beeindruckend. Aber für B2B-Teams mit 5.000 € Display-Budget pro Monat eher Inspiration als Anleitung.

Deshalb zeigen wir heute: Wie ein 2-Personen-Team mit einem eigenen KI-System Ads erstellt, die mit Enterprise-Output mithalten – ohne Enterprise-Budget.

Kein “Top 10 AI Tools”-Listicle. Sondern der echte Workflow. Schritt für Schritt.

Warum wir unseren Workflow öffentlich machen

Kurze Antwort: Weil Transparenz mehr Vertrauen schafft als jede Sales-Seite.

Lange Antwort: Der Markt ist voll von Agenturen, die “KI-gestützt” auf ihre Website schreiben und damit meinen, dass ein Junior ChatGPT für Ad Copy nutzt. Wir meinen damit 9 spezialisierte KI-Skills, eine eigene Web-App und ein Persona-System, das jede Kampagne auf die Zielgruppe zuschneidet.

Der einzige Weg, diesen Unterschied zu beweisen, ist: zeigen, wie es funktioniert.

Das Problem, das wir lösen

Ein typischer B2B-Display-Workflow sieht so aus:

  1. Marketing-Leiter briefed Agentur: “Wir brauchen Banner für unsere neue Kampagne”
  2. Designer erstellt 3 Varianten in Canva
  3. Geschäftsführer wählt die “schönste” aus
  4. Banner gehen live
  5. CTR: 0,15 %. Niemand ist überrascht.

Was fehlt: Zielgruppen-Steuerung, systematische Varianz, objektive Bewertung und Performance-Vorhersage.

Unser Workflow löst jedes dieser Probleme. Hier ist er komplett, von Anfang bis Ende.

Schritt 1: Persona laden – die KI weiß, für wen sie arbeitet

Bevor irgendetwas generiert wird, laden wir die Zielgruppen-Persona.

Was eine Persona bei uns enthält:

  • Name & Rolle: z. B. “Stefan, Leiter Marketing”
  • Situation: SEA komplett ausgelagert, braucht skalierbares Setup
  • Pain Points: Zu fragmentierte Kampagnen, zu wenig Conversions pro Kampagne für Learnings, interne Umsetzung scheitert an Detailtiefe
  • Key Benefits: Was genau resoniert – nicht Features, sondern Lösungen für Probleme
  • Messaging Angle: Der eine Satz, der diesen Menschen zum Klicken bringt

Diese Personas kommen nicht aus einem Template. Sie kommen aus echten Kundengesprächen – transkribiert, analysiert, destilliert.

Warum das entscheidend ist: Wenn die KI weiß, dass der Produktionsleiter sich über ungeplante Stillstände ärgert und der CFO über fehlende Kostentransparenz, generiert sie zwei komplett verschiedene Banner. Aus demselben Briefing. Automatisch.

Mehr über unser Persona-System: KI Marketing Agentur – Persona-gesteuerte Generierung

Schritt 2: Banner-Generierung mit Gemini Vision AI

Jetzt wird es konkret. In unserem Ad Studio – einer eigenen React-Web-App – starten wir die Generierung.

Was wir eingeben:

  • Die geladene Persona (Pain Points, Benefits, Messaging Angle)
  • Brand Guidelines des Kunden (Farben, Tonalität, verbotene Elemente)
  • Optional: Referenzbild, Produktfoto oder Logo
  • Gewünschtes Format (300x250, 300x600, 728x90, 16:9, etc.)

Was die KI liefert:

Ein fertiges Banner-PNG. In Sekunden. Nicht ein Wireframe, nicht ein “Konzept” – ein einsatzbereites Creative.

Das Modell: Gemini 2.5 Flash Image. Wir haben verschiedene Modelle getestet – Midjourney für Fotorealismus, DALL-E für konzeptionelle Bilder, Stable Diffusion für Kontrolle. Für B2B-Display-Banner mit Text-Overlays, klarer Hierarchie und Brand-Konsistenz liefert Gemini Flash die besten Ergebnisse.

Warum nicht Midjourney oder DALL-E?

KriteriumGemini 2.5 FlashMidjourneyDALL-E 3
Text im BildZuverlässigSchwachMittel
Brand-FarbenSteuerbar via PromptUnzuverlässigMittel
Format-KontrolleExakt (px-genau)BegrenztBegrenzt
API-IntegrationNative (eigene App)Nicht offiziellJa
Speed~5 Sekunden~30 Sekunden~15 Sekunden
Kosten pro Banner~0,02 €~0,10 €~0,04 €

Für Fotorealismus ist Midjourney unschlagbar. Für B2B-Display-Banner mit klarem CTA, Headline und Brand-Elementen gewinnt Gemini – vor allem durch die Text-Rendering-Qualität und die API-Integration in unsere eigene App.

Output pro Durchlauf: 10–20 Varianten. In der Zeit, die ein Designer für 3 braucht.

Schritt 3: 5-Dimensionen-Scoring – objektiv statt “gefällt mir”

Hier trennt sich unser Workflow von allem, was wir bei anderen Agenturen gesehen haben.

Statt die 20 Varianten einem Kunden zu zeigen und zu fragen “Welches gefällt Ihnen am besten?”, analysiert unser System jedes einzelne Banner in fünf Dimensionen.

Modell: Gemini 2.0 Flash (Vision-Analyse, nicht Generierung)

Die 5 Dimensionen

1. Attention (0–100) Eye-Tracking-Vorhersage. Wo landet der Blick zuerst? Ist es der CTA – oder ein irrelevantes Hintergrundelement?

Ein Banner mit Attention-Score 40 hat den Fokus auf dem Hintergrund statt auf der Headline. Bei Score 85 liegt der Blick exakt auf CTA → Headline → Key Visual. In dieser Reihenfolge.

2. Clarity (0–100) Wird die Kernbotschaft in unter 1,5 Sekunden verstanden? B2B-Entscheider scrollen schnell. Wenn die Botschaft nicht sofort klar ist, verliert die Impression an Wirkung – auf beiden Ebenen: Klick und Brand Recall.

Score unter 50 = zu viel Text, zu kleine Schrift oder widersprüchliche Elemente. Score über 80 = eine Botschaft, ein Visual, ein CTA.

3. Cognitive Ease (0–100) Wie leicht ist das Banner mental zu verarbeiten? Wenig Cognitive Ease bedeutet: Das Gehirn muss arbeiten, um das Banner zu verstehen. Im Feed-Scrolling-Modus = Tod.

Hohe Cognitive Ease entsteht durch: bekannte Layouts, klare Kontraste, wenig Elemente, konsistente Farbpalette.

4. Impact (0–100) Die Gesamtwirksamkeit. Wie wahrscheinlich ist es, dass dieses Banner eine Handlung auslöst? Kombiniert visuelle Stärke mit Message-Klarheit und CTA-Prominenz.

5. Memory (0–100) Brand-Recall-Wahrscheinlichkeit nach 24 Stunden. Wird sich der Betrachter an die Marke erinnern? Entscheidend für Awareness-Kampagnen und Retargeting-Sequenzen.

Warum 5 Dimensionen statt einer Note?

Ein Banner kann hohe Attention haben, aber niedrige Clarity (auffällig, aber verwirrend). Oder hohe Clarity, aber niedrigen Impact (verständlich, aber langweilig). Die 5 Dimensionen zeigen, wo genau ein Banner stark oder schwach ist – nicht nur ob es “gut” ist.

Enterprise-Tools wie Neurons AI, Dragonfly AI oder Kantar LINK AI bieten ähnliche Analysen – ab fünfstelligen Jahreslizenzen. Wir haben diese Logik in unseren täglichen Workflow integriert.

Schritt 4: Performance-Simulation – bevor Budget fließt

Das Scoring sagt: “Dieses Banner funktioniert visuell.” Die Simulation sagt: “Dieses Banner wird voraussichtlich so performen.”

Was die Simulation liefert:

  • CTR-Prognose: 0,5–3,0 % (zum Vergleich: B2B-Durchschnitt liegt bei 0,22 %)
  • ROAS-Prognose: 1,0–5,0x
  • Market Segment Match: 0–100 (wie gut trifft das Banner die Zielgruppe?)
  • 3 Stärken des Banners
  • 3 Schwächen und konkreter Fix
  • 3 Verbesserungsvorschläge für die nächste Iteration

Der Persona-Kontext fließt ein: Dasselbe Banner kann für einen IT-Leiter eine prognostizierte CTR von 1,2 % haben und für einen CFO nur 0,4 % – weil die Botschaft für die eine Rolle relevant ist und für die andere nicht.

Was wir damit machen: Aus 20 generierten Varianten identifizieren wir die 3–5 mit dem höchsten Simulations-Score. Nur diese gehen in die Kampagne.

Kein: “Wir schalten alles und schauen in 4 Wochen.” Sondern: “Wir wissen vorher, welche Varianten die höchste Erfolgswahrscheinlichkeit haben.”

Mehr zum Thema: Winner Ads mit KI: So baust du Anzeigen mit höherer Erfolgsquote

Schritt 5: Text-Entfernung und Varianten-Erstellung

Ein Feature, das oft übersehen wird: Clean Plates.

Unser Ad Studio kann sämtlichen Text aus einem Banner entfernen – Headlines, CTAs, Labels – und die freigewordenen Flächen mit natürlicher Hintergrund-Fortsetzung füllen.

Warum das nützlich ist:

  • A/B-Tests: Gleiches Visual, anderer Text. Isoliert den Einfluss der Headline.
  • Format-Adaption: Text für 728x90 muss anders sein als für 300x600. Das Basis-Visual bleibt.
  • Retargeting-Sequenzen: Gleiches Motiv, fortschreitende Botschaft über mehrere Touchpoints.

Statt jede Variante komplett neu zu generieren, erstellen wir Clean Plates und legen neue Text-Varianten darüber. Das spart Generierungszeit und hält die visuelle Konsistenz.

Schritt 6: Auswahl und Kampagnen-Integration

Am Ende des Workflows haben wir:

  • 20 generierte Varianten pro Persona und Format
  • 5-Dimensionen-Scores für jedes Banner
  • Performance-Simulationen mit CTR/ROAS-Prognosen
  • Clean Plate-Versionen für Text-Varianten
  • Eine klare Ranking-Liste: Die besten 3–5 Varianten, objektiv bewertet

Diese gehen in die Google Ads Kampagne – entweder als Display-Banner oder als Assets für Performance Max. Unser Kampagnen-Setup Skill übernimmt die Konfiguration: Naming, Targeting, Bidding-Strategie, Match-Type-Verteilung.

Was wir gelernt haben: 5 Erkenntnisse aus 12 Monaten KI-Ad-Produktion

1. Mehr Varianten schlagen bessere Einzelstücke

Intuition sagt: Investiere Zeit in ein perfektes Banner. Daten sagen: Generiere 20 und lass die Analyse entscheiden. Die “perfekten” Banner aus menschlicher Sicht performen oft schlechter als die, die das Scoring-Modell bevorzugt.

2. Personas machen mehr Unterschied als das Modell

Wir haben Wochen mit Modell-Vergleichen verbracht (Gemini vs. Midjourney vs. DALL-E). Der größte Performance-Hebel war nicht das Modell – sondern ob eine echte Persona hinterlegt war. Ein mittelmäßiges Modell mit starker Persona schlägt ein brillantes Modell mit generischem Prompt.

3. Text-Rendering ist der Flaschenhals

Das größte Problem bei KI-generierten Bannern: Text. Buchstabendreher, unleserliche Schriften, falsche Zeilenumbrüche. Gemini 2.5 Flash hat das deutlich verbessert, aber wir prüfen jedes Banner manuell auf Text-Fehler. Kein Banner geht ungechecked live.

4. Cognitive Ease ist der unterschätzte Score

Die meisten Teams optimieren auf “auffällig” (Attention). Unsere Daten zeigen: Banner mit hoher Cognitive Ease (leicht zu verarbeiten) performen in B2B besser als Banner mit hoher Attention aber niedriger Ease. B2B-Entscheider wollen keine visuellen Rätsel – sie wollen sofort verstehen, worum es geht.

5. KI ersetzt nicht den Designer – sie ersetzt den schlechten Briefing-Prozess

Das eigentliche Problem war nie “wir haben zu wenig Banner”. Es war: “wir haben kein System, das sicherstellt, dass Banner zur Zielgruppe passen.” Die KI löst das Briefing-Problem, nicht das Design-Problem.

Wie sich das im Vergleich zu Enterprise-Lösungen einordnet

Enterprise-Kreativagenturen bieten ähnliche AI-Hybrid-Ansätze – für 10.000 bis 100.000 $/Monat. AdCreative.ai automatisiert die Generierung und rankt Varianten nach Conversion-Wahrscheinlichkeit. Pencil AI nutzt Predictive Analytics für ROAS-Prognosen pro Creative.

Unser Ansatz unterscheidet sich in drei Punkten:

  1. Persona-Steuerung aus echten Kundengesprächen – nicht aus Demografie-Daten oder Website-Scraping
  2. 5-Dimensionen-Scoring + Performance-Simulation in einem integrierten Workflow – kein Tool-Hopping zwischen Generierung, Analyse und Planung
  3. B2B-spezifisch – optimiert für rationale Ansprache, lange Entscheidungszyklen und Nischen-Zielgruppen. Die meisten AI-Ad-Tools sind für E-Commerce und B2C gebaut.

Der Trade-off: Wir haben keine 40 Designer. Aber für B2B-Accounts mit 3.000–30.000 € monatlichem Display-Budget ist unser System leistungsfähiger als ein Enterprise-Tool, das für völlig andere Use Cases gebaut wurde.

Für wen dieser Workflow funktioniert

Gut geeignet:

  • B2B-Unternehmen mit definierbaren Entscheider-Personas
  • Display- und Performance-Max-Kampagnen
  • Teams, die mehr als 3 Banner pro Quartal brauchen
  • Unternehmen, die ihre Creative-Leistung messbar verbessern wollen

Weniger geeignet:

  • Reine Brand-Awareness-Kampagnen ohne Performance-Ziel
  • Produkte, die sich visuell nicht differenzieren lassen
  • Teams, die ihre Banner alle 12 Monate aktualisieren und damit zufrieden sind

FAQ

Welche Tools nutzt ihr genau?

Unser Ad Studio ist eine eigene React-Web-App (TypeScript, Vite, Cloudflare Pages). Für Generierung: Gemini 2.5 Flash Image. Für Analyse und Scoring: Gemini 2.0 Flash. Für Asset-Verwaltung: IndexedDB + GitHub API. Das ist kein Canva-Plugin – sondern ein eigenentwickeltes System.

Kann ich den Workflow auch ohne Ad Studio umsetzen?

Teilweise. Die Generierung kannst du mit jedem Bildgenerator machen. Das 5-Dimensionen-Scoring und die Performance-Simulation sind proprietär – aber du kannst ein einfaches Scoring-Framework (Clarity, Impact, Relevance, Brand Fit) manuell anwenden. Wie genau, erklären wir im Post Winner Ads mit KI bauen.

Wie lange dauert der komplette Workflow?

Für ein Set aus 3 Persona-Varianten à 20 Bannern (= 60 Banner), komplett gescored und simuliert: ca. 2–3 Stunden. Zum Vergleich: Ein Designer braucht für 60 individuelle Banner 3–5 Arbeitstage.

Nutzt ihr nur Gemini oder auch andere KI-Modelle?

Für Banner-Generierung: primär Gemini 2.5 Flash Image. Für unsere 9 KI-Skills (Keyword-Analyse, RSA-Texte, Reporting): Claude. Für den Skill Creator: ebenfalls Claude. Jedes Modell für seinen optimalen Use Case.

Was kostet das?

Unser Erstgespräch ist kostenlos und zeigt in 15 Minuten, was für euren Account möglich ist. Die Zusammenarbeit startet mit einem festen Monatsbudget – kein Stundensatz-Lotterie, kein fünfstelliges Tool-Abo.


Enterprise-Agenturen brauchen hunderte Designer und Millionenbudgets für KI-gestützte Kampagnen. Wir zeigen, wie zwei Gründer mit einem eigenen KI-System das gleiche Ergebnis liefern – für einen Bruchteil der Kosten.

Das ist kein “David gegen Goliath”-Narrativ. Das ist die neue Realität: KI-Systeme demokratisieren Enterprise-Output. Wer das System hat, braucht nicht das Headcount.

→ Unser KI-System im Überblick | → Erstgespräch vereinbaren

#KI Workflow #Ad Studio #Banner erstellen #Gemini Vision AI #B2B Ads #Creative Workflow
Robert Blessing

Robert Blessing

Co-Founder, Blessing Digital

Robert leitet die SEA-Strategie und hilft B2B-Unternehmen, ihre Google Ads Performance zu maximieren.

Diese Insights umsetzen?

Wir zeigen euch, wie ihr diese Strategien für euer B2B-Unternehmen nutzt.

Erstgespräch vereinbaren