Wie man A/B-Testing in 5 einfachen Schritten durchführt – mit 4 Beispielen


Beginnen Sie mit einer klaren Hypothese: Testen Sie eine Messaging-Änderung nach der anderen und messen Sie ihren Einfluss auf Ihre Konversionsrate. Sie müssen ein einzelnes Element zum Vergleichen wählen – wie eine neue Überschrift, einen anderen Call-to-Action-Button oder eine überarbeitete Wertversprechung – und dann basierend auf den Daten anpassen. Dieser Ansatz hilft Ihnen, handlungsrelevante Tests für jede Nische, die Sie bedienen, zu erstellen und hilft einem Marketer, mit Absicht zu sprechen.
Im Schritt 1 definieren Sie die Baseline und wählen eine Variable zum Vergleichen aus. Verfolgen Sie Metriken wie Klickrate auf Ihren Call-to-Action und Verweildauer auf der Seite. Die gesammelten Daten sollten konkret sein: Stichprobengröße, Konfidenzniveau und Dauer. Es gibt Nuancen über Trends und Nischen hinweg, passen Sie daher Ihren Ansatz an Ihr Publikum und das an, was sie wirklich interessiert, und seien Sie auf frühe Signale reagierend.
Für Schritt 2 gestalten Sie drei Varianten für die gewählte Variable und stellen Sie sicher, dass der einzige Unterschied das getestete Element ist. Dies erzeugt saubere Ergebnisse; wenn Sie mehrere Elemente ändern, wissen Sie nicht, welches den Unterschied gemacht hat. Für vier Beispiele ziehen Sie in Betracht, zu testen: 1) Überschriften-Messaging, 2) Hero-Bild, 3) Call-to-Action-Text, 4) Preisanbetung. Nachdem Sie den Test durchgeführt haben, analysieren Sie den Gewinner und starten die zweite Runde.
Im Schritt 3 führen Sie das Experiment mit einer festen Zielgruppengröße und stabilem Traffic-Mix durch. Verwenden Sie Segmentierung, um Gruppen zu vergleichen, und seien Sie bereit, die Stichprobengröße anzupassen, wenn frühe Signale auftauchen. Wenn Sie einen Gewinner bestätigen, implementieren Sie ihn in Ihrem Site-Flow und aktualisieren den Call-to-Action-Link und das Messaging, damit Teammitglieder den Vorteil über Kampagnen hinweg sehen können.
Im Schritt 4 bewerten Sie die Ergebnisse mit einer klaren Entscheidungsregel: Wenn die Gewinnrate das Ziel-Konfidenzniveau erreicht, übernehmen Sie die Änderung; andernfalls richten Sie eine neue Variante ein. Dokumentieren Sie die Erkenntnisse zu Messaging, Vorteilen und wie der Call-to-Action performt, damit Sie sie in zukünftigen Tests wiederverwenden können. Im Schritt 5 starten Sie eine neue Hypothese, passen den Plan an und lernen weiter über Trends in Ihrer Nische; diese Schleife macht A/B-Testing praktikabel für einen beschäftigten Marketer und hilft Ihnen, konkrete Gewinne für Ihre Kampagnen zu erzielen, die Sie anwenden können.
Praktischer A/B-Testing-Plan für E-Mail-Kampagnen
Beginnen Sie den Plan mit einem Zweivarianten-Experiment für Betreffzeilen, um den idealen Opener zu identifizieren. Führen Sie beide Varianten mit demselben Abonnentensegment, zur gleichen Versandzeit und in einem 48-Stunden-Fenster durch, um zuverlässige Daten zu erhalten. Dieser herausragende Ansatz liefert Ihnen schnelle, getestete Erkenntnisse und treibt Verbesserungen über die Kampagne hinweg voran.
Strukturieren Sie den Testplan um eine Variable pro Experiment, um verwirrende Ergebnisse zu vermeiden. Für E-Mails testen Sie zuerst Betreffzeilen, dann Preheader, dann Layout des Body. Schließen Sie eine rein textbasierte Version und eine grafikbasierte Version ein, um zu sehen, welches Format die stärkste Beteiligung unter Ihren aktivsten Abonnenten erzielt. Es gibt einen klaren Grund, Formate zu vergleichen: Messen Sie Öffnungen, Klicks und Konversionen, um zu definieren, was wiederverwendet werden soll.
Berechnen Sie die erforderliche Stichprobe pro Variante, um statistische Signifikanz zu erreichen. Für eine Baseline-CTR von etwa 3–5 % in typischen Kampagnen ist ein 2-Punkte-Anstieg bedeutsam. Mit 80 % Power und 95 % Konfidenz zielen Sie auf mindestens 1.000–2.000 gültige Empfänger pro Variante ab; für größere Effekte reduziert 5.000+ pro Variante das Risiko von Rauschen. Wenn Sie eine kleinere Liste haben, führen Sie länger durch (Zeitfenster 3–7 Tage) oder kombinieren Kohorten, um die Zielstichprobe zu erreichen. Wenn die Ergebnisse unklar sind, ist es in Ordnung, die Testzeit zu verlängern, um mehr Daten zu sammeln.
Verfolgen Sie Metriken, die zählen: Öffnungsrate, Klickrate, Konversion, Abmelderate und Umsatz pro E-Mail. Verwenden Sie diese Signale, um tiefere Erkenntnisse zu gewinnen und den nächsten Test anzupassen; teilen Sie die Ergebnisse mit Stakeholdern und halten Sie die Teststruktur einfach, um laufende Experimente zu ermöglichen, während Sie mehr Abonnentendaten gewinnen.
Erstellen Sie einen wiederverwendbaren Testrhythmus und eine einzelne Seite, um Ergebnisse aufzuzeichnen. Verwenden Sie Ihre Tools, um Varianten zu timen, Grafiken oder Video-Elemente anzuhängen und Ergebnisse in einem gemeinsamen Sheet zu speichern. Der ideale Plan hält die Ergebnisse lesbar und ermöglicht es Ihnen, Gewinne über Kampagnen hinweg im Laufe der Zeit zu vergleichen. Sobald Sie einen starken Anstieg bestätigen, wenden Sie die gewinnende Variante auf längere E-Mail-Sequenzen an und skalieren die Ergebnisse auf ähnliche Listen.
| Schritt | Fokus | Schlüsselmetriken | Zeitraum | Notizen |
|---|---|---|---|---|
| 1 | Hypothese & Einrichtung | Primär: Öffnungsrate; Sekundär: CTR, Konversionen | 48 Stunden | Testen Sie eine Variable zur Zeit; verwenden Sie eine feste Versandzeit und Segment |
| 2 | Formatvarianten | Öffnungsrate, CTR, Konversionen, Umsatz | 3–7 Tage | Vergleichen Sie rein textbasiert vs. grafikbasiert; optional Video-Teaser einbeziehen |
| 3 | Stichprobengröße | Signifikanz, Power, Minimum pro Variante | Vor dem Versand | Berechnen Sie unter Verwendung von Baselines-Daten; passen Sie an Listengröße an |
| 4 | Durchführen & Sammeln | Signifikanz, Anstiegsgröße, Konfidenz | 48–72 Stunden | Sorgen Sie für gleiche Exposition über Varianten hinweg |
| 5 | Analyse & Teilen | Erkenntnisse, empfohlene Aktionen | Innerhalb von 1–2 Tagen nach dem Fenster | Teilen Sie mit dem Team; wenden Sie die gewinnende Variante breit an |
Schritt 1 – Ziel und Metriken definieren
Definieren Sie ein einzelnes primäres Ziel als klare, handlungsorientierte Aussage, die Sie messen können. Zum Beispiel: „Bestellungen von neuen Besuchern um 12 % in 30 Tagen steigern.“ Diese Aussage verankert Ihr Testdesign, die Zahl, die Sie mit der Baseline vergleichen, und das Wissen, das Sie gewinnen, um Entscheidungen zu leiten.
Wählen Sie eine primäre Metrik, die das Ziel direkt widerspiegelt, setzen Sie dann ein kurzes Zeitfenster und ein Ziel-Anstieg, das Sie erreichen müssen. Für ein Bestellziel könnte die primäre Metrik Bestellungen oder Bestellwert sein, mit einem Anstiegsziel (z. B. 12 %). Verwenden Sie eine saubere Baseline-Zahl und Automatisierung, um Daten zu sammeln, damit Sie Ergebnisse ohne manuelle Arbeit vergleichen können. Wenn Sie noch nicht gestartet haben, ziehen Sie die letzten 7 Tage als provisorische Baseline und dokumentieren Sie sie in einem separaten Formular, um die Informationen für das Team organisiert zu halten. Beim Testen randomisieren Sie Traffic über Stile und Absender, damit Sie Ergebnisse ohne Bias vergleichen können. Halten Sie den Umfang fern von Vanity-Metriken.
Definieren Sie sekundäre Metriken, die Kontext hinzufügen, aber nicht vom Hauptziel ablenken. Häufige Wahlmöglichkeiten: Umsatz pro Bestellung, Konversionsrate, durchschnittlicher Bestellwert und Lebenszyklus-Indikatoren für Mitglieder. Verfolgen Sie diese, um Einblicke zu gewinnen, warum Ergebnisse auftreten, nicht nur ob sie auftreten. Segmentieren Sie nach Zielgruppen wie neue vs. rückkehrende Mitglieder und speichern Sie die Daten in einem dedizierten Formular, damit Sie bei Bedarf in die Informationen eintauchen können.
Setzen Sie explizite Entscheidungsregeln: Erklären Sie einen Gewinner, wenn die primäre Metrik den Ziel-Anstieg mit statistischer Signifikanz innerhalb des Testfensters zeigt. Wenn die Ergebnisse unklar sind, verlängern Sie den Test, passen Sie die Varianten an oder führen Sie einen Follow-up mit einer frischen zufälligen Aufteilung durch. Dokumentieren Sie das gewonnene Wissen und die nächsten Schritte, einschließlich automatisierungsbedürftiger Bedürfnisse, und skizzieren Sie, wie diese Entscheidung Bestellungen und Mitgliedererfahrungen beeinflussen wird.
Beispiel 1 – Betreffzeilen-A/B-Test

Teilen Sie Ihr Publikum 50/50 zwischen zwei Betreffzeilen für eine Kampagne auf. Halten Sie den Body, den Absendernamen und die Versandzeit identisch, um den Leistungsunterschied auf die Betreffzeile zu isolieren.
- Ziel und Testdesign: Wählen Sie einen A/B-Test-Typ mit zwei Betreffzeilen, A und B. Halten Sie alles andere konstant und setzen Sie eine Gewinnbedingung basierend auf Öffnungsrate, zum Beispiel muss B A um mindestens 2 Prozentpunkte übertreffen mit p<0.05, um zu gewinnen.
- Größe und Stichprobenverteilung: Für eine Liste von 10.000 Lesern weisen Sie 5.000 jeder Variante zu. Wenn Ihre Größe größer ist, skalieren Sie auf 25.000 pro Variante, um die Power zu erhalten. Dokumentieren Sie die Namen der Varianten in einem einzelnen Log, um alles zu erfassen, was Sie testen.
- Ausführungsdetails: Verwenden Sie die gleiche HTML-Vorlage, die gleiche From-Adresse und die gleichen Absender. Planen Sie beide Versände innerhalb desselben Fensters, um Verzögerungen und Bias zu vermeiden. Halten Sie Betreffzeilen knapp und lesbar auf Mobilgeräten; lange Zeilen reduzieren die Lesbarkeit über Geräte hinweg.
- Messung und Analyse: Verfolgen Sie Öffnungen, Klicks und Konversionen über Geräte hinweg. Berechnen Sie den Unterschied in der Öffnungsrate zwischen A und B und prüfen Sie die statistische Signifikanz. Wenn Sie über Kampagnen testen, erfassen Sie die Unterschiede für jede Liste und speichern Sie die Daten in einem zentralen Tool, damit Sie sie in zukünftigen Kampagnen wiederverwenden können.
- Entscheidung und Optimierung: Erklären Sie den Gewinner basierend auf der Schwelle. Schließen Sie den gefundenen Rand, die Stichprobengröße und den Gewinnernamen in Ihren Bericht ein. Wenden Sie die gewinnende Betreffzeile über Kampagnen an, um die Beteiligung zu verbessern und zukünftige Versände zu optimieren. Dokumentieren Sie alles, einschließlich des verwendeten HTML, der Absender und eventueller beobachteter Verzögerungen, damit Sie den Erfolg in zukünftigen Versänden reproduzieren können. Notieren Sie auch Möglichkeiten über Segmente hinweg, um zusätzliche Tests zu leiten.
Beispiel 2 – Preview-Text vs. Body-Copy-Test
Führen Sie zwei Preview-Text-Varianten gegen eine einzelne Body-Copy-Baseline durch, weisen Sie gleichen Traffic jeder Variante zu und bestimmen Sie den Gewinner erst nach Erreichen statistischer Signifikanz (p < 0.05). Für Listen unter 200k verwenden Sie mindestens eine Stichprobe von 10.000 Empfängern pro Variante; für größere Listen beschleunigt 15.000–20.000 pro Variante das Lernen, während die statistische Power erhalten bleibt. Manchmal treibt ein subtiler Unterschied im Preview-Text die Öffnungsrate mehr als der Body-Copy, behandeln Sie das Ergebnis daher als Signal, nicht als endgültiges Urteil.
Halten Sie den Body-Copy konstant und variieren Sie nur den Preview-Text im Preheader und Betreffzeile; testen Sie 2–3 Zeilen Preview-Text innerhalb von 30–90 Zeichen, mit Designs, die sich in Benefit-Fokus, Neugier und Dringlichkeit unterscheiden. Jede Variante sollte den Wert für Leser intuitiv machen, plausibel sein und mit dem Angebot übereinstimmen. Dieses Design hilft Ihnen direkt zu sehen, wie der Preview-Text die Beteiligung beeinflusst und welche Zeilen am wichtigsten sind.
Metriken und Datensammlung: Verfolgen Sie Öffnungsrate, Klickrate, Click-to-Open-Rate und Umsatz pro E-Mail. Verwenden Sie ein Stichprobenfenster von 24–72 Stunden nach dem Versand und berechnen Sie den Anstieg mit einem Signifikanztest. Rahmens Sie Ergebnisse mit einer wissenschaftlichen Denkweise, um Signal vom Rauschen zu trennen; schließen Sie eine klare Hypothese ein und messen Sie verbesserte Ergebnisse über Zeiten, Geräte und Segmente hinweg. Verwenden Sie Wissen aus dieser Stichprobe, um stärkere Tests und Lernen für zukünftige Kampagnen aufzubauen.
Interpretation: Wenn eine Variante die Öffnungsrate verbessert, aber Konversionen flach bleiben, kehren Sie zum Kontext und Post-Click-Erlebnis zurück; wenn sowohl Öffnungen als auch Umsatz steigen, haben Sie ein echtes Signal über Linien der Kundenreise hinweg. In jedem Fall überlegen Sie, ob die Verbesserung ausreicht, um zu skalieren; andernfalls führen Sie einen Follow-up-Test durch, der Preview-Zeilen mit Body-Copy-Änderungen kombiniert, um Generalisierung und breiteren Einfluss zu validieren.
Implementierungsschritte: 1) Wählen Sie zwei Preview-Texte, die sich im Ton unterscheiden; 2) Fixieren Sie den Body-Copy und Visuelle; 3) Teilen Sie Traffic gleichmäßig auf; 4) Führen Sie für 2–3 Tage auf kleineren Listen und 4–7 Tage auf größeren Listen durch; 5) Erklären Sie einen Gewinner unter Verwendung statistischer Signifikanz und wenden Sie ihn auf alle Versände an. Erfassen Sie die Stichprobe und schließen Sie das Lernen für zukünftige Tests ein, um Ihre Designs zu schärfen.
Weitere Tipps: Dokumentieren Sie das gewonnene Wissen und schließen Sie praktische Richtlinien für zukünftige Tests ein; verfolgen Sie sorgfältig, welche Zeilen und Designs verbesserte Ergebnisse geliefert haben, und wenden Sie sie breit an. Verwenden Sie eine wissenschaftliche Linse, um den Test mit leicht unterschiedlichen Variationen zu wiederholen und weiterhin Daten zu verwenden, um Ihren Ansatz zu verfeinern, unter Verwendung der Lerninhalte, um breitere E-Mail-Designs und Ergebnisse zu informieren.
Beispiel 3 – CTA-Farbe- und Platzierungstest

Empfehlung: Führen Sie 4 Varianten durch, die zwei Farben (Orange und Blau) mit zwei Platzierungen (above-the-fold Hero und inline innerhalb des Artikels) kombinieren. Verwenden Sie Orange above the fold als Baseline und Blau above the fold als primären Herausforderer, mit den inline-Varianten als bewegliche Benchmarks. Verfolgen Sie Grafiken, Buttons und interaktive Elemente, um zu sehen, wie Farben und Platzierung unter realen Nutzerbedingungen performen.
- Experimentdesign
- Hypothese: Farbe und Platzierung beeinflussen Klickrate (CTR) und Konversionsrate, wobei farbenfrohe CTAs above the fold die stärkste Leistung in typischen Promotions-Flows liefern.
- Varianten:
- Orange-Button – above fold
- Blau-Button – above fold
- Orange-Button – inline im Artikel
- Blau-Button – inline im Artikel
- Zu verfolgende Metriken: CTR, Konversionsrate und Umsatz pro Besucher. Erfassen Sie Impressionen, Klicks und nachgelagerte Aktionen, um ein klares Leistungsbild aufzubauen.
- Stichprobengröße und Dauer: Zielen Sie auf 8.000–12.000 Sessions pro Variante über 7–10 Tage ab, um eine zuverlässige Anzahl von Beobachtungen zu erreichen.
- Implementierungsdetails
- Buttons sollten klar mit knappem Text und optionalem Emoji für schnelle Erkennung beschriftet sein (z. B. „Angebot erhalten „).
- Halten Sie den gleichen Copy über Varianten hinweg, außer für Farbe und Platzierung, um Effekte zu isolieren.
- Verwenden Sie konsistente Typografie und Polsterung, damit Unterschiede aus Farbe und Position kommen, nicht aus Abständen.
- Respektieren Sie Datenschutzkontrollen; stellen Sie konforme Datensammlung und Berichterstattung für alle Varianten sicher.
- Datensammlung und Analyse
- Sammeln Sie pro-Variante-Grafikdaten, einschließlich Farbe, Platzierung und Timing des Klicks.
- Berechnen Sie absolute und relative Zunahmen in CTR und Konversionen vs. Baseline.
- Prüfen Sie statistische Signifikanz mit 95 % Konfidenzniveau; wenn eine Variante die Signifikanz verfehlt, behandeln Sie Ergebnisse als unklar und verlängern Sie den Test.
- Entscheidungsregeln und Follow-up
- Wählen Sie die Variante mit dem höchsten statistisch signifikanten Anstieg in der primären Metrik (CTR oder Konversionen), während Sie negative Effekte auf Datenschutz oder Beteiligung anderswo auf der Seite überwachen.
- Wenn inline-Platzierungen schlechter performen als above-fold-Platzierungen, priorisieren Sie above-fold-Immobilien für Promotions-CTAs in ähnlichen Kontexten.
- Dokumentieren Sie Lerninhalte in einem Papier-Log oder internen Wiki für zukünftige Referenz und Teilen mit dem Team.
- Praktische Tipps
- Verwenden Sie farbenfrohe, hochkontrastierende Töne, die gut gegen den Seitenhintergrund und die Grafiksequenz performen.
- Halten Sie interaktive Elemente leichtgewichtig, um Verlangsamung der Seitenleistung und Beeinträchtigung der Nutzererfahrung zu vermeiden.
- Testen Sie Kombinationen sequentiell, wenn Sie breite Änderungen planen, aber vermeiden Sie, zu viele Variationen gleichzeitig laufen zu lassen, um Maskiereffekte zu verhindern.
- Berücksichtigen Sie Emojis im CTA-Text, um zu testen, ob sie die Anspracheappeal steigern, ohne vom Angebot abzulenken.
Beispiel 4 – Versandzeit- und Segmentierungstest
Empfehlung: Führen Sie einen Versandzeit- und Segmentierungstest durch, indem Sie an mehreren lokalen Zeiten über große Segmente für mehrere Tage versenden. Verwenden Sie die Absenderidentität konsistent und messen Sie Öffnungs- und Klickraten und überwachen Sie, wie gut die Variante mehr Kunden konvertiert. Verfolgen Sie Erkenntnisse in einer erstellten Seite und weisen Sie jeder Variante ein Versionslabel zu, damit Sie Ergebnisse mit Konfidenz vergleichen können. Das Ziel ist es, das perfekte Fenster zu finden, in dem Beteiligung Aktion treibt.
Schritt 1: Definieren Sie Ihre Hypothese und Verhalten Entscheiden Sie, welches Verhalten Sie beeinflussen möchten – Öffnungsrate, Klickrate oder Konversionen – und teilen Sie Ihr Publikum in mehrere Segmente ein (z. B. nach Beteiligung, Kaufhistorie oder Geografie). Erstellen Sie eine klare Hypothese und notieren Sie die Seite, wo Ergebnisse protokolliert werden, halten Sie den Absender konstant für sauberen Vergleich. Dies liefert die Antwort darauf, welche Timing und Segmentierung das beste Ergebnis erzielen.
Schritt 2: Erstellen Sie Variationen Für jedes Segment erstellen Sie zwei oder mehr Version-E-Mails mit unterschiedlichen Versandzeiten. Halten Sie Inhalt identisch; variieren Sie nur die Versandzeit und optional Betreffzeilen mit Emojis, um den Einfluss auf Öffnungsraten zu testen. Taggen Sie jede Variante mit einem Versionslabel und setzen Sie Regeln, damit Ergebnisse automatisch von Ihrem ESP getrackt werden. Diese Einrichtung lässt Sie mehrere Ergebnisse klar vergleichen.
Schritt 3: Durchführen und Daten sammeln Starten Sie für ein festes Fenster von Tagen, verfolgen Sie mehrere Metriken: Öffnungsrate, Klickrate und Konversionen. Verwenden Sie einen Plan, um Verbesserung zu messen und Erkenntnisse auf einer erstellten Seite zu protokollieren. Dann vergleichen Sie Ergebnisse nach Segment und Versandzeit, um zu sehen, welche Kombination am besten performt. Wenn Sie verbesserte Leistung in einem Segment sehen, skalieren Sie die Variante entsprechend. Sammeln Sie Konfidenzintervalle, um Zuverlässigkeit zu quantifizieren.
Schritt 4: Analysieren und handeln Überprüfen Sie die Ergebnisse, wählen Sie die gewinnende Versandzeit und Segmentierung und rollen Sie sie für große Kampagnen über den Projektverlauf zum Absender aus. Wenn der Anstieg klein ist, iterieren Sie mit neuen Zeiten oder anderen Segmenten. Hier ist die kurze Zusammenfassung: Schritte 1–4.
Außerhalb des Tests führen Sie ein laufendes Log von Erkenntnissen und Taktiken, um Kampagnen über Jahre zu leiten. Der Ansatz skaliert auf jede Seite, jeden Absender und jeden Kanal und hilft Ihnen zu lernen, welche Timings am besten zu Ihrem Publikum passen. Außerhalb des Tests wenden Sie Erkenntnisse auf Jahre von Kampagnen an für kontinuierliche Verbesserung.
Ready to leverage AI for your business?
Book a free strategy call — no strings attached.


