RegEx im Online Marketing

  • Allgemeines zu RegEx
  • RegEx Syntax
  • RegEx in Analytics
  • RegEx im Tag Manager
  • RegEx im Screaming Frog
  • RegEx in der .htaccess
  • RegEx in der robots.txt
  • RegEx in JavaScript

Allgemeines zu RegEx


  • Matching-Sprache: Dient dazu, Suchausdrücke zu formulieren, um in Zeichenketten nach Entsprechungen zu suchen und gefundene Stellen durch andere zu ersetzen.
  • In Analytics können damit: Filter, Ziele & Segmente definiert werden.
  • Im Tag Manager können damit: Regeln für Trigger, Tags & Variablen definiert werden.
  • Im Screaming Frog können damit: Custom Extractions erstellt werden.
  • In einer .htaccess wird RegEx verwendet, um Weiterleitungen und andere Server-Konfigurationen zu definieren.
  • In einer robots.txt können ausgewählte Elemente aus RegEx verwendet werden, um Verzeichnisse oder Seiten für Bots zu sperren/erlauben.
  • Auch Sprachen wie JavaScript, Python, PHP oder C# erlauben den Einsatz von Regular Expressions.
  • Beim Testen von regulären Ausdrücken hilf z.B. Debuggex

RegEx Syntax


  • \ → Ein Zeichen nicht als RegEx-Zeichen interpretieren, sondern als Text
  • Beispiel: \. → Findet einen Punkt
  • | → Oder
  • Beispiel: a|b → a oder b
  • ? → Zeichen ist optional
  • Beispiel: johann?iter → Findet johanniter und auch johaniter
  • () → Wort ist optional
  • Beispiel: johan(niter) → Findet johan und auch johanniter
  • [] → Liste von Elementen, von denen eines zutreffen muss
  • Beispiel: p[aiu]n → Findet pan, pin und pun
  • Anmerkung: Innerhalb von eckigen Klammern sind besondere Zeichen wie ? oder $ in ihrer Funktion aufgehoben.
  • - → Bereich Von Bis...
  • Beispiel: [a-z] → Findet alle kleinen Buchstaben
  • Beispiel: [A-Z] → Findet alle großen Buchstaben
  • Beispiel: [0-9] → Findet alle Zahlen
  • Beispiel: [a-zA-Z0-9] → Findet alle kleinen Buchstaben, großen Buchstaben und Zahlen
  • {x} → Wiederhole letztes Element x-Mal
  • Beispiel: [0-9]{2} → Findet alle zweistelligen Zahlen von 01 bis 99
  • {x,y} → Wiederhole letztes Element mindestens x-Mal, aber maximal Y-Mal
  • Beispiel: [0-9]{1,3} → Findet alle ein bis dreistelligen Zahlen von 1 bis 999
  • . → Genau ein Beliebiges Zeichen
  • Beispiel: .ite → Findet alles mit mindestens einem Zeichen vor ite, z.B. site, lite, #ite, %ite, etc. Aber nicht ite!
  • + → Ein Element Ein oder Mehrmals
  • Beispiel: aa+rgh → Findet alles mit mindestens einem a zwischen aa und rgh, z.B. aargh, aaargh, aaaaaaaaargh, etc. Aber nicht argh!
  • * → Ein Element Kein oder Mehrmals
  • Beispiel: aa*rgh → Findet alles mit und ohne a zwischen aa und rgh, z.B. aargh, aaargh, aaaaaaaaargh, etc. Auch argh!
  • Anmerkung: .* → Nehme Alles
  • ^ → Findet etwas, wenn am Anfang eines Strings
  • Anmerkung: ^ am Anfang einer Zeichenklasse negiert selbige
  • Beispiel: [^0-9] → Es darf keine Zahl sein
  • Beispiel: ^apple → Findet apple juice, aber nicht pineapple
  • $ → Endet mit dem vorangestellten Zeichen
  • Beispiel: t$ → Findet alles was auf t endet

RegEx in Analytics


  • Ziele definieren mit RegEx:
    Verwalten → Zielvorhaben → Ziel → regulärer Ausdruck für Ziel-URL
  • Beispiel: danke|anfrage → Findet alle Ziel-URLs mit danke oder anfrage
  • Beispiel: /ordner(one|two)/danke → Findet alle Ziel-URLs unter ordnerone/danke und ordnertwo/danke
  • Beispiel: /danke(sehr)? → Findet sowohl Ziel-URL /danke als auch /dankesehr
  • Beispiel: ordnerone/.*index\.php → Findet alles was mit ordnerone beginnt und mit index.php endet
  • Beispiel: sneakers45[0-8] → Findet alles URLs von sneakers450 bis sneakers458
  • Beispiel: ^/$ → Nehme die Homepage
  • View Filter definieren mit RegEx:
    Verwalten → Filter → Benutzerdefiniert
  • Beispiel: /meineSeite\?cid=123 → Nehme /meineSeite?cid=123
  • Beispiel: 123\.145\.167\.[0-9]{1,2} → Finde IP-Adresse 123.145.167.0 bis 123.145.167.99
  • Beispiel: 123\.45\.67\.25. → Finde alle IP-Adressen, die 123.45.67.25 haben plus ein beliebiges Zeichen am Ende
  • Beispiel: Hostname zu URL hinzufügen → Advanced Filter → Field A Hostname → (.*) → Field B Request URI → (.*) → Output to Request URI → $A1$B1
  • Segment definieren mit RegEx:
    Berichte → Segment hinzufügen → Stimmt mit regulärem Ausdruck überein
  • Beispiel: Segment, das nur direct/(none) und google/organic Traffic filtert → Innerhalb eines Segments "Besucherquellen" --> "Medium" none|organic --> "Quelle" direct|google

RegEx im Tag Manager


  • Trigger definieren mit RegEx:
    Trigger → Neu → Auslösen bei
  • Beispiel: Page Path matches RegEx → ^/(en|de)?/?$ → Nur auf Homepage feuern (mit oder ohne /en/ oder /de/ oder / am Ende)
  • Hier findest du mehr zum Thema Tag Manager.

RegEx im Screaming Frog


  • Custom Extraction definieren mit RegEx:
    Configuration → Custom → Extraction → Regex (als Mode)
  • Hier findest du mehr zum Thema Screaming Frog.

RegEx in der .htaccess


  • Innerhalb einer .htaccess werden alle Regeln basierend auf regulären Ausdrücken definiert.
  • Hier findest du mehr zum Thema htaccess.

RegEx in der robots.txt


  • Innerhalb einer robots.txt können nur ausgewählte Regular Expressions verwendet werden, z.B. * oder $.
  • Das Escapen von . oder / ist nicht notwendig.
  • Hier findest du mehr zum Thema robots.txt.

RegEx in JavaScript


  • In JS können reguläre Ausdrücke innerhalb der Methoden von String-Objekten, z.B. match(), replace(), search() genutzt werden.
  • Wenn reguläre Ausdrücke zur Laufzeit eines Scripts dynamisch erzeugt und geändert werden sollen, kann eine Instanz eines RegExp-Objekts definiert werden.