Wyrażenia regularne w Google Analytics

Grudzień 4th, 2017 Wyrażenia regularne w Google Analytics

Czym są wyrażenia regularne i jak je stosować w narzędziu Google Analytics? Kiedy pracujesz na dużych zbiorach danych w narzędziu analitycznym Google wyrażenia regularne stają się nieocenioną pomocą – pozwalają na przyspieszenie niektórych działań i ich znaczne uproszczenie. Przyjrzyjmy się im więc z bliska.

Co to są wyrażenia regularne w GA?

Wyrażenia regularne w Google Analytics rozumiemy jako szereg wyszczególnionych znaków, które odpowiednio użyte wyrażają intencje użytkownika podczas pracy nad zbiorami danych. Są szczególnie przydatne w zaawansowanych działaniach w tworzeniu filtrów, celów czy segmentów. Ich użycie określa zakres danych, których zastosowanie przez narzędzie analityczne jest przez użytkownika pożądane.

Przykładowo więc tworząc filtry w Google Analytics, chcąc wykluczyć dosyć popularny wśród wielu stron ruch spamerski w odpowiedniej rubryce wyszczególniamy nazwy domen, z których ruch należy blokować w raportach. Zamiast tworzyć dla każdej tego typu witryny osobny filtr, stosujemy wyrażenie regularne. W tym wypadku będzie to znak znak „|”, który rozumieć możemy jako LUB/ORAZ. Jeśli więc narzędzie napotka podejrzany ruch spamerki kierowany z domeny wskazanej w szczegółach filtra, a następnie z czterech innych stron również w nim uwzględnionych to będzie wiedzieć, że musi zablokować ruch ze wszystkich pięciu stron. Oto przykład zastosowania wyrażenia regularnego w filtrze Google Analytics (zapis + screen):

abc\.xyz|buketeg\.xyz|bukleteg\.xyz|boltalko\.xyz|biteg\.xyz|budilneg\.xyz|bezlimitko\.xyz|lifehacĸer\.com|motherboard\.vice\.com

Wyrażenia regularne GA

Popularne wyrażenia regularne w Google Analytics

Oczywiście powyższy przykład z filtrem ruchu spamowego to tylko zobrazowanie jak możemy korzystać z wyrażeń regularnych w praktyce. Jest wiele więcej sytuacji, kiedy wyrażenia te się bardzo przydają. Choćby blokowanie zliczania ruchu z danych adresów IP. Często zdarza się, że nad jedną stroną pracuje wiele osób (redaktorzy, graficy, analitycy, marketingowcy itp.), których ruchu nie chcielibyśmy zliczać w GA. Przyda się nam w tym zarówno poprzednio uwzględnione wyrażenie „|”, czyli lub/oraz jak również „.”, która jest symbolem odpowiadającym dowolnemu znakowi (pojedynczemu!). Poniżej opis działania kilku popularnych symboli w wyrażeniach regularnych.

Symbole w wyrażeniach regularnych:

    • |” – lub/oraz, czyli chcąc wykluczyć adresy ip: 192.23.43.1 i 192.23.43.2 stosujemy: 192\.23\.43\.1|192\.23\.43\.2
    • .” – dowolny pojedynczy znak, czyli chcąc wykluczyć wszystkie adresy ip: 192.23.43.X, gdzie X oznacza dowolną cyfrę stosujemy: 192\.23\.43\..

UWAGA: Aby wskazać narzędziu, że kropka służy do rozdzielenia poszczególnych cyfr z ciągu IP, a nie jest symbolem wyrażenia w GA należy użyć ukośnika „/”.

  • ()” – nawias oznacza, że wyrażenie ma dopasować zawartość nawiasu do ciągu znajdującego się przed nawiasem. Stosujemy np. chcąc wykluczyć spamerski ruch ze stron: domena\.(pl|com|eu).
  • *” – gwiazdka oznacza dopasowanie do wyrażenia regularnego każdego elementu, który zawiera 0 lub więcej powtórzeń znaku poprzedzającego „*”. Przykład: chcemy wykluczyć domene google.com, gogle.com, gooogle.com, goooogle.com itp. stosujemy więc: go*gle\.com.
  • ?” – O ile gwiazdka dopasowuje do wyrażenia nieokreśloną liczbę powtórzeń, o tyle znak zapytania stosuje się tylko do powtórzenia o lub 1 raz. Na przykładzie witryny google stosując: go?gle\.com zawrzemy: ggle.com i gogle.com.
  • +” – Natomiast plus oznacza takie samo dopasowanie co najmniej jeden raz. Stosując analogiczny przykład: go+le\.com zawrzemy więc: gogle.com, google.com, gooogle.com itp.
  • ^” – popularny ptaszek oznacza dopasowanie do elementów występujących po nim. Przydaje się przy segmentacji ruchu z konkretnych podstron w serwisie np. chcąc wyodrębnić ruch ze wszystkich podstron z kategorii „zegarki”, czyli „domena.pl/zegarki/meskie/”, „domena.pl/zegarki/damskie/”, „domena.pl/zegarki/damskie/drewniane” stosujemy: ^/zegarki/.
  • $” – O ile ptaszek wskazuje na uwzględnienie w zbiorze wszystkiego, co po nim, o tyle dolar wskazuje na poprzedzające do elementy. Posługując się analogicznym, jak wyżej, przykładem stosujemy więc: /zegarki/$ i będzie to mieć zastosowanie do adresów: „domena.pl/zegarki/”, „domena.pl/meskie/zegarki/” itp.
  • ” – myślnik lub też łącznik pomaga nam tworzyć zakresy w wyrażeniach regularnych. Jeśli więc chcemy aby nasz wzór uwzględniał adresy ip w przedziale od 192.34.100 do 192.34.125 należy zastosować: 192\.34\.(100-125)
  • []” – nawias kwadratowy w przeciwieństwie do okrągłego nie wskazuje na dopasowanie do wyrażenia całej zawartości nawiasu lecz tylko dopasowanie do jednego ze wskazanych w nawiasie kwadratowym znaków. Przykładowo więc 192\.34\.12[123] wskaże nam adresy ip: 192.34.121, 192.34.122 lub 192.34.123

Wyrażenia regularne tylko z pozoru wydają się być trudne i skomplikowane. W rzeczywistości bowiem to dzięki nim sprawiamy, że nasze działania w Google Analytics są mniej skomplikowane i trudne! Każdy, kto pracuje w narzędziach analitycznych wie jak łatwo nieraz się pogrubić w ciągach liczb i cyfr. Dzięki wyrażeniom regularnym i znajomości odpowiednich symboli możemy sobie ułatwić życie!

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Kategorie