Jeszcze kilka lat temu przy standardowym wdrożeniu analityki korzystając np. z Google Analytics mówiliśmy o zbieraniu danych na poziomie około 85% w porównaniu do danych faktycznych (porównanie wyników sprzedażowych w CRM z danymi w narzędziu). Obecnie firmy mogą borykać się z problemem zdecydowanie większej skali różnic w raportowanych wynikach. Te różnice można niwelować na różne sposoby i starać się dosyłać dane - w tym artykule skupie się na weryfikacji rozwiązania dostarczonego przez Piwik Pro, które polega na zbieraniu zdarzeń bez generowania żadnej informacji o sesji użytkownika oraz jego ciastku.
Zbieranie danych analitycznych bez zgody użytkownika? Testuję rozwiązanie od Piwik Pro.

Zanim przejdziemy do meritum, omówmy możliwe opcje zbierania danych w omawianym narzędziu. System ten oferuje elastyczne podejście do identyfikacji, które możemy podzielić na trzy główne poziomy:
-pełne śledzenie: wyykorzystuje ciasteczka (np. _pk_id) oraz identyfikatory urządzenia. Daje pełen obraz ścieżki użytkownika, powracalności i atrybucji. Wymaga pełnej zgody użytkownika (opt-in).
- anonimowe śledzenie z Session Hash: nie używa ciasteczek, ale na podstawie zanonimizowanego adresu IP i User-Agenta (danych przeglądarki) generuje krótko żyjący hash sesji (np. na 30 minut). Pozwala to łączyć zdarzenia w pojedynczą wizytę, ale nie pozwala rozpoznać powracającego użytkownika następnego dnia.
- anonimowe śledzenie (No cookies, no session hash): to bohater tego artykułu. Piwik PRO nie zapisuje nic w przeglądarce i nie tworzy żadnego hasha łączącego zdarzenia. Każda odsłona, każde kliknięcie (ping) to dla serwera zupełnie niezależny, odizolowany byt.

W artykule skupię się na tym ostatnim sposobie zbierania danych i omówię, dla kogo może być on bardzo pożytecznym źródłem wiedzy. Porównam też dane z Piwik do zebranych danych w Google Analytics 4. Będziemy zatem realnie mogli zobaczyć, o jakim poziomie różnic mówimy i jak te dane możemy wykorzystać.
Czy analityka bez zgody jest w ogóle możliwa (aspekt prawny)?
Warto w artykule przytoczyć francuski organ nadzorczy CNIL (jeden z najbardziej rygorystycznych w Europie). CNIL stworzył listę narzędzi i konfiguracji zwolnionych z obowiązku zbierania zgody. Piwik PRO odpowiednio skonfigurowany (z wyłączonymi ciasteczkami i pełną anonimizacją IP) spełnia te wymogi. CNIL wprowadził mechanizm tzw. zwolnienia z obowiązku zbierania zgody (ang. consent exemption) dla systemów analitycznych. Piwik PRO oficjalnie znajduje się na liście narzędzi, które mogą z tego zwolnienia korzystać. Oznacza to, że analityka wariantu "no cookies & no session hash" opiera się w pełni na prawnie uzasadnionym interesie administratora (Art. 6 ust. 1 lit. f RODO). Tym interesem jest podstawowa, statystyczna analiza wydajności własnego serwisu w celu jego optymalizacji, która nie narusza praw i wolności użytkowników. Samo usunięcie ciasteczek z kodu to za mało, aby spać spokojnie. Zgodnie z wytycznymi CNIL (i oficjalną dokumentacją Piwik PRO), aby legalnie zbierać dane w modelu zwolnionym z banera cookies, Twoja instancja musi być skonfigurowana według następujących zasad:
- Cel narzędzia wyłącznie statystyczny i brak profilowania: Zbierane pingi mogą służyć tylko do mierzenia oglądalności strony (np. liczby odsłon, błędów na stronie, wydajności serwera). Absolutnie nie wolno używać tych danych do budowania profili użytkowników, personalizacji treści czy remarketingu.
- Zbierane dane tylko na Twojej stronie WWW lub aplikacji
- Brak używania parametrów niestandardowych, które mogą zbierać dane osobowe
- Brak procesowania surowych danych bez consentu
- Dodanie Piwik Pro, jako partnera w polityce prywatności
Więcej szczegółów można znaleźć bezpośrednio na stronie: https://help.piwik.pro/support/privacy/how-to-make-your-website-compliant-with-cnil/
Co wysyła narzędzie w trybie bez ciastek i sesji?
W momencie kiedy pozbywamy się ciasteczek i sesji, przestajemy śledzić “Użytkowników”, a zaczynamy zbierać zdarzenia (pingi - pojedyncze, anonimowe sygnały o danej akcji np. wyświetlenie strony, zakup itd.). Otrzymujemy zatem twarde dane wolumenowe do oceny skuteczności strony i wykonanywach akcjach na tej stronie. Jeśli chodzi o samego “użytkownika” dostaniemy tak naprawdę informacje te, które są dostępne z poziomu przeglądarki - informacje o typie urządzenia, modelu, systemie itp. Wszelkie informacje np. o lokalizacji użytkownika nie będą dostępne.

Z perspektywy przeglądarki możemy podejrzeć, co nasza strona przetwarza. Możemy tym samym sprawdzić, że niezależnie od zgody na ciastka czy jej brak żadnego ciastko nie jest przez Piwik generowane.

Dostaniemy za to pingi o nazwie ppms.php dostępne w Network i to w nich możemy podejrzeć, co narzędzie zbiera. W moim przypadku był to między innymi scroll50%, który jest wysyłany jako event_action (e_a) bezpośrednio do narzędzia.

W standardowym modelu ten sygnał miałby dodatkowe informacje identyfikacyjne. Nie ma tam np. parametru _id, który w standardowym sposobie zbierania danych jest pobierany z ciasteczka generowanego przez narzędzie _pk_id.
Jakie dane widzimy w Piwik PRO w trybie bez sesji i ciastka?
Co dokładnie zobaczy analityk, marketer lub właściciel biznesu po zalogowaniu się do panelu Piwik PRO, gdy odetniemy systemowi dostęp do ciasteczek? Mimo restrykcji, Piwik PRO wciąż zbiera bardzo bogaty zestaw informacji kontekstowych dla każdego pojedynczego pingu. Najważniejsze z nich:
- informacje o odsłonach
- liczbę zdarzeń zbieranych automatycznie oraz zdarzenia niestandardowe, które stworzysz według własnych potrzeb. Możesz samem zbierać wszystkie zdarzenia na stronie na których Ci zależy.
- informacje o technologii i urządzeniach.Dowiesz się, jak rozkłada się ruch na urządzenia (Mobile, Desktop, Tablet), jakich przeglądarek używają odwiedzający (Chrome, Safari) i na jakich systemach operacyjnych pracują (iOS, Android, Windows). Te dane są zbierane z nagłówka User-Agent, ale – co kluczowe – służą tylko do agregacji
- źródła ruchu - tutaj jednak pamiętaj, że mówimy tylko o stronie wejścia. Nie tworzymy przy tej funkcji sesji, więc narzędzie nie złapie już szerszej ścieżki, np. przejścia przez proces zakupowy, i nie przypisze mu odpowiedniej sesji. Tutaj warto zastanowić się nad wdrożeniem własnego rozwiązania i przekazywać to jako parametry niestandardowe. Podobną funkcjonalność opisałem w artykule https://bettersteps.pl/blog/atrybucja-danych-w-google-analytics-4-uszczelnij-sledzenie-na-swojej-usludze, gdzie opisuję, jak możemy przesyłać informacje o źródle ruchu w celu weryfikacji źródła z danymi z GA4 oraz w specyficznych sytuacjach biznesowych. Tworzymy przy tym rozwiązaniu plik cookies w sessionStorage, więc koniecznie przed wdrożeniem takiej funkcjonalności powinieneś potwierdzić ją z działem prawnym.
Czego nie dostaniemy, a możemy za tym tęsknić?
- poprawnej liczby sesji i użytkowników. Narzędzie nie tworzy sesji, więc każdy ping generuje “sesje”. To dość nielogiczne, ponieważ w w raportach dostaniemy te dane i tak naprawdę szkoda, że są one dostępne i komunikowane. Mogą wprowadzać w błąd użytkowników nieświadomych o sposobie zbierania danych. Musimy zatem pamiętać w organizacji o odpowiedniej komunikacji. W narzędziu możemy stosować notatki, które rekomenduję tworzyć, jeśli dostęp ma szersze grono, aby przypominać o tym fakcie.

- brak możliwości budowy ścieżki i lejków na procesie zakupowym czy przejścia między stronami.
- współczynniku odrzuceń. W raportach zobaczymy bounce rate na poziomie 100% - powód analogiczny do opisanego powyżej. Każda “sesja” kończy się sztucznym wyjściem po jednej osłonie.
Piwik PRO vs Google Analytics 4 w podejściu zbierania danych bez zgody
Kiedy użytkownik odrzuca zgodę na cookies, GA4 (z wdrożonym Consent Mode v2) również wysyła tzw. cookieless pings (żądania z parametrem gcs=G100). Więcej o Consent Mode v2 znajdziesz w naszych innych artykułach: https://bettersteps.pl/blog/ga4-z-consent-mode-google-vs-brak-consent-mode-google oraz https://bettersteps.pl/blog/praktyczny-poradnik-google-consent-mode-v2. Jakie są podejście obu narzędzi?
Podejście Google Analytics 4 (Modelowanie Behawioralne):
GA4 zbiera te puste pingi, ale domyślnie nie pokazuje ich w standardowych raportach. Google uważa, że dane bez sesji psują strukturę raportów. Zamiast tego GA4 wrzuca je do "czarnej skrzynki" algorytmów AI i próbuje wymodelować ruch.
- Haczyk (Próg wejścia): Aby modelowanie zadziałało, Twoja usługa musi zbierać minimum 1000 zdarzeń dziennie od użytkowników, którzy wyrazili zgodę przez co najmniej 7 dni, i mieć minimum 1000 użytkowników dziennie odrzucających zgodę.
- Brak modelowania: Jeśli nie spełniasz tych progów (a większość małych firm ich nie spełnia), te dane po prostu przepadają z głównych raportów GA4.
Podejście Piwik PRO
Piwik PRO nie korzysta z modelowania danych. Jeśli na serwer przyjdzie 500 pingów odrzucających zgody informujących o odsłonie strony głównej, Piwik doda do raportu 500 odsłon.
| Cecha | Piwik PRO (No cookies & no hash) | GA4 (brak akceptacji na ciastka analityczne) |
| Podejście do danych | Zbierane wszystkie zdarzenia niezależnie od zgody | Modelowane dane w przypadku braku zgody |
| Widoczność zdarzeń bez zgód | Natychmiastowa, wszystkie wpadają do statystyk | Widoczne tylko, jeśli algorytm je wymodeluje |
| Próg wejścia dla danych | Brak (działa od 1 zdarzenia) | Średni/wysoki (tysiące zdarzeń dziennie wymagane do AI) |
Liczba zdarzeń w Piwik Pro vs GA4?
Wdrożyłem do narzędzi GA4 i Piwik, wysyłkę tego samego zdarzenia - spędzenie jednej minuty na portalu. Utworzyłem skrypt, który generuje event, a dodatkowo przechowuje go w session_storage, aby nie generować kolejnych zdarzeń, gdy ktoś spędzi kolejną minutę. Zależy mi tutaj na podejściu, aby odseparować zaangażowany ruch od tego pustego. Swoją drogą to bardzo fajne zdarzenie do szybkiej oceny działań marketingowych - szczególnie na stronach gdzie zdefiniowanie głównego celu nie jest takie oczywiste.

W Piwik Pro omawianego zdarzenia uzbierałem 763. W tym samym okresie GA4 wyraportował 528. Różnica na poziomie aż 44%. Skąd taka rozbieżność? Głównym aspektem jest brak danych w GA4 o użytkownikach, którzy nie wyrażają zgody na ciastka. Na tym konkretnym koncie nie mam danych modelowanych w GA4. Próbka danych jest niewystarczająca, aby GA4 ją wygenerował.
Dla kogo jest to rozwiązanie?
Można tu wpisać każdego odbiorcę, który jest zainteresowany posiadaniem zwiększonej liczby zdarzeń. Ze swojej strony wyróżnie trzy grupy:
- Małe i średnie firmy, które wdrożyły banery RODO i ich ruch z powodu odmów spadł w GA4 o połowę, a ich próbka danych jest zbyt mała, by GA4 uruchomiło modelowanie behawioralne. Piwik PRO pozwala im odzyskać widoczność podstawowych statystyk (ile było odsłon, ile razy kliknięto w numer telefonu).
- Firmy, które nie chcą mieć generowanych żadnych ciastek analitycznych ze względu na swoją politykę lub potrzebę biznesową.
- Większe firmy, które nie mogą mieć danych modelowanych i borykają się z dużą różnicą w danych w swoim obecnym narzędziu oraz chcą mieć stały punkt odniesienie w danych niezależnie od zmian prawnych czy wyglądu cookie banera.
Wady i ograniczenia
- Całkowity brak atrybucji (z małymi wyjątkami). W standardowej analityce wiesz, że użytkownik wszedł z reklamy Facebooka (First Click), potem wrócił z SEO, a na końcu kupił po wejściu z maila (Last Click). Tutaj atrybucja w zasadzie nie istnieje. Pamiętaj, że każdy przeładowanie strony to dla serwera "nowy duch". Jeśli URL wejścia posiadał parametry UTM (np. z kampanii Google Ads), Piwik PRO odnotuje je tylko na tej jednej konkretnej odsłonie (Last Click na poziomie jednego żądania). Jeśli użytkownik przejdzie na inną podstronę sklepu i dokona zakupu, ten zakup wpadnie do koszyka jako wejście bezpośrednie bo informacja o UTM z pierwszej strony nie została nigdzie przekazana.
- Wszyscy to "Nowi użytkownicy". Metryka powracających użytkowników (Returning Visitors) spada do zera. Każdy ping jest traktowany jako całkowicie nowa interakcja. Nie wiesz, czy artykuł przeczytało 100 różnych osób, czy jedna osoba odświeżyła stronę 100 razy.
- Interfejs mówiący o sesjach i użytkownikach — to może wprowadzać błąd u użytkowników w organizacji, którzy nie są świadomi sposobu mierzenia danych. Rozwiązanie dostępne w Piwik jest na tyle fajne, że prosi się o pewną rozbudowę w tym aspekcie, aby mieć możliwość zmieniania dostępnych raportów, aby docelowy użytkownik był pewien, że to, co widzi, może traktować jako pewnik. Jako alternatywne rozwiązanie, możemy zbudować własne raporty oraz dashboard, co na pewno ułatwi rozwiązanie tej sytuacji przy odpowniej komunikacji korzystania z raportów.
Podsumowanie
Zdecydowanie polubiłem podejście oferowane przez Piwik PRO. W erze, w której wskaźniki odrzucania zgód przy rygorystycznych cookie bannerach mogą sięgać nawet 50%, a my (np. z powodu zbyt małej próby ruchu) nie możemy oprzeć się na modelowaniu behawioralnym z GA4, to niezwykle odświeżające spojrzenie na analitykę. Skupiamy się tu stricte na zbieraniu zdarzeń. Co prawda nie widzimy w tym modelu pełnego procesu i ścieżki zachowań pojedynczego użytkownika, ale w zamian zyskujemy pełny obraz skali tych interakcji, opierając się na w 100% realnych, twardych danych.
Czy to podejście może całkowicie zastąpić Google? Biorąc pod uwagę, że GA4 to nie tylko narzędzie do mierzenia zdarzeń, ale w przypadku wielu firm ekosystem reklamowy połączony ze środowiskiem Google – odpowiedź brzmi: nie. Jest to jednak doskonałe, wręcz strategiczne uzupełnienie. Służy do niezależnej weryfikacji zdarzeń zbieranych w innych narzędziach i pozwala oprzeć biznes na liczbach, które są stabilne w czasie i nie załamią się z dnia na dzień, niezależnie od np. zmiany wyglądu cookie bannera.
Źródła:
https://www.cnil.fr/fr/cookies-solutions-pour-les-outils-de-mesure-daudience
https://help.piwik.pro/support/privacy/how-to-make-your-website-compliant-with-cnil/