Zapraszam do zapoznania się z drugą częścią tekstu poświęconego różnym sposobom rozumienia "użytkownika internetu".
Zapraszam do zapoznania się z drugą częścią tekstu poświęconego różnym sposobom rozumienia „użytkownika internetu”. Pierwsza część dostępna jest tutaj.
Terminem, wokół którego narosło w Polsce najwięcej nieporozumień jest tzw. „unikalny użytkownik” (unique user). Dlatego chciałbym mu poświęcić najwięcej uwagi.
Dlaczego unikalny użytkownik nie jest osobą?
Często mylony z liczbą osób (niepowtarzalnych użytkowników) nie jest niczym innym, jak liczbą plików cookies o niepowtarzalnych identyfikatorach, które dana witryna zaserwowała w przedziale czasu. Problem polega na tym, że w wielu przypadkach jedna osoba wcale nie równa się jednemu cookie. Wynika to z tego, że część użytkowników internetu kasuje pliki cookie ze swojego komputera. I to z różnych powodów: tzw. kwestie bezpieczeństwa, okresowe czyszczenie plików temporary i cookie w przeglądarce, czy też ustawienia domyślne przeglądarki (usuwanie danych prywatnych w momencie zamykania przeglądarki).
Jeśli użytkownik komputera kasuje codziennie pliki cookie i codziennie odwiedza serwis X, to za każdym razem serwer będzie go traktował jako nowego użytkownika i nadawał kolejne cookie. W skali miesiąca taka osoba będzie policzona w systemie site-centric jako 30 różnych unikalnych użytkowników, a nie jedna ta sama osoba.
Czy 26 milionów osób korzysta z o2?
7 – 10 lat temu, problem jeszcze nie był tak wyraźny, bo kasowanie cookies nie było bardzo powszechne, zaś podliczona ich liczba wciąż była znacznie niższa niż liczba internautów w Polsce. Jednak w miarę upływu lat, cookies coraz gwałtowniej przybywało i wkrótce „unikalnych użytkowników” było kilka razy więcej, niż użytkowników internetu w Polsce. Małe i średnie witryny mogą tego nie dostrzegać, jednak witryny duże, mające miesięcznie kilka milionów użytkowników, notują w skali miesiąca 10-30 (i więcej) milionów „unikalnych użytkowników”. Na przykład portal o2.pl na stronie głównej swojego Biura Reklamy informuje, że posiada „26 milionów unikalnych użytkowników w miesiącu”. Czy zatem w Polsce, gdzie w skali miesiąca mamy 14 milionów internautów, 26 milionów korzysta z o2 (sic!)? Oczywiście nie, nawet jeśli dodamy osoby poniżej 15 roku życia i łączących się spoza Polski.
Prosta arytmetyka wskazuje, że absurdem jest utożsamianie liczby cookies z liczba osób. Co więcej, jeśli weźmiemy pod uwagę chociażby tylko główne portale i witryny, to łączna liczba cookies, jakie pojawiają się skali miesiąca w polskim internecie wynosi kilkadziesiąt milionów.
Warto tu poczynić pewne zastrzeżenie – liczba cookies (unique users) daje pewne pojęcie o liczbie faktycznych osób odwiedzających serwis, jeśli analizujemy ją w możliwie najwęższych przedziałach czasowych, np. jednego dnia. Istnieje niewiele osób, które kasują cookies wiele razy dziennie, stąd może to być pewna estymacja liczby osób. Im jednak większy przedział czasowy, tym mniej ma wspólnego „unikalny użytkownik” z faktycznymi osobami.
Potrzeba estymacji
Liczbą użytkowników definiowanych jako liczba cookies operuje jeden z najpopularniejszych w Polsce systemów site-centric Gemius Traffic. Podawane wartości są zwykła liczbą cookies, bez estymacji faktycznej liczby użytkowników (osób). W przypadku Google Analytics definicja użytkownika jest tak oględna, że trudno powiedzieć co dokładnie oznacza oraz jak ta liczba użytkowników jest wyliczana:
„Użytkownik" to wskaźnik zaprojektowany w sposób umożliwiający jak najdokładniejsze określenie faktycznej liczby różnych osób, które odwiedziły witrynę. Oczywiście nie można sprawdzić, czy z jednego komputera korzystają dwie osoby, ale dobry system śledzenia użytkowników może podać liczbę zbliżoną do faktycznej. Najdokładniejsze systemy śledzenia użytkowników do prowadzenia rejestru poszczególnych użytkowników wykorzystują zazwyczaj pliki cookie.”
Analizując wartości, blizej jej do zliczeń cookies, niż do estymacji. Na estymacjach liczby użytkowników bazuje natomiast AdPlanner, w którym liczba unique visitors jest definiowana jako „The total estimated number of internet users from the country you've defined who visit a specific site over a 30-day period.”. Jednak i w tym przypadku próżno szukać dodatkowych informacji, jak ta liczba jest wyliczana.
Realny użytkownik i realne nieporozumienia
Określenie, z którym spotykamy się szczególnie często jest tzw. „real user” stosowany w badaniu Megapanel PBI/Gemius. Nie jest to co prawda określenie stosowane w pomiarach site-centric, ale omówię go w tym miejscu, gdyż jest on na ogół odnoszony i porównywany z „unikalnym użytkownikiem”.
Porównania wskaźnika real user z unikalnym użytkownikiem są błędem, gdyż real user nie jest liczbą cookies (unikalnych użytkowników), ale oszacowaniem liczby osób, które korzystają z serwisu. Wracając do wspomnianego serwisu o2.pl – serwis ten notuje miesięcznie 26 milionów plików cookies, zaś Megapanel PBI/Gemius szacuje, że w odniesieniu do faktycznej liczby osób, serwis ten odwiedza miesięcznie 7,5 mln osób (na około 15,8 miliona polskich internautów w wieku 7 lat i więcej).
Nieporozumienia mogą wynikać z faktu, że stosowany do obliczenia real user algorytm bierze pod uwagę liczbę cookies danej witryny, jak i wszystkie cookies zarejestrowane w przestrzeni site-centric monitorowanej przez Gemius. Jednak w algorytmie tym, Gemius szacuje liczbę cookies, jaka byłaby na witrynie gdyby nie istniało zjawisko „kasowalności cookies”. Wg danych zamieszczonych na witrynie audyt.gemius.pl, gdyby nie istniało zjawisko kasowania cookies, to mielibyśmy w Polsce w lipcu 2008 około 17,5 mln cookies. Przypomnę, że prosta suma cookies, z jakimi mamy do czynienia w skali miesiąca, to kilka razy więcej, niż te kilkanaście milionów.
Real user i unikalny użytkownik, to zupełnie odrębne wskaźniki, które nie powinny być zamiennie stosowane, ani tym bardziej zestawiane i porównywane ze sobą. A taki błąd popełniany jest na przykład w prezentacji handlowej sieci BizOn media (cennik reklam), gdzie obok siebie zestawia się witryny raportowane przez liczby cookies, z tymi raportowanymi przez liczbę real users.
I na zakończenie...
Przytoczone powyżej kilka definicji nie wyczerpuje jeszcze całej terminologii. Mamy do czynienia jeszcze na przykład z „nowymi i powracającymi użytkownikami”, czy też z „bezwzględną liczbą niepowtarzalnych użytkowników” (w Google Analytics).
Podsumowując obie części tekstu:
- bądźmy precyzyjni, gdy mówimy o użytkownikach internetu czy witryny,
- „internauta”, osoba mająca dostęp do internetu” czy „użytkownik internetu” nie są pojęciami tożsamymi,
- warto pytać nie tylko o liczbę zarejestrowanych użytkowników, ale przede wszystkim o liczbę aktywnych użytkowników (np. w skali miesiąca),
- „unikalny użytkownik” to liczba plików cookies, a nie osób,
- nie należy porównywać unikalnego użytkownika z real user, bo ten ostatni szacuje liczbę osób, a nie plików cookies.
Dziękuję za uwagę :) Zapraszam też na moją stronę www.internetstats.pl
Przydatne linki
Gemius Traffic – Demo usługi
Google Analytics – Słowniczek
PBI – Metodologia badania
Gemius – algorytm real users
Google - Ad Planner
Pobierz ebook "Social media marketing dla firm i agencje się w nim specjalizujące"
Zaloguj się, a jeśli nie masz jeszcze konta w Interaktywnie.com - możesz się zarejestrować albo zalogować przez Facebooka.
W 1999 roku stworzyliśmy jedną z pierwszych firm hostingowych w Polsce. Od tego czasu …
Zobacz profil w katalogu firm
»
Pomagamy markom odnosić sukces w Internecie. Specjalizujemy się w pozycjonowaniu stron, performance marketingu, social …
Zobacz profil w katalogu firm
»
Projektujemy i wdrażamy strony internetowe - m.in. sklepy, landing page, firmowe. Świadczymy usługi związane …
Zobacz profil w katalogu firm
»
1stplace.pl to profesjonalna agencja SEO/SEM, specjalizująca się w szeroko pojętym marketingu internetowym. Firma oferuje …
Zobacz profil w katalogu firm
»
Pozycjonujemy się jako alternatywa dla agencji sieciowych, oferując konkurencyjną jakość, niższe koszty i większą …
Zobacz profil w katalogu firm
»
Witam,<br /><br /><br /> jeśli klient zapyta się mnie o RU a mam podane dane tylko UU to jak dokonać obliczeń żeby go nie wprowadzić w błąd? Witryna <a href=\"http://www.internetstats.pl/\" rel=\"nofollow\" target=\"_blank\" rel=\"nofollow\"></a><a href=\"http://www.internetstats.pl/\" rel=\"nofollow\" target=\"_blank\" rel=\"nofollow\"><a href=\"http://www.internetstats.pl/\" target=\"_blank\" rel=\"nofollow\">http://www.internetstats.pl/</a></a> niestety nie działa
Panie Rafale,<br /> <br /> w przypadku akurat Państwa sieci reklamowej, czyli BizOn Media moje zastrzeżenia budzi fakt, że w cenniku stawiany jest wprost następujący znak równości <strong>użytkownicy (real users) = UU / mies.</strong>. A przecież tak nie jest. Jednemu użytkownikowi (osobie) nie odpowiada jedno cookie.<br /> <br /> Co do kwestii szczegółowych, to trudno dyskutować o nich na forum, bo są złożone. Ale chętnie spotkam się z Panem w naszym biurze, gdzie możemy szczegółowo przedyskutować te kwestie.<br /> <br /> Pozdrawiam :)
Bardzo ciekawy artykul, z tym ze oczywisty dla osob siedziacych w tym temacie na codzien.<br /> Panie Sławku, jeśli mój cennik jest tak przydatnym narzędziem do analizy oglądalności serwisów pod kątem RU i UU to może powinienem jeszcze dorzucić jako źródła danych google analiticis, alexe i inne nic nie mówiące dane? Przeciez jesli wspanialy Megapanel nie podaje wynikow dla ponad 15 serwisow bedacych w cenniku, to chyba lepiej posilkowac sie danymi ogolnodostepnymi jak Gemius Traffic niz podawac liczbe UU (cookies) z adservera? A moze powinienem wymazac dane i miec puste pola? Mniejsze zlo? Z góry dziękuje za sugestie. <br /> Moim zdaniem - tutaj podkreślę - Megapanel już dawno przestał być badaniem pokazującym oglądalność, tylko stał się rankingiem popularności witryn... Nie mówi to nic nikomu w codzienniej pracy z klientem... <br /> Analizowałem swego czasu kwestie RU i UU i wychodzi mi ciągle to samo: prawdziwsze sa dane z adservera bazującego na cookies i tym samym podającego liczbe \"fizycznych userow\" na serwisie, niż paneliści i algorytym...<br /> Ale to moje zdanie :) Pozdrawiam i mam nadzieję że sobie podyskutujemy.
Ciekawy temat i ciekawe podejscie. <br /> pewne zblizone do prawdy wartoci mozna otrzymac na bazie krotkich czaso-okresow natomiast nie powinno sie ich zbytnio mnozyc bo mozna nie uwzglednic chwilowego trendu danej witryny :)<br /> <br /> Przyklad:<br /> Rozpatrujac UU w okresie jednego dnia mozemy otrzymac juz nieco bardziej zblizone do prawdy informacje, ktorych jednak nie powinnysmy mnozyc razy 30 :)<br /> <br /> Najlepiej byloby gdyby zostal opracowany algorytm gromadzenia danych gdzie RU to np.: RU=(IP(gromadzone nielokalnie) + cookies(lokalne)) * zmienna K (wyestymowana na bazie jakis rozsadnych badan na kilkuset serwisach minimalizujaca blad) , oczywiscie taki miks moglby znowu zanizac wartosci (topologia wielu osiedlowych sieci, korporacji itd...) ale wydaje mi sie ze dawalby nieco bardziej zblizone realne wartosi.<br /> <br /> Teraz badz tu madry i nieoklam klienta zeby Cie zrozumial i powiedzial ze nie chcesz go oszukac :))
Wniosek, prędzej czy później wyjdzie, kto kłamie a kto jest elastyczny i prawdziwy :-)
\"Czy 26 milionów osób korzysta z o2?\" - Dobre pytanie.<br /> Pokrewny i ciekawy (przynajmniej dla mnie) temat, to liczba blogów w Polsce ? pojęcie aktywnego blogu i nieaktywnego (martwego) ? oraz liczba blogerów/osób piszących blogi. <br /> Jeśli zsumować liczby podawane przez niektóre portale, także można otrzymać naprawdę imponujące wyniki!
Sławek, dzięki za kolejną porcję uporządkowanych faktów... :-)
Doprecyzowalem jeszcze jedna mysl - Google Analytics nie bazuje na estymacji \"liczby uzytkownikow\" (w domysle osob) lecz AdPlanner;<br /> <br /> Przepraszam za niescislosc :-))
pierwszy raz (!!!) odkąd zaglądam na interaktywnie znalazłem ciekawy artykuł, który:<br /> <br /> - nie jest SPAMem Opcomu<br /> - nie jest SPAMem innej firmy<br /> - nie jest głębokim wynurzeniem \"eksperta\" / \"znanego blogera\"
Dorzucając do tematu: podając statystyki swojego serwisu (Electronic Sports League, ESL) dot. liczby zarejestrowanych użytkowników, podajemy stan weryfikowany również pod względem aktywności - Ci którzy nie byli obecni (nie logowali się) przez ostatnie trzy miesiące, nie są brani pod uwagę.<br /> <br /> Myślę, ze to dobra praktyka (mimo obniżenia wartości liczbowych) bo pozwala odsiać nieaktywnych, leniwych lub oszustów zakładających konta fake\'owe (co swoją drogą jest w unikalny sposób weryfikowane).
Oczywiscie powinno być \"7+\" - dziekuje za uwage ;-) <br /> <br />link rowniez poprawiony - zmieszal mi sie blog gemiusa ze strona audyt :)))
Dzięki za artykuł, fajnie jak ktoś napisze coś wartościowego :)<br /> <br /> Do tekstu wkradły się błędy:<br /> 1. \"...serwis ten odwiedza miesięcznie 7,5 mln osób (na około 15,8 miliona polskich internautów w wieku 7).\" chyba nie mamy 15,8 miliona 7letnich internautów ;)<br /> 2. link do audyt.blog.pl jest martwy [404]