Wiarygodność statystyk

Lubimy podglądać, szpiegować i pakować nos wszędzie tam, gdzie to tylko możliwe. Niezbyt to chwalebne, ale za to interesujące i ekscytujące, prawda? :)
Analizowanie oglądalności naszych serwisów WWW przypomina trochę podglądanie sąsiadów. Nie jest to proste i trzeba mieć dobrą lornetkę, ale wysiłek może przynieść satysfakcję. W przypadku serwisu informacje o użytkownikach mogą się przełożyć na bardzo konkretne cyferki na koncie. Starczy jednak tego teoretycznego wstępu, czas przejść do konkretów.

Zestawienie porónywanych systemów

Od grudnia 2005 do lutego 2006 dzięki szczęśliwemu zbiegowi okoliczności mój blog był monitorowany przez kilka różnych systemów statystyk jednocześnie:

  • Gemius / stat.pl — najbardziej popularne w Polsce statystyki zewnętrzne
  • Google Analytics — doinstalowane zaraz po ich upublicznieniu
  • StatTraq — plugin ze statystykami, instalowany do WordPressa
  • Webalizer — standardowy (i chyba najstarszy) skrypt do odczytywania logów serwera
  • AWStats — znacznie rzadziej stosowany skrypt, mający jednak możliwości znacznie większe, niż Webalizer

Gwoli ścisłości dodam, że darmową wersję statystyk stat.pl można zainstalować sobie we własnym zakresie. Google Analytics chwilowo zawiesił rejestrowanie nowych kont i nie bardzo wiadomo, kiedy rejestracja nowych będzie przywrócona. StatTraq może bez problemu zainstalować każdy posiadacz WordPressa, mający pojemną bazę danych. Dwa ostatnie narzędzia (Webalizer i AWStats) są standardowym wyposażeniem mojego hostingu — Progreso :)

Wyniki szczegółowe

Porównywane są dane z grudnia 2005, oraz stycznia i lutego 2006. Każdy z porównywanych miesięcy charakteryzował się innym stylem prowadzenia notatek. W grudniu były prowadzone regularnie, z codziennymi wpisami. W styczniu prowadzone były regularnie przez pierwszych 18 dni, potem nie pojawił się ani jeden wpis. W lutym wpisów było zaledwie kilka i były bardzo nieregularne.

Gemius / stat.pl

Dane wg schematu: Lokalizacje / Wizyty / Strony

Gru 2005 — 2064 / 3012 / 5115
Sty 2006 — 785 / 1351 / 2454
Lut 2006 — 746 / 1085 / 1975

Google Analytics

Dane wg schematu: Unikalni goście (Absolute Unique Visitors) / Wizyty (Visits) / Strony (Pageviews)

Gru 2005 — 2,326 / 3,606 / 5,820
Sty 2006 — 1,349 / 2,420 / 3,854
Lut 2006 — 1,300 / 2,051 / 3,133

StatTraq

Dane wg schematu: Goście (Users) / Wizyty (Views) — serwis + RSS & Atom / Strony (Hits).
StatTraq podaje osobne wyświetlenia dla serwisu, a osobne dla czytników RSS/Atom.

Gru 2005 — 30,958 / 36,011 + 9,246 [łącznie: 40538] / 36,114
Sty 2006 — 38,713 / 44,757 + 11,561 [łącznie: 56318] / 44,888
Lut 2006 — 35,514 / 41,898 + 10,224 [łącznie: 43214] / 42,009

Webalizer

Dane wg schematu: Lokalizacje / Wizyty / Strony

Gru 2005 — 5379 / 13461 / 37787
Sty 2006 — 4357 / 16311 / 44930
Lut 2006 — 4445 / 16032 / 40053

AWStats

Dane wg schematu: Unikalni goście / Wizyty / Strony.
Należy zwrócić uwagę na fakt, że AWStats oddziela ruch oglądany przez ludzi od ruchu generowanego przez różnej maści roboty. Ten ostatni podano w nawiasie (tylko dla wyświetlonych stron).

Gru 2005 — 3378 / 9494 / 27867 (12671) [łącznie: 40538]
Sty 2006 — 2554 / 8870 / 31853 (15804) [łącznie: 47657]
Lut 2006 — 2447 / 8569 / 27990 (15224) [łącznie: 43214]

Wnioski

Ze wstydem przyznaję, że nie mam żadnych konkretnych wniosków. Wniosek ogólny mam jeden — statystyki StatTraq dla WordPressa wydają się w dużej mierze nie mieć związku z rzeczywistością. Jedynie liczba wyświetlonych stron zdaje się być realna i mieści się między wynikami podawanymi przez analizatory logów serwera.
Niestety, nie jestem na tyle mocnym osobnikiem, aby dokonywać sensownych szczegółowych porównań i analiz przedstawionych wyżej danych. Będę wdzięczny za treściwe komentarze, zwłaszcza od osób mających o tym wszystkim pojęcie więcej niż średnie.

This entry was posted in WWW & Net. Bookmark the permalink.

8 Responses to Wiarygodność statystyk

  1. A próbowałeś nowości Performancing.com czyli Performancing Metrics?

    Ruszyli bodaj 2 dni temu w wersji beta, więc są niedociągnięcia, a i nie wszystkie z zapowiadanych opcji są dostępne, ale działa.

    http://performancing.com/blog/metrics

  2. Z definicji nie próbowałem, bo testy trwały od grudnia do lutego :)
    Podstawowymi statystykami mojego bloga pozostanie Google Analytics, ale Zapewne odpalę PM od 1 kwietnia i porównam obie. Będzie to o tyle proste, że oferują plugin do WordPressa ;)

  3. Webalizer na webaudicie został zupełnie ogłupiony przez czytniki RSS – liczbę wizyt i stron podaje bajeczną. :) Podejrzewam, że ten problem dotyczy również AWStats. A wszystko przez „ładne url’e”: żądanie http://www.domena.pl/feed/ wygląda w logach serwera jak katalog i jak katalog jest zliczana.

  4. Dlatego IMHO logi serwera są dobre do mierzenia transferu etc. oraz jako monitor wiarygodności innych statystyk. Jeżeli analizator logów wykaże mniej unikalnych IP odwiedzających stronę, zaś statystyki zewnętrzne pokażą ich więcej, to statystyki zewnętrzne są podejrzane.
    Zupełnie inną rzeczą są drastyczne różnice między statystykami Google i Gemiusa. Zastanawiam się, czy skrypty Gemiusa są aż tak mocno blokowane, że pokazuje to tak wielkie różnice. Jakoś by mnie to nie zdziwiło, bo reklamy / ankiety wyświetlane przez stat.pl są drażniące.

  5. Pingback: Rózga Świętego Mikołaja...

  6. Valwit says:

    Hmm, dla mnie liczą się tylko staty serwera, problem „ładnych urli” załatwia grep. Gemiusa i stat4u nie uznaje za wiarygodne bo nawet ja sam blokuje je na FW, tak samo wszelkie skrypty od nich. Jeśli mnie zliczają to tylko przez niedoskonałośc moich filtrów. Google Analitics mam jedynie wyciete na FW. Podglądanie podglądaniem, ale czemu miałbym je ułatwiać :) Inna sprawa że zapewne nie trudziłbym się filtorwaniem gdyby nie to że te wszytskie obrazki, skrypciki i inne badziewia zwyczajnie blokują szybkie wczytywanie stron poprzez swoje wiecznie zlagowane serwery.

  7. Sęk w tym, że staty serwera nie pokażą wszystkiego, czego potrzebujesz przy prowadzeniu większego serwisu. Przy prowadzeniu serwisu komercyjnego dowolnej wielkości statystyki serwera są jedynie rzeczą pomocniczą, aplikacja w stylu Google Analytics jest po prostu niezbędna.
    Jeśli chodzi o wycinanie skryptów, to wycinam w pień Gemiusa i szereg innych od dawna, właśnie z powodu zamulania stron. Jakimś cudem GA potrafi zrobić jeden skrypt zliczający o wiele więcej informacji, zaś Gemius potrzebuje generować dziesiątki skryptów — ja dziękuję za takie „udoskonalenia” ;)

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>