Dette frustrerer meg litt nå:
Spamfilteret på kommentarene fungerer ikke optimalt.
(02.12.2010)

Du er her:

Tallknusing av webstatistikk del 2

Martin Gjesdal, 20. februar 2009

Her skal jeg prøve å gi litt svar på hvordan du best kan få ut de beste tallene fra nettsiden din. Mange lurer jo på hva slags logging de skal innføre; klientbasert eller serverbasert? Jeg introduserer et tredje alternativ!

Tidligere erfaringer

Jeg skal ikke skryte på meg årevis av erfaring hvor jeg utelukkende har jobbet med tallknusing og webstatistikk, men jeg har hatt befatning med det. Det er to hovedmetoder som benyttes for logging av bruk, nemlig klientbasert og serverbasert. Disse forsøkte jeg å forklare i bloggposten Tallknusing av webstatistikk fra januar 2008. Konklusjonen var at det å sammenstille de to metodene ga den mest nøyaktige sannheten.

And now for something completely different

Nå har min tidligere arbeidsgiver CoreTrek kommet opp med et tredje alternativ. Deres publiseringsløsning CorePublish er nok ikke først ute med dette, men konseptet er inspirerende. Jeg har installert statistikk-modulen for å se hvilke fornuftige data jeg kunne få utav den. Denne metoden omtaler jeg herfra som CMS-basert logging. Logging som følger publiseringsløsningen (CMS står for Content Management System).

Jeg ser umiddelbart tre store fordeler ved CMS-basert logging:

  1. Mer detaljert logging direkte på informasjonsobjekter. Vanlig logging oppfatter hver side som hele sider og ikke som en sammenfatning av informasjonsobjekter så som artikler, annonser osv. CMS-basert logging skiller ut disse objektene og kan gi meg informasjon om f.eks hvor mange ganger en artikkel har blitt vist i en artikkelliste.
  2. Visningsstatistikken kan benyttes på selve nettsiden, ettersom den er integrert i løsningen. Du kan for eksempel sette opp en liste over de 10 mest besøkte artiklene eller du kan for hver artikkel vise antall visninger. I skrivende stund har ikke CorePublish slike funksjoner, men det bør være enkelt å sette opp.
  3. I CorePublish sitt tilfelle er statistikkens innkommende søkeord fra søkemotorer koblet opp mot søkemotor-modulen og gir meg raskt en oversikt over hvorvidt jeg allerede har satt opp søkeordet i denne. Nyttig!

Sammenligning og avvik

Det som kanskje overrasker meg mest med statistikken jeg har satt opp hos meg, er avvikene i data vis a vis Google Analytics. Slike ulikheter beviser umiddelbart behovet for å fordele statistikken over flere løsningsalternativer. Et godt eksempel er søkeord fra søkemotorer. Her er listen over hva de to mener om hva som har gitt meg mest treff i en periode jeg satte opp på begge rapportene:

Søkebegrep CorePublish Google Analytics Avvik
freia.no 29 18 62%
bredbåndsguiden 23 21 91%
gnome vs kde 20 15 75%
bysant 13 7 54%
kjernedryss 7 16 229%

Så, hva er grunnen til at den ene er høyere enn den andre? Det er bare å gjette på, men det kan tenkes at den er mer sensitiv, eller at de er konfigurert opp forskjellig. For eksempel finner jeg både "gnome vs kde" og "kde vs gnome" i Google Analytics sin liste, mens CorePublish sin har kun den førstnevnte av de to. Det kan også være forskjell  på når på døgnet de starter og slutter loggen og når de sist be generert. Det kan potensielt skille 2 døgn mellom de to, selv om jeg har satt opp korrekt perioder.

Litt mer interessant var det å sammenligne en bloggpost. Jeg dro frem bloggposten Validere skjema med JavaScript - brukervennlig fra 10.februar. For å få frem hvor lik utvikling de to verktøyene viser på denne bloggposten, har jeg forsøkt å legge kurven deres oppå hverandre. Observer hvordan CorePublish sin kurve er mykere i kantene, noe som ser mer elegant ut enn Google Analytics sin. Dog betryggende å se hvor nærme hverandre de er:

Konklusjon

Den virkelig store nytten jeg har av CMS-basert logging, er at det er kontekstsensitivt. Jeg har statistikken tilgjengelig på en egen flipp når jeg går inn på artikkelen i CorePublish. Denne informasjonen stoler jeg mer på enn den fra Google Analytics, selv om den fra CorePublish teller views og ikke unike besøkende. Unike besøkende er et vanskelig tall å kunne stole på og jeg er kun interessert i det på hele nettsiden og der stoler jeg mer på Google Analytics sine årelange erfaring med å skille unike brukere fra hverandre, selv om også de er feilbare.

Poenget mitt er at disse to verktøyene sammenlagt gir meg et meget bra bilde på hvor mye besøk jeg har på bloggen min og på hver enkel post.

Oppdatering 23.februar 2009:

CoreTrek, som lager CorePublish, ble engasjert i denne saken og har konkludert med at CorePublish registrerer en del flere søkemotorer enn Google Analytics, spesielt på den norske siden. I tillegg registrerer Google Analytics enkelte søkemotorer som ikke CorePublish gjør. Det er sannsynligvis også enkelte treff som ikke blir håndtert av noen av de to motorene. Interessant problemstilling, burde ikke alle søkemotorer bli enige om f.eks en standard-variable man satte til true om man kom fra ekstern søkemotor?

Kommentarer

  • Frode

    Kanskje avviket kommer av at folk har blokkert google-analytics med noscript og lignende.

  • Arve Skjørestad

    Martin, grunnen til at CorePublish har flere søketreff -kan- være fordi vi (CorePublish) også identifiserer de aller fleste norske søkemotorene. Såvidt jeg vet så gjennkjenner ikke Google Analytics alle disse, og vil således ikke telle med treff fra disse.

Søk

Sist kommenterte artikler

CorePublish publiseringsverktøy