Analyseren van webverkeer

An article, posted almost 7 years ago filed in analytics, log, webverkeer, logging, nginx, excel, export, google analytics & piwik.

Vaak is het belangrijk om te weten hoe een website wordt gebruikt. Dit informeert discussies en voorkomt daarmee dat er kostbare tijd van ontwikkelaars wordt gestoken in zaken die wellicht nauwelijks gebruikt worden. Het is daarom verstandig om meer te gaan analyseren. Soms hoef je er niet eens meer voor te meten(!)

Zonder meer meten toch meer inzicht

Zonder meer te meten kun je vaak toch al analyses maken. Een webserver registreert standaard alle pagina aanvragen, en wat basis gegevens over iedere bezoeker. Ook houdt een applicatie zelf vaak nog een logboek bij. Met een simpele scriptingtaal zoals python of ruby is het vaak niet moeilijk om hier statistieken uit te halen. Voordeel is dat er geen nieuwe informatie vastgelegd hoeft te worden én dat de eindgebruiker het ook niet kan blokkeren (al kan een gebruiker zich relatief gemakkelijk voordoen als b.v. een ‘zoekmachine’). Het nadeel is wel dat je veel dingen zelf moet doen zoals het wegfilteren van zoekmachines etc. Ook kun je er niet alle acties mee registreren (b.v. een gebruiker die een pagina naar beneden scrollt), en informatie over b.v. de schermresolutie ontbreekt ook (veelal).

Google webmaster tools

Nee, dit is niet Google Analytics. Zonder meer informatie op te vragen kun je van Google als site-eigenaar toch een aardige verzameling informatie ontvangen via de Google Webmaster tools. Hoeveel gebruikers met welke sleutelwoorden op je pagina’s terecht komen bijvoorbeeld. Weliswaar mis je hiermee direct verkeer en verkeer van andere sites (waaronder sociale media), maar het geeft voor sites die voornamelijk via zoekmachine’s gevonden worden vaak wel een aardige indicatie.

AWStats

Vroeger erg populair, en vaak vind je het nog wel terug ergens in een shared host oplossing: AWStats. Het bestaat al jaren en geeft snel een aardig inzicht in zaken als hoeveel gebruikers er zijn geweest en welke pagina’s populair zijn. Maar veel van de modernere analyses zijn hiermee niet mogelijk.

Analyse door een derde partij (b.v. Google Analytics)

Omdat niemand het wiel opnieuw wil uitvinden wordt al snel gekeken naar iets als Google Analytics. Het lost tevens het probleem op dat niet iedereen toegang nodig heeft tot alle statistieken (al zijn daar toch wat skeptische geluiden over te horen). Gecombineerd met b.v. Google Tag Manager is dit een erg flexibele oplossing waarbij ook niet ontwikkelaars kleine aanpassingen kunnen maken waardoor weer net iets beter gemeten kan worden.

Opensouce analytics

Dé opensource analytics tool is (al jaren) Piwik. Het lijkt in veel opzichten op Google Analytics, maar je mag het zelf op je eigen servers hosten (hoeft niet). De gegevens blijven dus van jou. En in tegenstelling tot het ook opensource zijnde AWStats meet Piwik wél met een stukje javascript voor verfijning van de gegevens. Tegenwoordig zijn er ook diverse (deels ook betaalde) plugins beschikbaar waarmee geavanceerdere analyses gedaan kunnen worden. Betaalde plugins voegen b.v. zaken toe als funnel analyse, een erg interessante analysevorm die laat zien waar je bezoekers afhaken.

Eigen analytics met extra callbacks

Het is niet moeilijk om gericht extra informatie te loggen. Maar dit kost wel tijd, en vereist vaak samenwerking met een ontwikkelaar. Ook moet je vaak zelf weer ruis uit de data filteren als je niet zorgvuldig registreert. Het voordeel is wel dat je zelf kunt bepalen wat je waar opslaat en je waarschijnlijk net iets gemakkelijker een export realiseren naar een tool als Excel voor nadere analyse. Wordt het groter dan kun je gebruik maken van bijvoorbeeld de Elastic Stack; niets weerhoud je ervan om daar meer in te stoppen dan slechts log bestanden.

Tot slot: Cookiewet

Dit artikel gaat niet in over de cookiewet, maar als je bezig gaat met gebruikersdata krijg je al snel te maken met de verplichting om hier toch expliciet melding van te maken.

Op de hoogte blijven?

Maandelijks maak ik een selectie artikelen en zorg ik voor wat extra context bij de meer technische stukken. Schrijf je hieronder in:

Mailfrequentie = 1x per maand. Je privacy wordt serieus genomen: de mailinglijst bestaat alleen op onze servers.