Wikipedia:Archief - Overleg Wikipedia:Bezoekersaantallen van Wikipedia NL

Uit Wikipedia, de vrije encyclopedie
Overzicht beheerpagina's

Dit is een archiefpagina Gelieve onderstaande teksten NIET te wijzigen of er commentaar op te geven (op deze pagina) Voeg steeds de nieuwste teksten onderaan bij. Plaats tussen elke archievering een dubbele lijn met de datum van die dag.

U kan dit gebruiken:
<hr>Archivering gedaan door en op; ~~~~ . Alle bovenstaande teksten zijn van deze datum of ouder.<hr>



Onderaan elke artikel is een teller. Die telt het aantal keren dat de pagina is bekeken. Geeft ook de rangschikking van van Speciaal:Popularpages Die teller lijkt mij in zijn huidige vorm vrij nutteloos. De Engelstalige heeft deze afgezet en zopas ook de Duitse. Afzetten zou ik liever niet hebben maar wel een ander gebruik ervan. Als nu elke maand alle tellers terug op nul gezet zouden worden dan zou je echt kunnen weten welke pagina's populair zijn en welke niet.


  • de tellers laten zoals ze zijn
  • de tellers verwijderen
  • elke maand opnieuw op nul zetten
  • elke week opnieuw op nul zetten
  • elke dag opnieuw op nul zetten
Niet verwijderen, dan zie je niet meer hoeveel bezoekers er komen.

Elke dag op nul zetten lijkt me een beetje te vaak. Dan zie je vooral de telling van de artikelen waaraan wordt gewerkt (ik neem aan dat die ook worden meegeteld). Dus of 1 keer per week, of 1 keer per maand. Groet, Snoop 25 jul 2003 13:18 (CEST)[reageren]

Een maand lijkt me wat weinig, is het mogelijk om twee tellers er neer te zetten? Bijvoorbeeld 1 voor 3 maand, en 1 voor 1 maand? Anders ben ik gewoon voor die van een maand. -Fruggo (niet ingelogd)

2 tellers zit er niet in. Het zal al moeilijk genoeg zijn om te bekomen dat men de tellers elke maand opnieuw op nul wil zetten. Giskart Walter 25 jul 2003 14:25 (CEST)[reageren]
Of de teller laten aangeven, het aantal bezoekers van de afgelopen 5 weken of gewoon laten zoals ze zijn. jeroenvrp 25 jul 2003 15:03 (CEST)[reageren]
Ik heb al een voorschot genomen door vorige week de 4000 hoogste tellers op te halen, en te bedenken hoe een programmaatje te maken dat de verschillen sommeert. We kunnen die verschillen per dag, week, maand automatisch op een site ergens plaatsen. Gaat wel wat programmeerwerk inzitten, maar ik denk dat we dan het minste informatie weggooien. Als je ze elke 1e van de maand op nul zet zijn ze pas na de 20e goed te zien. Dat is dus erg lelijk. De Engelse wikipedia heeft afgezworen omdat elke page-access een schrijfactie naar de SQL database moet doen om het tellertje op te hogen. Dat is bij caching van de pagina's "onmogelijk". Rob Hooft 25 jul 2003 16:18 (CEST)[reageren]
Oja, als het zo kan is het ook goed. Het is gewoon zoals het zo is weet je niet veel met die tellers. Steeds maar de hoofdpagina en Idol Jim maar als plots het artikel over het konijn een massa bezoekers zou trekken bijvoorbeeld dan weten we dat niet. Giskart Walter 25 jul 2003 16:40 (CEST)[reageren]
Dat laatste is niet erg waarschijnlijk: Er is nog geen bladzijde konijn.. ;-) Jcwf

Ik zou het erg jammer vinden als de totaalteller zou verdwijnen. Ik beken dat ik (als ik toch op zo'n pagina ben) meestal wel even een blik werp op de bezoekcijfers van pagina's waaraan ik heb meegewerkt of die ik heb geïntroduceerd. De maandcijfers zijn alleen interessant voor de pagina's uit de actualiteit (de hypes, om het minder aardig te zeggen). 195.241.201.241 25 jul 2003 18:37 (CEST)[reageren]

Yuck, dit is een stuk moeilijker dan ik dacht. Sinds vorige week is bijvoorbeeld Michelangelo verplaatst naar Michelangelo Buonarotti. In de nieuwe tabel die ik een uurtje geleden maakte staat de laatste op 1421 hits, terwijl deze pagina vorige week nog niet voorkwam.... Nog ideeën hoe dat economisch op te lossen is? Rob Hooft 25 jul 2003 21:03 (CEST)[reageren]
Iets minder economisch dan ik dacht, maar ik heb een oplossing gevonden. Dit is de tabel voor de laatste 6 dagen, en het valt me erg tegen....
Hoofdpagina 633
Wikipedia 146
Vis between 117 and 214
Primates between 112 and 209
Lijst van goden en godinnen 103
Lijst van zoogdieren 97
Tijdzone 95
Aves 90
Tycho Brahe between 78 and 175
Lijst van vogels 70
Rode hond 61
Lijst van stripverhalen 60
Feest- en gedenkdagen 58
Brabançonne between 58 and 155
Heliocentrische theorie 56
Zoölogie 55
Masturbatie 54
Verenigde Staten van Amerika 53
Sint Petersburg 51
Natuur en milieu 51
Orale seks 50
Lijst van kunstschilders op geboortedatum 50
Nieuw-Zeeland 48
Overzichten en lijsten 47
Rood 46
Egyptische mythologie 46
Michelangelo Buonarotti 45
Relativiteitstheorie 44
GNU Vrije Documentatie Licentie 43
Ronde van Frankrijk 41
Ronde van Frankrijk 2003 39
Lijst van pausen 36
Napoleon Bonaparte 35
Ministerie van Volkshuisvesting, Ruimtelijke Ordening en Milieubeheer 35
In het nieuws 35
Kleur 34
Astronomie 34
Lijst van kunstschilders op alfabet 33
Mammalia 32
6e eeuw 32
Immanuel Kant 31
Lijst van reptielen 30
Guust Flater between 30 and 127
Lepidoptera 29
Wiskunde 28
Viking 28
Natuurkundige 28
Lijst van fabeldieren 28
Lijst van amfibieën 28
Acteur 28

Rob Hooft 25 jul 2003 22:07 (CEST)[reageren]

633 in 6 dagen, dat is dus 100 per dag. Helemaal niet zo slecht, vind ik. En het lijkt erop dat mensen ook via Google op die andere pagina's binnen komen. Ik zag net dat Eli Heimans ook al geïndexeerd was. Nummer 3 daar wanneer Heimans wordt ingetikt. Roepers 25 jul 2003 22:25 (CEST)[reageren]

Vergeten te vermelden dat ik de statistieken informatief vind. Zeker als ze herhaaldelijk worden aangeleverd. Ik heb ook nog even viking bekeken. Die 17 juli alleen 1 keer veranderd door Elly. Grote kans dat de anderen inderdaad bezoekers zijn. Maar een leuk plaatje erbij zou het wel goed doen.

Roepers 25 jul 2003 23:10 (CEST)[reageren]

100 per dag is 36500 per jaar, ofwel ~144000 in 4 jaar. De voorpagina zit nu al op 144000 na 2 jaar. Dat betekent dat we nu LAGER zitten dan het gemiddelde. Hoe kan dat? Idols? Rob Hooft 1 aug 2003 07:05 (CEST)[reageren]

Een groot deel van het bezoek komt vast vanaf Google. Orale seks staat op 3 in Google, Masturbatie ook op de eerste bladzijde. Primaten ook (maar daar waren we zelf ook mee bezig). Kunstschilders staat op 7. Elly 25 jul 2003 23:44 (CEST)[reageren]

Misschien een voortschrijdend getal of gemiddelde (over de laatste bv 30 dagen) in plaats van de teller elke 30 dagen op nul zetten? Dan heb je niet het probleem dat je pas op de ca 20e dag weer wat weet, maar je zie wel welke pagina's actueel bezocht worden en welke niet. Hypatia 26 jul 2003 00:18 (CEST)[reageren]

Wat ik hier mee bedoel is: je telt de hits van de laatste 30 dagen op, alle hits daarvoor laat je weg. Eventueel middel je dat, dan weet je het gemmidelde aantal hits per dag over afgelopen 30 dagen. Daarnaast blijft het interesant om het totaal aantal hits te laten staan. Hypatia 26 jul 2003 00:21 (CEST)[reageren]

Een mooier en simpeler algorithme dan voorstschrijdend gemiddelde waarbij je tevens maar 1 getal hoeft te bewaren is trends als volgt berekenen: Trenddag n = Hits dag n * α + Trend dag n-1 * (1-α) | 0 < α < 1
Dit lijkt ingewikkelder dan het is. Neem de uitersten: α = 0 => de nieuwe waarde telt geheel niet mee; α = 1 => de historie telt geheel niet mee. Hoe lager α des te meer worden pieken en dalen (ruis) afgevlakt, maar hoe langer het duurt voor een scherpe wijziging doorgewerkt heeft. Een goede waarde is b.v. 0.05 Erik Zachte 1 aug 2003 16:56 (CEST)[reageren]
Het zou zelfs mogelijk moeten zijn om een variant daarvan in de wikipedia software in te bouwen. Bijvoorbeeld door aan het eind van iedere dag de tellers met 0.95 te vermenigvuldigen, en verder gewoon door te tellen. Eventueel kunnen de tellers onderaan de pagina's dan door 20 worden gedeeld om een per-dag score te krijgen. Toch zou ik het jammer vinden als daardoor alle historie verloren zou gaan. Rob Hooft 1 aug 2003 18:09 (CEST)[reageren]

Hier is de tabel van 26 juli 2003 07:00 MET tot 1 aug 2003 07:00 MET


Hoofdpagina 627
Jupiter (planeet) between 458 and 528
Civiel recht - Nederland between 268 and 338
Strafrecht - Nederland between 206 and 276
Wikipedia 135
Lijst van goden en godinnen 91
Koning Boudewijn I 86
Verenigde Staten van Amerika 74
Tijdzone 70
Borst 59
Lijst van toptennissers 56
Waddeneiland 55
België 54
GNU Vrije Documentatie Licentie 53
Overzichten en lijsten 47
Isaac Newton 46
Relativiteitstheorie 44
Albanië 43
Lijst van kunstschilders op alfabet 42
Lichtsnelheid 42
In het nieuws 42
Heliocentrische theorie 42
Aves 42
Zwolle 40
Ronde van Frankrijk 2003 40
Golfoorlog (2003) 40
Drenthe 40
Napoleon Bonaparte 37
Ministerie van Volkshuisvesting, Ruimtelijke Ordening en Milieubeheer 34
Lijst van kunstschilders op geboortedatum 34
Witte dwerg 33
Wallonië 31
Componisten 31
Chandra X-Ray Observatory between 31 and 101
Tsjechië 30
2003 30
Lijst van beroepen 29
Lepidoptera 29
Suske en Wiske 28
Plantae 28
Nedersaksisch 28
Masturbatie 28
Gaius Julius Caesar 28
Fries 28
Diabetes mellitus 28
Baarmoederhals 28
Pornografie between 27 and 97
Koning Albert II 27
Zutphen 26
Rooms-Katholieke kerk 26

Rob Hooft 1 aug 2003 07:02 (CEST)[reageren]


Daarnet een kleine discussie op de IRC chatbox: Volgens mijn statistieken zijn er normaal gesproken dus 100 aanvragen per dag op de voorpagina. Maar volgens de webcounter zijn het er ~400. Hetzelfde geldt voor de laatste paar dagen met de 10000-craze: mijn tellers zeggen tussen 1-5 aug 1000 hits op de voorpagina, maar onze externe counter heeft het over 7000 alleen al op deze dinsdag! Er lijkt iets aan de hand te zijn waardoor de interne statistieken niet betrouwbaar zijn. Als dat inderdaad het geval is heeft het erg weinig zin om er wat dan ook maar aan moeite aan te besteden. We zouden uit de webserver-logs misschien iets beters kunnen trekken. Rob Hooft 5 aug 2003 22:30 (CEST)[reageren]

Wel nuttig; we kunnen vergelijken. De paginatellers, Nedstat en de nl.wikipedia.org/stats en dus vaststellen dat ze allemaal iets anders aangeven Voor de echte serverlogs; je altijd eens proberen ze vast te krijen, is mij niet gelukt. Walter 5 aug 2003 22:35 (CEST)[reageren]
Omgekeerd kan natuurlijk ook: het kan zijn dat de netstat servers niet datgene zijn wat wij denken. Ook op onze kerksite merk ik aan de netstat tellers 4 a 5 maal zoveel verkeer als een interne teller. De oorzaak is nog altijd een raadsel voor me. De overeenkomst hier mee is wel frappant. Toch kanm ik me een foutje in de netstat tellers ook niet zo goed voorstellen, ze tonen de individuele entries (laatste 10) en die maken een solide indruk. TeunSpaans 9 aug 2003 22:40 (CEST)[reageren]
Ik denk dat het te maken heeft met caching bij Bomis, op servers van de providers en/of bij mensen thuis (verschil tussen http GET en HEAD commando). Maar het verbaast me dat dat zoveel uitmaakt. Rob Hooft 9 aug 2003 23:12 (CEST)[reageren]

Statistieken van 1 augustus tot 9 augustus. Ca 8*24 uren.


Hoofdpagina 1906
Collectieve arbeidsovereenkomst - Nederland between 437 and 507
Wikipedia 352
GNU Vrije Documentatie Licentie 245
Beeld van Zeus te Olympia between 227 and 297
In het nieuws 202
Afbeelding between 148 and 218
Seksualiteit 146
Verenigde Staten van Amerika 145
Tijdzone 116
Borst 115
Lijst van zoogdieren 100
Zoölogie 99
Computer 95
Natuur en milieu 92
365 dagenschema 90
Overzichten en lijsten 87
Orale seks 87
Koning Boudewijn I 86
Masturbatie 83
Schaken 72
Lijst van goden en godinnen 71
Johann Sebastian Bach 69
Elektronica 67
Egyptische mythologie 63
Plantae 60
Mammalia 57
Wereldbeker Wielrennen 56
Relativiteitstheorie 56
Kunstschilders 55
Periodiek systeem 52
Napoleon Bonaparte 52
Jehovah's Getuigen 52
Bahama's 52
Sovjet-Unie 51
Michelangelo Buonarotti 49
Hittegolf between 48 and 118
Hindoeïsme 46
Componisten 46
2003 46
Geologisch tijdvak 44
Fries 44
Bloeddruk 44
Amerikaanse burgeroorlog 44
Evolutieleer 43
Eurovisiesongfestival 43
Pseudoniem 42
Lijst van Universiteiten 42
Biografielijst popmuziek 41
Pinguïn 40

Rob Hooft 9 aug 2003 11:56 (CEST)[reageren]


Heb naar de statistieken gekeken en daar is mij het volgende opgevallen;

  • blauwalg is verbazend populair
  • Alle artikels die zich in de seksualiteit sfeer bevinden scoren goed
  • de pagina van gebruiker "J" krijgt veel bezoekers. "J" heeft ooit maar 1 bewerking gedaan en die populaire gebruikerspagina is niet eens actief.
  • de pagina's Wikipedia:Welkom_voor_nieuwelingen en Wikipedia:Welkom_Wolkom krijgt flink wat bezoekers
  • Idol's blijven zakken, niet snel genoeg maar het gaat toch de goede kant uit.
  • kintertent.nl, daar zitten een paar Idol's broeinesten, vandaar de traffiek.
  • we zijn ook zeer populair bij pornowebsite's. Het zijn eigenlijk allemaal website's van dezelfde. Andere Wikipedia's hebben daar zover ik heb kunnen zien geen last van.

Ik heb nogmaals een verzoek tot toegang tot de bezoekerslogs gedaan op wikitech-l en uitbreiding van het aantal treffers van de stats zonder enige reactie tot nu (zoals gebruikelijk) Als er iemand zich geroepen zou voelen om nog wat te zagen, ga je gang. Walter 11 aug 2003 10:43 (CEST)[reageren]

In Nederland is op het journaal gewaarschuwd voor besmetting van het oppervlaktewater met blauwalg, door de aanhoudende hitte, vandaar. Erik Zachte 11 aug 2003 12:06 (CEST)[reageren]

top 50 van 9 augustus t/m 16 augustus


Hoofdpagina 1519
In het nieuws 333
Wikipedia 213
GNU Vrije Documentatie Licentie 207
Arthropoda (taxonomie) between 197 and 269
Verenigde Staten van Amerika 141
365 dagenschema 135
Lijst van goden en godinnen 103
Lijst van zoogdieren 94
Periodiek systeem 87
Nederlandse gerechten, ingrediënten, bereidingswijzen en diverse overige recepten, kortom alles wat met voedsel bereiden en klaarmaken te maken heeft 86
Hittegolf 81
Overzichten en lijsten 79
Kunstschilders 77
Seksualiteit 73
Lijst van chemische stoffen between 71 and 143
Tijdzone 68
Metazoa 64
Masturbatie 63
Borst 63
Egyptische mythologie 62
België 62
Aves 60
Natuur en milieu 57
Lijst van films 57
Fryslân 56
Christoffel Columbus 51
Schaken 50
Plantae 50
Mammalia 50
Orale seks 48
Object-orientatie 46
Classificatie en Evolutie 46
Wereldbeker Wielrennen 45
Volkslied 45
Europese Unie 45
Calculus 45
Bloeddruk 45
Mijlpalen in de ruimtevaart (3) 44
Mijlpalen in de ruimtevaart (2) 44
Koning Boudewijn I 44
Ruimtevaart 43
Vlaanderen 42
Relativiteitstheorie 42
Rechtsvorm 42
Mijlpalen in de ruimtevaart (5) 42
Lijst van Universiteiten 42
Waddeneiland 41
Mijlpalen in de ruimtevaart 41
Jehovah's Getuigen 41

Rob, ga je hier met een bot elke week alle 10000 artikelen voor langs?

Ik heb een paar suggesties:

  • Maar er een apart artikel van, nu staat het op een overleg pagina.
  • Presenteer twee tabellen, één met gegevens van de laatste week (en alleen de laatste week), één die trends (zie mijn trendformule, zo hoef je per artikel maar 1 getal in een file te bewaren) laat zien. Ik vraag me b.v bij het artikel over gerechten af of dat toch niet vnl eigen page views zijn, het artikel is nogal uitgebreid bediscussieerd. Erik Zachte 16 aug 2003 13:02 (CEST)[reageren]

Ik bedenk me dat de views op de GNU Vrije Doucmentatie Licentie misschien wel de beste maat voor het aantal nieuwe bezoekers is, lang niet iedereen zal die pagina aanklikken, maar zelden zal iemand dat na een eerste bezoek opnieuw doen. Het alleen pagehits op die pagina is dus niet het aantal bezoekers, maar de trend in dat aantal is wel veelzeggend. Erik Zachte 16 aug 2003 13:08 (CEST)[reageren]

Dit is een heel dom scriptje: ik haal PopularPages op, en slaat die op. Twee van die files worden vergeleken en de getallen van elkaar afgetrokken. Er is alleen wat magie nodig om verplaatste pagina's te volgen. Dit draai ik met de hand, en aangezien de getallen niet erg zinvol lijken, denk ik erover om er ook weer mee te stoppen. Ik denk dat het wordt gedomineerd door de ingelogden, de rest krijgt de pagina van een bomis-wiki-cache. Rob Hooft 16 aug 2003 13:29 (CEST)[reageren]


Statistiek, statistiek en de groei van wikipedia


Ik heb over twee dagen eens de twee statistiek pagina's 'populairste artikelen' vergeleken voor de niet idols pagina's. Voor de volledigheid heb ik idols zelf wel meegenomen, maar niet de afzonderlijke personen. Mijn bedoeling met deze exercitie was een antwoord te vinden op de vraag: waarop komen mensen bij wikipedia af? wat voor informatie zoeken zij? Waaraan moeten we extra aandacht geven als we willen groeien?

Onderstaand schema geeft (overzicht is niet volledig):

  • Idols: Aantal4juni=47553, Aantal6juni=47684, Bezoekers2dagen=131, google=-
  • Griekse mythologie: Aantal4juni=47553, Aantal6juni=47684, Bezoekers2dagen=156, google=4
  • Tweede Wereldoorlog: Aantal4juni=4881, Aantal6juni=4987, Bezoekers2dagen=106, google=-
  • periodiek systeem: Aantal4juni=4774, Aantal6juni=4885, Bezoekers2dagen=111, google=6,7
  • Europese Unie: Aantal4juni=4125, Aantal6juni=4185, Bezoekers2dagen=60, google=-
  • Muziek: Aantal4juni=3860, Aantal6juni=3916, Bezoekers2dagen=56, google=-
  1. Naam artikel. Spraakt voor zich.
  2. Aantal4juni= aantal bezoekers op 4 juni.
  3. Aantal6juni= aantal bezoekers op 6 juni.
  4. Bezoekers2dagen= aantal bezoekers in 2 dagen tijd, het verschil tussen bovenstaande.
  5. Google: de plaats waarop de pagina binnen google verschijnt wanneer ik het betreffende onderwerp intyp. Dwz google=6,7 wil zeggen: wanneer ik de artikel naam in google intyp, komt dit artikel op de 6e en op de 7e plaats voor. Een streepje wil zeggen dat het bij google niet op de eerste pagina, dus bij de eerste 10 hits zag.

Wat zegt dit?

  • Idols is nog steeds populair, maar niet zo populair als het geweest is.
  • het artikel over griekse mythologie lijkt onze grootste trekpleister.

Ik vermoed dat er een duidelijke relatie ligt tussen de lengte van een artikel en het aantal bezoeken. Het aantal artikel bezoeken wekt de veronderstelling dat de artikelen meer door 'bezoekers van buiten' als door 'vrijwilligers van wikipedia' bekeken worden. Het artikel over de Tweede Wereldoorlog vormt een uitzondering, dit is vlak voor de rapportage periode aangepast. Vermoedelijk ligt er ook een duidelijke relatie tussen de lengte van het artikel en het aantal malen dat de naam van het artikel in het artikel voorkomt. Er van uitgaande dat google (de meest gebruikte zoekmachine) hierop let, is het goed om de artikelen die we hebben zo uitgebreid mogelijk te maken.

Bovenstaande steekproef betreft anderhalf a twee dagen. Er moeten dus niet al te conclusies uit getrokken worden. Ik heb google genomen, omdat er op de engelse wiki een artikel is over welke wiki artikelen er bij google op nummer 1 staan. Deze artikelen verdienen extra aandacht. Zover lijken we helaas nog niet te zijn. Naast de in bovenstaand lijstje vermeldde onderwerpen kunnen nog vermeld worden: Expressionisme (google=7), zeven wereldwonderen (google=8) en impressionisme (google=9).

Behalve google zijn er natuurlijk meer ingangen. De vele startpagina.nl zijn een andere. Deze heb ik nog niet bekeken. TeunSpaans 6 jun 2003 13:55 (CEST)[reageren]




Bericht; door de aanpassingen van de http://www.wikipedia.nl pagina zijn er vanaf nu geen bezoekersstatistieken meer beschikbaar van de traffiek via deze pagina.

De Nedstattellers zijn in gebruik genomen einde oktober 2002. Toen waren de echte stats van de site nog niet beschikbaar. Zelfs daarna bleven de Nedstattellers de meest overzichtelijke manier en vaak de enigste manier om de evolutie van het verkeer via enkele specifieke pagina's te meten. Walter 27 aug 2003 21:05 (CEST)[reageren]

Kunnen hier geen statistieken komen van nl.wikipedia.org ipv deze uit gebruik zijnde wat ben je trouwens met oude stats. Tevens wordt het geen tijd voor een update

Ben je vrijwilliger om een betere klus te klaren? :-) Flyingbird 9 sep 2003 23:07 (CEST)[reageren]

Archivering gedaan door en op; Walter 1 oct 2003 09:49 (CEST) . Alle bovenstaande teksten zijn van deze datum of ouder.