Nederlog        

 

  3 maart 2009

 

Opiniepeilen

 

Volgens Maurice de Hond is de PVV van Wilders nu de grootste partij van Nederland, "virtueel" dan, in zijn peilingen, en wel met 27 zetels, of "zetels" omdat ze virtueel zijn. Vervolgens kwam dat uitgebreid in de Telegraaf van zaterdag en de andere kranten van maandag.

En vandaag staat er een artikel in de NRC van iemand die zich (kennelijk) bekwaamd heeft in De Wetenschap die "Kiesonderzoek" heet - "Prof.dr. Joop van Holsbergen is universitair hoofddocent en bijzonder hoogleraar Kiezersonderzoek" - met de kop "De peiling van Maurice de Hond deugt niet".

Ik schrijf erover omdat ik in statistiek en waarschijnlijkheid geïnteresseerd ben en omdat er een paar wat vreemde kantjes aanzitten.

Eerst de hoogleraar (*) die de representativiteit van De Hond's steekproef of steekproeven betwijfelt c.q. ontkent:

De stap van steekproef naar populatie, van Peil.nl naar 'de' Nederlandse kiezers, is een wilde, onverantwoorde sprong. De claim van representativiteit, die de Hond in de verantwoording van zijn peil-methode maakt, is eerder een staaltje bluf dan een positie die wetenschappelijk gestut is.

Wel - er zijn "lies, damned lies, and statistics", maar de professor maakt zijn stelling niet erg hard of duidelijk, behalve dat De Hond een panel gebruikt voor zijn steekproeven dat niet aselect is, maar dat kennelijk mensen betreft die het leuk vinden door De Hond gepeild te worden, al dan niet tegen betaling. (Ik heb geen idee.) (**)

Maar "De stap van steekproef naar populatie" is altijd een probleem - daar draait een groot deel van de statistiek immers om - en ik vermoed dat de hoogleraar niet zozeer deze specifieke peiling inzake Wilders slecht bevalt als wel het hele gepeil van De Hond.

En wat waar is, is dat ook ik daar niet zoveel geloof aan hecht, zoals trouwens aan vrijwel alle peilingen - maar daarvoor weet ik dan ook het een en ander van statistiek (best mooi, in de wiskunde) én van sociale wetenschappers en idem wetenschappen (die ik minder hoog heb).

En wat ook waar is, is dat Maurice de Hond onevenredig veel invloed heeft op de opinies en de kranten door het peilen van de opinies en de resultaten van die peilingen met zekere handigheid publiek bekend te maken, maar dat ligt toch weer meer aan de kranten en de lezers, of de TV en de kijkers, dan aan De Hond zelf, al doet hij zijn best op te vallen.

Het achter- of onderliggende probleem is eigenlijk veel belangrijker, en dat bestaat in het volgende

  • De bevolking is overwegend dom (en worden dus bedrogen of ze dat willen of niet) en kan niet goed omgaan met statistiek, en weet daar ook ten naaste bij niets van.

  • De hele rapportage en het taalgebruik rondom kansen, waarschijnlijkheden en statistieken is allerbelabberdst in de media.

Het eerste deelprobleem is onoplosbaar, zeker met het peil van "onderwijs" dat de meerderheid tegenwoordig "genoten" heeft, waarin 18-jarige TH-studenten de sommetjes niet kunnen maken die iedere 12-jarige vijftig jaar geleden moest kunnen maken om een einddiploma L.O. te verkrijgen.

Het tweede deelprobleem is minder moeilijk oplosbaar, al zie ik ook dit niet verbeteren, behalve dat journalisten verplicht statistiek zouden moeten leren, wat héél wel kan, ook voor alfa's, want er zijn tal van aardige inleidende niet-veeleisende boekjes, van schrijvers als Moroney (in Penguin) en Wijvekate (Aula), met resp. "Statistics" en "Statistiek" in de titel. Deze leggen ook veel en duidelijk uit en geven weinig sommen. (***)

Een bijzonder goed praktijkboek, ook heel helder, is "Statistics Manual", van Crow, Davis en Maxfield, in Dover paperbacks, dat oorspronkelijk een handboek van de Amerikaanse vloot is. (Ik heb wel meer handboeken van het Amerikaanse leger, nogal oud weliswaar, die heel goed bleken en waar duidelijk veel moeite in gestoken was om ze didactisch goed te maken. Dit is dan ook weer de reden dat ik dit boek noem, dat ook al oud is, maar waarschijnlijk nog wel verkrijgbaar.)

Hoe het zij, er zou veel gewonnen zijn als intelligente mensen veel problemen opgeworpen door beweringen X vatten in de volgende zin

  • Wat is de kans dat deze bewering X waar is?

  • Hoe schat ik deze kans?

  • Hoe gefundeerd of geloofwaardig is die schatting?

En als je eenmaal door hebt dat dit heel fundamentele vragen over vrijwel alle beweringen zijn, en een héél klein beetje van statistiek weet, dan weet je dat beweringen als "Wilders heeft 27 zetels!?!" feitelijk neerkomen op iets als

  • Volgens peiler X en peildata Y en methode M is de kans dat Wilders 27 ± 15 zetels (meetfout) ... zou hebben, als er nu verkiezingen zouden zijn, groter dan w.

Dit is ook nog lang niet volledig (****), maar laat in ieder geval zien dat oordelen als besproken afhangen van een peiler X, peildata Y, methode M, meetfout Z, en - met die releveringen, minstens, als er geen fouten gemaakt zijn - een waarschijnlijkheid W groter dan w.

Het is echter ook te vrezen dat in de media, zoals ze zijn, voornamelijk infotainment gepresenteerd wordt, en dat zelfs als journalisten in staat zijn de waarheid te begrijpen, ze liever schrijven wat de lezers prikkelt.


(*) Alleen in het voorbijgaan, omdat ik het zowel gek vind als een teken aan de wand waar het de debilisering van de universiteiten betreft: Er zijn tegenwoordig zeer veel "professoren" aan universiteiten met aanstellingen, die kennelijk vaak voor hun persoontje gecrëeerd zijn, die over lariekoek gaan, en "hoogleraar Kiezers-onderzoek" is er ook zo één, want alleen al de titel is onduidelijke kul. (Misschien dat hij weinig of niets van statistiek weet en hun aura's leest? Of de staat van hun gebit correleert met de graad van hun populisme?)

In mijn tijd had je hoogleraren statistiek, of statistiek en waarschijnlijkheid, en die gaven dat vak of die vakken, en wat je daar leerde kon je dan - als je het echt begreep - inderdaad zelfstandig toepassen voor behoorlijk wetenschappelijk onderzoek naar bijvoorbeeld de politieke preferenties van kiezers.

Ik vermoed dat dit voor de modern opgeleiden te moeilijk is, en dat de statistiek en waarschijnlijkheid dus eenvoudig overgeslagen worden, maar geef toe dat dit alleen een donkerbuin vermoeden is, al is het een redelijk gefundeerd vermoeden.

(**) Die a-selectiviteit is niet persé een tekortkoming, maar het is waar dat het speciale problemen over de steekproef met zich meebrengt.

(***) Ik citeer uit mijn hoofd en las allebei de werkjes lang geleden, maar ze zijn alleraardigst en leerzaam, en hadden ooit heel wat herdrukken. En ik noem deze twee omdat ze allebei zowel inleidend als goed zijn en weinig voorkennis van node hebben (al is dit een frase waar je met het moderne onderwijs voorzichtig moet zijn).

Het is in ieder geval niet waar dat er niet voldoende duidelijke, bevattelijke, aardige en leerzame inleidingen statistiek zouden zijn waaraan - zelfs - journalisten enige waarachtige kennis van statistiek en waarschijnlijkheid zouden kunnen ontlenen.

(****) De peildata hebben gewoonlijk ook meetfouten en hangen vaak van methodes af (die weer fouten in zich kunnen dragen); de methoden herbergen vaak een lange lijst aan vooronderstellingen, soms zeer vergaand of ingewikkeld, ook in de statistiek zelf; en ook waarschijnlijkheid heeft nogal wat interpretaties.

Maarten Maartensz

        home - index - top - mail