Representativiteit en steekproeftrekking
Representativiteit en steekproeftrekking zijn belangrijke onderdelen in een onderzoek. In de onderstaande paragrafen worden representativiteit en steekproeftrekking in het kort uitgelegd. Om de grootte van de steekproef te bepalen bij kwantitatief onderzoek hanteert Newcom Research & Consultancy voor de bepaling van de grootte van de steekproef de volgende statistische formule: S = 1,96 * √ ( P * (100 – P) / n ). Voorgaande formule betekent dat bij een 95 % – betrouwbaarheidsinterval en een maximale foutmarge van 5 % er circa 385 respondenten moeten worden ondervraagd (bij een populatie van n=20.000 of meer). Voor een twee keer zo hoge nauwkeurigheid heeft men vier keer zoveel respondenten nodig. Hierbij geldt in algemeenheid de regel: hoe meer respondenten, hoe groter de betrouwbaarheid.
De grootte van de steekproef is eveneens van invloed op de diepgang van de statistische analyses. Voorgaande betekent dat de celvullingen bij elke gewenste statistische analyse hoger liggen dan de gebruikelijke minimale grens van vijftig respondenten.
Desondanks kunnen de uitkomsten die verkregen worden via een steekproef, afwijken van de uitkomsten die verkregen zouden zijn als de totale populatie in het onderzoek was betrokken. Afhankelijk van een aantal factoren, blijven deze afwijkingen echter binnen bepaalde marges. Bij de interpretatie van de resultaten moet onder andere rekening worden gehouden met de volgende vier factoren:
1. Het a-selecte karakter van de steekproef;
2. De grootte van de steekproef;
3. De maximale foutmarge c.q. de afgesproken mate van waarschijnlijkheid;
4. Het gevonden percentage op de vraag.
Onder de voorwaarde dat de steekproef inderdaad a-select is gekozen, kan met 95 procent zekerheid worden voorspeld hoe de antwoorden op de gestelde vragen zouden luiden als zij aan de gehele populatie zouden zijn gesteld. Bij de nauwkeurigheid van de voorspelling gebruiken we de volgende formule:
S = 1,96 * √ ( P * (100 – P) / n ). Voorgaande formule wil zeggen dat de voorspelling van het ‘werkelijke antwoord’ (indien ieder lid uit de doelgroep zou worden ondervraagd) nauwkeuriger is naarmate de steekproef groter is en naarmate het antwoord extremer is. Ter voorbeeld een uitwerking:
1. Als de steekproef bestaat uit 400 respondenten, een maximale foutmarge van 5 procent wordt gehanteerd en op een stelling door 50 procent van de respondenten “ja” wordt geantwoord, dan is de bandbreedte 1.96 * √ (50*50)/ 400 = 4.9. Kortom: in werkelijkheid ligt het antwoord tussen de 45 en 55 procent (50 – 4.9; 50 + 4.9).
2. Als de steekproef bestaat uit 1000 respondenten, er eveneens een maximale foutmarge van 5 procent wordt gehanteerd en op een stelling eveneens door 50 procent van de respondenten “ja” wordt geantwoord, dan is de bandbreedte 1.96 * √ (50*50)/ 1000 = 3.1. Kortom; in werkelijkheid ligt het antwoord tussen de 47 en 53 procent (50 – 3.1; 50 + 3.1).
De formule op grond waarvan deze voorspelling kan worden uitgerekend bestaat uit de constante “1,96” die moet worden gehanteerd bij voorspellingen met een zekerheid van 95% (max. foutmarge = 5). Gebruiken we een ander zekerheidspercentage, dan hoort hier een andere constante waarde bij op grond waarvan de voorspelling kan worden berekend. Op een zelfde wijze kan de berekening uitgevoerd worden indien het antwoord extremer is: Indien de steekproef bestaat uit 400 respondenten, een maximale foutmarge van 5 procent wordt gehanteerd en op een stelling door 90 procent van de respondenten “ja” wordt geantwoord, dan is de bandbreedte 1.96 * √ (90*10)/ 400 = 2.9. Kortom: in werkelijkheid ligt het antwoord tussen de 87 en 93 procent (90 – 2.9; 90 + 2.9).