Når man læser statistiske undersøgelser, og særligt undersøgelser af spørgeskemadata og sundhedsstudier, er de fleste tilbøjelige til at tro, at jo større den er, jo bedre er den også. Det er en god tommelfingerregel i nogle tilfælde, men kan være meget misvisende i andre. Pointen med dagens post er derfor at illustrere de problemer med såkaldt sampling- og selektionsproblemer, som kan føre til at undersøgelser af bl.a. danskernes holdninger og af sygdomsforhold kan være så stærkt problematiske, at de er værre end ingen undersøgelser.
Vi stiller derfor et hypotetisk eksempel op, hvor man gerne vil vide noget om, hvor udbredt en bestemt ekstrem holdning er – det kunne være, om alle homoseksuelle skal have tæsk – eller hvor udbredt en sygdom er – i dagens eksempel corona. I vores hypotetiske eksempel er der 1 % af alle borgere, der har en bestemt holdning eller er smittede. Spørger man således 9000 borgere i en korrekt gennemført undersøgelse, vil de 90 erklære sig enige med det bestemte spørgsmål, eller være smittede. Spørgsmålet er så, hvordan store studier kan komme til helt andre konklusioner.
Læs resten