FAQ og svar om “A Literature Review and Meta-Analysis of the Effects of Lockdowns on COVID-19 Mortality”

Sammen med Steve Hanke fra Johns Hopkins University og Lars Jonung fra Lund Universitet, har jeg udgivet en meta-analyse, hvor vi ser på effekten af nedlukninger på antallet af COVID-19-dødsfald. Det oprindelige arbejdspapir kan findes her (vi har udgivet en opdateret version her). Jeg skrev også en kommentar i Berlingske på baggrund af studiet, som kan findes her. Endelig taler Martin Ågerup og jeg om studiet i et afsnit af Regelstaten, som du kan høre her. An English version of this FAQ can be found here.

Jeg får mange spørgsmål relateret til studiet. Nedenfor har jeg besvaret de hyppigste spørgsmål. Jeg vil løbende opdatere dette indlæg med flere spørgsmål og svar.

FAQ

SVAR

Hvorfor virker nedlukningerne ikke?

Det er ikke noget, vi som sådan undersøger i vores studie. Vores studie undersøger udelukkende om nedlukninger har haft en effekt, og hvor stor den effekt er. Dog har vi en række teser, som potentielt kan forklare, hvorfor nedlukningerne ikke har haft nævneværdig effekt, som er konklusionen på vores studie.

For det første reagerer folk på smitten i samfundet. Er den stigende, passer vi mere og mere på. Er den faldende, slapper vi mere og mere af. Det er en adfærd, som bl.a. HOPE-projektet har påvist. For det andet, er det en relativt begrænset andel af vores smitterisiko, staten har reguleret gennem nedlukningerne. Man kunne forestille sig at en betydelig del af smitterisikoen findes i hjemmet og på arbejdspladsen, men det har gennem hele pandemien været lovligt at mødes med venner og bekendte i sit eget hjem, og de fleste arbejdspladser har været åbne, som eksempel. For det tredje, kan dele af nedlukningen have ført til utilsigtede konsekvenser. Da man fx indførte et forsamlingsforbud på fem personer i januar 2021, forhindrede man venner og familier i at mødes udendørs, hvorfor nogen af dem i stedet er mødtes hjemme, hvor smitterisikoen er langt større.

Vi diskuterer hvorfor nedlukningerne ikke har været effektive på side 41-43 i arbejdspapiret. Bemærk, at vi kun diskuterer emnet fra en samfundsvidenskabelig vinkel. Der kan muligvis også være epidemiologiske forklaringer på, hvorfor nedlukningerne ikke virker, men dem overlader vi til epidemiologerne at pege på.

Hvis nedlukningerne ikke virker, hvad driver så forskellene mellem landene?

Der er mange forskelle mellem lande, der potentielt kan påvirke antallet af døde af COVID-19. Demografi, kultur, klima osv. påvirker alt sammen smittespredningen. Rene tilfældigheder kan også spille ind. Fx finder to studier, at svenskerne bl.a. blev hårdt ramt, fordi de tilfældigvis havde vinterferie i uge 9, hvor der i 2020 var store (uopdagede) smitteudbrud på mange skisportssteder i Alperne (jeg har beskrevet det her). Vi ved også, at svenskerne har flere sårbare ældre og flere indvandrere, hvor smittespredningen har været højere. I Tyskland har mere katolske områder haft større smittespredning end protestantiske områder (måske pga. forskelle i familiemønstre). Der er også forskel på, hvordan myndighederne har kommunikeret til borgerne. I starten af pandemien undervurderede de svenske myndigheder dødeligheden af COVID-19 betydeligt, og det gjorde at deres råd til svenskerne var anderledes end de råd, danskerne fik. Vi beskriver alt dette i arbejdspapiret på s. 42-43.

Påviser de studier, I gennemgår, korrelation eller kausalitet?

Kausalitets-problemet opstår, hvis politikerne lukker hårdere ned i de lande, der er hårdt ramt af COVID-19. Dette kan nemlig resultere i at man finder, at hårde nedlukninger er korreleret med mange dødsfald. Flere af de studier vi har med, diskuterer dette problem. En del undersøger kausaliteten ved hjælp af instrument variable, mens andre via argumenter begrunder, hvorfor de finder kausalitet og ikke simpel korrelation. Desuden viser Sebhatu et al. (2020), at graden af nedlukning under første bølge (som hovedparten af vores studier dækker) ikke skete som svar på pandemien, men snarere som svar på nabolandes nedlukning. De sydeuropæiske lande lukkede altså – ifølge Sebhatu et al. – ikke hårdt ned, fordi pandemien var slem, men fordi de andre sydeuropæiske lande lukkede hårdt ned. Man skal huske på, at der var meget lidt viden om, hvor slem pandemien var i marts 2020. Man havde ikke den nødvendige testkapacitet, så man vidste ikke hvor hårdt man var ramt. Derfor er det – i mine øjne – svært at argumentere imod Sebhatu et al. og hævde, at politikerne reagerede på pandemiens udbredelse. Vi omtaler kausalitets-problemet på s. 15 i arbejdspapiret.

I ser på dødsfald, men argumentet for nedlukningerne var at beskytte hospitalerne. Leder I det rigtige sted?

Argumentet for at beskytte sundhedssektoren var, at man ellers ville se en unødvendig stor overdødelighed, fordi COVID-19-patienter ikke kunne få den nødvendige behandling, hvis hospitalernes kapacitet blev opbrugt. Derfor ville vi se det i dødstallene, hvis nedlukningerne bidrog mærkbart til at beskytte sundhedssektoren. Grunden til at vi kigger på forholdet mellem lockdowns og dødsfald (og ikke fx bekræftede tilfælde) er, at data for dødsfald er mere pålidelige, da de i mindre grad afhænger af, hvor meget hvert land har testet.

Hvorfor ekskluderer I studier, der ser på betydningen af timing (at indføre nedlukninger på det helt rigtige tidspunkt)?

Der er mange der mener at nedlukninger virker, hvis bare de times rigtigt. Dette er ikke nødvendigvis i modstrid med vores resultater. Vores resultater viser, at de lande, der gjorde allermindst, opnåede næsten samme effekt som de lande, der gjorde allermest. Det kunne for eksempel skyldes, at det er timingen – og ikke graden af nedlukning – der er vigtig for at nedlukninger virker.

Vores studie undersøger effekten af lockdowns generelt. I princippet undersøger vi to ting. For det første undersøger vi, om hårde nedlukninger har været mere effektive end milde nedlukninger (dette diskuterer vi på s. 13-14 under ”Effects are measured relative to Sweden in the spring of 2020” i arbejdspapiret). Vi undersøger også, om den gennemsnitlige nedlukning i Europa og USA har påvirket dødeligheden. I begge tilfælde er svaret, at effekten er meget lille. Det betyder ikke nødvendigvis, at der ikke er nogle lande, der har ramt den helt rigtige timing, og dermed opnået en stor effekt. Det betyder derimod, at hvis timingen er vigtig, har landene generelt ikke været i stand til at ramme den rigtige timing. På samme måde kan man ikke udelukke, at nogle former for nedlukning ville have været meget effektive. Myndighederne har i så fald bare ikke været i stand til at finde dem.

Man kan også sammenligne det med aktiespekulation eller at spille lotto. Man kan i princippet tjene mange penge, hvis man bare timer sine aktiekøb og -salg rigtigt, eller hvis man køber den rigtige lottokupon. Det er de færreste i stand til, fordi informationen ikke er til rådighed på købstidspunktet.

Og det er essentielt for hele timingdiskussionen. For selv hvis præcis timing virker, er det svært at se, hvad man kan bruge resultatet til rent politisk. Politikere i demokratier vil have svært ved at indføre nedlukninger, medmindre en stor del af befolkningen er enig i, at det er nødvendigt og acceptabelt. Desuden er der ikke meget, der tyder på, at politikere generelt er gode til at time indgreb rigtigt. Det er fx set gentagne gange, at politikerne mistimer økonomiske stimuli, selvom det er et område, hvor man har lang tid til at undersøge den helt rigtige timing. Vi så også med omikronbølgen, at tidlig indgriben kan være en overreaktion.

Et andet problem er, at hvis en stor del af befolkningen ønsker restriktioner, vil det også betyde, at de har ændret adfærd af sig selv – eller som minimum nemt kan påvirkes til det. Og da studierne af timing generelt har sværere ved at adskille effekten af frivillig adfærd fra effekten af nedlukningen (fordi de ser på tidspunktet ift. pandemiens udvikling, og ikke i forhold til hvornår information når landet), vil de systematisk overvurdere effekten af nedlukninger. Vi behandler “The role of timing” på s. 11-12 samt i Appendiks A i arbejdspapiret.

Er det ikke et problem, at ét studie betyder SÅ meget for jeres konklusioner?

Der har været en del debat om ét af studierne i tabel 3, fordi det – på grund af meget lav standardafvigelse – vægter meget højt i forhold til de øvrige studier (vægten beregnes som 1/standardafvigelsen).

Det er rigtigt, at studiet vægter meget højt, men det er forkert, at det betyder meget for vores resultater. Vi viser dette i fodnote 35 (s. 31), hvor vi skriver “Excluding Chisadza et al. (2021) from the precision-weighted average changes the average to -3.5%”. Hvis vi helt fjerner studiet fra vores analyse, ændres effekten altså kun lidt (-3,5% er stadig lidt ift. hvad vi blev stillet i udsigt).

En mere uddybende fodnote kunne være: “Excluding (Chisadza et al., 2021) changes the precision-weighted average from -0.2% to -3.5%, while setting the weight to 256 (like the second highest weight) changes the precision-weighted average to -2.5%. If we use the estimates from their quadratic form, the precision-weighted average changes from -0.2% to -0.01% (using same weight).”

Det er med andre ord ikke korrekt, at vores konklusioner er baseret på ét studie.

Hvorfor har I ikke flere studier med i jeres meta-analyse?

Det skyldes, at der ikke er flere studier. Vi har gennemsøgt al den litteratur, der eksisterede pr. 1. juli 2021. I alt har vi screenet knap 19.000 titler, og der er altså kun 24 studier, der lever op til vores kriterierne (bl.a. ekskluderer vi modelstudier af grunde der er åbenlyse).

Det er relevant at overveje, om vores kriterier – som blev fastlagt før vi begyndte at søge litteratur og analysere studierne grundigt – er for skrappe. Fx kunne man godt argumentere for, at studier, der ser på nedlukningers effekt på indlæggelser, også ville være relevante. Vi håber, at andre forskere vil bidrage med en gennemgang af den del af litteraturen.

Ville det ikke være bedre at basere sin viden på lodtrækningsforsøg?

Der er ingen tvivl om, at lodtrækningsforsøg (randomized control trials – RCT) er state-of-the-art. Der er en grund til, at man kræver lodtrækningsforsøg inden man tillader ny medicin (pharmaceutical interventions). Desværre har man ikke lavet lodtrækningsforsøg for nedlukninger (non-pharmaceutical interventions). Derfor er man nødt til at basere sig på den viden, der nu engang er, med de bedste metoder, man nu engang har. Man laver fx heller ikke lodtrækningsforsøg på mennesker, for at kunne dokumentere, at det er usundt at ryge.

Det betyder imidlertid ikke, at der ikke findes studier, der ligner lodtrækningsforsøg. Vi er stødt på to naturlige eksperimenter, der er samfundsvidenskabernes svar på lodtrækningsforsøg. Bjørnskov og Kepp (2021) udnytter, at nogle kommuner i Nordjylland blev lukket ned pga. mink-varianten (og altså IKKE pga. smitten generelt), mens andre gik fri. De finder ingen effekt af nedlukningen. Dave et al. (2020) udnytter, at højesteretten i Wisconsin ophævede udgangsforbuddet, da det var et brud på forfatningen (og altså ikke relateret til smittetryk eller lignende). De finder ingen effekt af at ophæve udgangsforbuddet. Disse to studier er ikke med i vores meta-analyse, fordi de ikke lever op til kriterierne (Bjørnskov og Kepp ser ikke på dødsfald, og Dave et al. er et “synthetic control”-studie (se her).

Du og dine medforfattere er økonomer. Burde det ikke være epidemiologer, der undersøgte dette?

Bemærk først, at vi medtager studier fra alle faggrupper. Det er rigtigt, at økonomer ved meget lidt om virus, og hvordan det fx spredes. Til gengæld ved økonomer rigtig meget om adfærd, og rigtig mange økonomer beskæftiger sig med at undersøge effekten af førte politikker. De Økonomiske Råd har bl.a. set på hvad huslejeregulering betyder for bosætningsmønstre, og hvad normeringer i daginstitutioner betyder for behovet for specialundervisning. Og økonomer fra VIVE har undersøgt, hvad klassekvotienter betyder for børnenes karakterer.

Ekspertgruppen om en langsigtet strategi for et genåbnet Danmark bestod af to økonomer og tre “virologer” (Astrid Iversen, Kåre Mølbak og Jens Lundgren). De valgte økonomen Torben M. Andersen til at undersøge, hvor godt nedluknings-politikken havde virket. Og det var der altså rigtig gode grunde til. For selvom Iversen, Mølbak og Lundgren er fremragende inden for deres felt, så har de ikke en samfundsvidenskabelig baggrund, og er dermed ikke i samme grad som Torben M. Andersen, i stand til at vurdere effekten af den førte politik.

Både du og Steve Hanke har skrevet kritisk om nedlukninger. Er I ikke biased?

Bemærk først, at ingen af forfatterne har interessekonflikter (fx økonomiske). Studiet er lavet som en del af vores alm. arbejde.

Derudover ville være underligt, hvis forskere ikke kunne deltage i debatten på et område, de har forstand på. Har kritikerne af vores studie fx afholdt sig fra at deltage i debatten? Kan de – ud fra deres egne kriterier – komme med fuldstændig objektiv kritik?

Alle lider af biases. En måde at undgå biases på, er at lave sin research systematisk. Det er præcis det, vi har gjort. Hvis vi ønskede at være biased, kunne vi fx have valgt den kvadratiske model fra Chisadza et al. (2021) (Det er faktisk et kritikpunkt fra flere kritikere at vi ikke har valgt den kvadratiske model). Se her.

Hvorfor går I ud med studiet, før det er blevet peer reviewed (fagfællebedømt)?

Det kan tage lang tid før et studie bliver peer reviewed, og derfor er det meget almindeligt – i hvert fald indenfor samfundsvidenskaberne – at man udgiver sine resultater som arbejdspapirer. Det har også den fordel, at man kan få input fra andre forskere, som kan bidrage til at forbedre studiet. Desuden er studiet relevant for debatten, da mange i verden fortsat lever under COVID-19-restriktioner. Bemærk i øvrigt, at restriktionerne meget sjældent har været baseret på fagfællebedømte studier.

Det har under hele pandemien været normalt at offentliggøre resultater, inden de er blevet fagfællebedømt. Fx har SSI udgivet flere studier og analyser på deres egen hjemmeside eller på medrXiv, som ikke er fagfælledbedømt.

Hvorfor medtager I ikke “synthetic control”-studier?

I “synthetic control”-studier laver man en syntetisk kontrol som man sammenligner med virkeligheden. Fx laver Born et. al. (2021) en syntetisk kontrol for Sverige, som består af 30% Danmark, 25% Finland, 25% Holland og 15% Norge. Målet er, at den syntetiske kontrol så vidt muligt skal ligne Sverige før nedlukningen, og idéen er, at man så kan se, hvad der ville være sket, hvis Sverige havde lukket ned.

“Synthetic control”-studier er velegnede, når man har en lang dataserie at danne sin kontrolgruppe ud fra. Hvis man fx over 10 år kan se, at den syntetiske kontrol ligner Sverige i forhold til overdødelighed, så har man sandsynligvis fået dannet en rigtig god syntetisk kontrol.

Problemet med “synthetic control”-studierne i forhold til corona og nedlukningerne er, at der på ingen måde er tale om en lang dataserie. Born et al. danner fx deres kontrol på baggrund af sølle 13 dages data (“We require it to track the infection dynamics in Sweden during the first 13 days”). Professor Christian Bjørnskov har vist, at dette er stærkt problematisk, fordi den syntetiske kontrol ikke ligner Sverige, når man ser uden for disse 13 dage. Hverken før eller efter. I modsætning hertil bruger de andre difference-in-difference studier hele dataperioden til at danne deres kontrol ud fra, og de har således et langt større datagrundlag at basere kontrollen på.

I forhold til at analysere effekten af nedlukninger, er der altså et grundlæggende problem med “synthetic control”-studierne, fordi tidsperioden før nedlukningerne er kort. Og derfor valgte vi relativt tidligt at se bort fra dem.

Hvordan forklarer du, at lande som New Zealand og Australien har haft hårde nedlukninger og meget få COVID-19-døde?

Godt spørgsmål. Andre øer som Island, Japan, Sydkorea (de facto ø), Singapore og Taiwan havde også meget få dødsfald, på trods af at flere af dem havde meget milde nedlukninger. Der er muligvis et eller andet særligt ved øer, men der er altså ikke noget, der tyder på, at det skyldes hårde nedlukninger. Se også “Hvordan kan nedlukninger ikke være effektive, når vi kan se hvordan COVID-19 har ramt Sverige?” nedenfor.

Er ekstra dødsfald som følge af nedlukningerne regnet med?

Det korte svar er nej. Stort set alle studier, vi har fundet, kigger alene på effekten på COVID-19-døde. Og den er altså meget lille. Der er næppe tvivl om, at der er mange mennesker der har lidt under COVID-19. Der kan potentielt være mange sundhedsmæssige konsekvenser på samfundsplan som følge af selvmord, øget alkoholforbrug, sent eller uopdaget kræft osv. grundet COVID-19. Det er dog vigtigt at være opmærksom på, at dette sandsynligvis kun i mindre omfang skyldes nedlukningen. Det er for de fleste mennesker ikke nedlukningens skyld, at de ikke har set familier, venner og kollegaer. Det er noget, de selv valgte, fordi de var bange for virus. Det er netop derfor, vi peger på frivillige adfærdsændringer som en mulig forklaring på, at nedlukningerne ikke virkede.

Ét studie vægter meget højt og påvirker dermed resultaterne markant. Er det ikke et problem?

I vores tabel 3 har ét studie, Chisadza et al. (2021), en meget høj vægt i forhold til de øvrige studier. Det skyldes, at deres standardafvigelse (usikkerheden på deres estimat) er meget lav, og vægten beregnes som 1 over standardafvigelsen. Det påvirker selvfølgelig resultaterne. Problemet er, at der stadig er for få studier, der har undersøgt effekten af nedlukninger, og derfor kan ét studie få relativt høj vægt. Der er ikke noget, vi rent akademisk kan gøre ved det udover at vente på, at der kommer flere studier. Bemærk, at vi i fodnote 35 på s. 31 skriver “Excluding Chisadza et al. (2021) from the precision-weighted average changes the average to -3.5%”. Sættes vægten i stedet til 256 (som det næsthøjst vægtede studie), bliver estimatet -2.5%, som stadig er langt fra de tal som vi blev præsenteret for i starten af pandemien.

Hvordan kan nedlukninger ikke være effektive, når vi kan se hvordan COVID-19 har ramt Sverige?

Her er, hvad jeg skrev i Berlingske, om denne form for anekdotisk evidens: “Men lad os starte med det, vi kan kalde anekdotisk bevisførelse. I ved, beviser af typen »Så farlige er cigaretter heller ikke. Farfar røg som en skorsten, og han blev 98 år gammel!« En påstand, som intet beviser, fordi der kan være 100 atypiske grunde til, at farfar blev 98 år på trods af, at han røg.

Sverige blev verdenskendt som pandemiens enfant terrible, fordi myndighederne ikke lukkede økonomien hårdt ned. Og »Se Sverige!« blev hurtigt danskernes foretrukne farfar-anekdote. For Sverige havde i løbet af pandemiens to første år – før vaccinerne for alvor fik effekt – tre gange så mange covid-19-døde pr. 100.000 som Danmark.

Det så mange som bevis for, at rygning ikke er farligt. Hov! Jeg mener selvfølgelig som bevis for, at nedlukninger er effektive til at begrænse antallet af covid-19-døde. At Danmark i samme periode havde tre gange så mange dødsfald som Norge og Finland, der havde sammenlignelige – eller ligefrem mildere nedlukninger – glemte de. De studsede heller ikke over, at Danmark, Norge, Finland OG Sverige – på trods af at relativt milde nedlukninger – havde få covid-19-døde i et internationalt perspektiv.

Min pointe er ikke, at mine anekdoter modbeviser »Se Sverige!«-anekdoten. Min pointe er, at vi ikke kan sige noget meningsfyldt på baggrund af anekdoter. Vi må »stole på videnskaben!«, som man siger.

Er I ikke bare bagkloge?

Det handler ikke om at være bagklog, men om at evaluere den førte politik under COVID-19-pandemien. Desuden er det velkendt, at der var uenighed blandt myndighederne om, hvorvidt det var en god idé at lukke ned i første omgang i marts 2020. Blandt andet Brostrøm vidste på det tidspunkt, at nedlukninger var et problematisk redskab at bruge. Særligt under 2. nedlukning i december 2020, var der massere af evidens for, at nedlukningerne muligvis ikke var så effektive, som man gik og troede. Mit eget review (Herby 2020) viste, at frivillig adfærd var særdeles vigtigt, og både ECDC og UNICEF havde udgivet reviews, som viste, at effekten af skolelukninger var beskeden og tvivlsom.

5 thoughts on “FAQ og svar om “A Literature Review and Meta-Analysis of the Effects of Lockdowns on COVID-19 Mortality”

  1. Pingback: Alment farlige tanker 6, d. 14. januar – d. 3. februar 2022 - Thomas Aastrup RømerThomas Aastrup Rømer

  2. Pingback: Artigo que condena lockdowns não é da Universidade Johns Hopkins – Jornal Porto Alegre

  3. Thor Råbye Olesen

    Absurd indslag i Deadline 17. februar. Halvdelen af programmet afsat til undersøgelsen, men kun ganske få sekunder om undersøgelsens resultater. AAbsolut intet om forklaringer på resultaterne eller andet kvalitativt eller perspektiverende om nedlukninger. Absolut ingen interesse for, om der kunne være noget at tage ved lære af eller at evaluer på ift. håndtering af en pandemi. I stedet et kvarters mistænkeliggørelse af metode,og forssøg på diskvalificering af undersøgelsen. Inden Herby overhovedet blev introduceret og fik ordet, adskillige minutters statistikbelæring for at underminere forfatter og resultat. Og interview med Herby, som fra start var bragt helt i defensiv og udelukkende blev spurgt og kritiseret for metode. Et sjældent set eksempel på at gå efter manden i stedet for efter bolden. En fuldstændig vnvittig vinkel at skyde fra – fra det statslige TV. Hvorfor må nedlukningsregimet ikke komme til debat – men skal også lukkes ned??

    Svar
  4. Pingback: Nedlukninger: Vildledning af SSI og et kig tilbage på Jakob Kjellbergs fine fornemmelse for sne og adfærd - Punditokraterne

  5. Pingback: Kaum Menschenleben gerettet? Lockdown-Studie stößt bei Experten auf viel Kritik | NerdWelt.de

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.