Vi har haft en række mærkelige forhold i vores tilbagevendende serie om Sjov med Statistik, men vist aldrig dyr. Det råder vi bod på i dag med en kort post om sammenhængen mellem folks subjektive tilfredshed (deres ’lykke’) og omfanget af landets svineproduktion. Sammenhængen på tværs af verden i 2018 kan ses i nedenstående figur, hvor vi som sædvanligt skiller de tidligere kommunistiske lande (de røde markører) ud fra resten (de blå markører).
Mens der reelt ingen sammenhæng er mellem svineproduktion og lykke i tidligere kommunistiske lande (korrelationen er 0,13), findes der en relativt klar og synlig positiv sammenhæng mellem svin og lykke på tværs af resten af verden (en korrelation på 0,48). Ser man på dagens første figur, indikerer den at svineproduktion – eller noget forbundet med den – er en nødvendig, men ikke tilstrækkeligt betingelse for en lykkelig befolkning. Denne slags fortolkning kommer fra det synlige faktum, at mens der er lande med utilfredse befolkninger og relativt stor svineproduktion, er der ingen eksempler på lande med meget tilfredse befolkninger uden en betragtelig svineproduktion.
Selvfølgelig er pointen i dag, af gris gør ikke glad: Der er i virkeligheden ingen sammenhæng mellem svineproduktion og lykke. Det vi i stedet har, er et meget klart eksempel på såkaldt ’omitted variable bias’ (OVB). OVB er præcist situationen, hvor man får en tilfældig sammenhæng mellem to forhold, fordi man glemmer (eller bevidst lader være med) at korrigere for en tredje faktor, som er den egentligt vigtige. Vi illustrerer dette i dagens anden figur, hvor vi helt simpelt laver det samme plot som i den første, men bryder den blå gruppe ned i fire grupper: Latinamerika og Caribien, Asien og Stillehavet, Afrika og Mellemøsten, og de vestlige lande.
Som figuren ganske klart illustrerer, forsvinder sammenhængen mellem svineproduktion og lykke, når man sammenligner lande internt i hver af de fem grupper lande. Det umiddelbare indtryk af en sammenhæng kommer fra, at de latinamerikanske og caribiske lande er en tand rigere end andre, og de vestlige lande er markant rigere end andre. Det er rigdommen, der rykker på lykken og ikke grisene. Og af rent historiske grunde er det primært i de vestlige lande, og i de lande, vestlige befolkninger udvandrede til, at man finder svineproduktionen. Den omittede variabel er derfor rigdom eller ’vestlighed’. Der er intet mærkeligt i det, men eksemplet er alligevel vigtigt at huske, fordi OVB-problemet ses så ofte i både dårlig videnskab og uærlig politik.