Tag-arkiv: målefejl

Nye data og nye problemer

I nationaløkonomisk forskning, og ikke mindst i udviklingsøkonomi, er det vigtigt at have rimeligt præcise indkomstdata. Det var længe et problem, da både nationalregnskab – som primært blev opfundet som disciplin i 1930erne – og indkomstopgørelser er i sig selv svære at lave. Et af de særlige problemer var længe hvordan man håndterede de meget forskellige priser, der gjaldt i forskellige lande. Det problem blev afhjulpet – om end måske ikke løst – af the International Comparison Project (læs historien her og Tim Taylor om projektet her).

I en årrække har forskere derfor brugt enten forskellige versioner af nationalregnskabsdata i the Penn World Tables (PWT) eller fra Verdensbanken i deres forskning. Ingen har påstået, at de var perfekte, men de to datakilder giver typisk samme overordnede resultater. De to kilder er løbende blevet opdateret, og den seneste version af den oprindelige PWT endte med at hedde version 7.3,mens 7.1 har været brugt langt mest. Men mange har efterspurgt bedre og mere præcise data.

PWT 8.0 blev derfor introduceret med store fanfarer i 2013, da et nyt team havde ændret metodologien bag dataene; ændringerne blev endda skitseret af Robert Feenstra, Robert Inklaar og Marcel Timmer i American Economic Review. Hos forskere bredte usikkerheden sig dog, da de nye Penn-data ofte så ret anderledes ud og at flere kende episoder ikke var at finde der. Maxim Pinkovskiy og Xavier Sala-I-Martin viste således i en artikel (ungated her), at både Verdensbankens 2011-version og PWT 7.1 passer langt bedre på udvikling, når man f.eks. ser på langsigtede ændringer i lysintensitet om natten, som man ikke på samme måde kan manipulere eller på en måde fifle med. Noget var tydeligvis galt med PWT 8.0 og 8.1

I år er PWT 9.0 derfor udkommet med en implicit påstand om, at man har løst børnesygdommene i den nye metodologi i PWT. Hvad skal man så stole på og hvad kan man bruge? De interesserede læsere kan dømme for sig selv ved at tage et kig på de danske data. Alle tre serier fra PWT starter i 1950,7.1 ender i 2010 og 9.0 i 2014. PWT 9.0 er angivet i to versioner, da den nye metodologi betyder, at der er et BNP-tal beregnet ud fra forbrugssiden (’e’-serien, for expenditure) og et andet beregnet fra outputsiden (’o’-serien). Fra 1966 sammenligner jeg med de ligeledes købekraftskorrigerede tal fra Danmarks Statistik (DS), der – givet at Danmark har nogle af verdens absolut mest præcise nationalregnskabstal – burde kunne fungere som en slags ’mest præcist’ benchmark. Y-aksen på begge figurer er logaritmen til BNP per indbygger.

Og som man kan se i den første figur følger de fire serier hinanden fint på den meget lange bane: Den mindste korrelation mellem de fire er 0,96 (mellem PWT 9.0 ’o’ og DS). Men, som det er ekstra tydeligt i den anden figur, hvor jeg har stillet skarpt på den kortere periode mellem 1970 og 1995, er der store forskelle i kortsigtsdynamikken. Ser man på det årlige væksttal, følges PWT 7.1 og DS næsten perfekt ad (korrelationen er 0,98), men PWT 9.0 ser anderledes ud. Korrelationen mellem DS og PWT 9.0 ’e’ er således 0,08! De ser bedre ud med de outputbaserede tal, men en korrelation på 0,76 med DS og 0,84 med PWT 7.1 er ikke prangende, når de burde være beregnet fra samme base. Figuren afslører bl.a. at de nye tal viser en væsentligt større nedgang i de sidste år under Anker Jørgensen og en tydeligt svagere opgang efter Poul Schlüter tog over i 1982. Rykker man længere frem i historien, viser PWT 7.1 og DS-serierne også helt anderledes væksttal for Fogh/Løkke-regeringerne fra 2001-11. PWT 7.1 viser en gennemsnitlig årlig vækstrate på 0,25 % og DS på 0,43 %, mens de nye PWT-tal viser henholdsvis 1,52 og 2,23 %.

Et eller andet er tydeligvis galt i de nye tal. Nyt er ikke altid bedre, og foreløbig er man tvunget til at anbefale kolleger, studerende og andre interesserede ikke at bruge de nye serier, som ellers bliver solgt til verden som et stort målefremskridt. De ser bare ud til at give nye hovedpiner.