„Eine Studie hat ergeben“. Ein aktuelles Beispiel aus der großen weiten Welt der Instrumentalisierung von „Wissenschaft“

Man kennt das aus vielerlei Zusammenhängen: Wenn man einer Behauptung oder einer Forderung Gewicht verleihen will, dann greift man gerne zurück auf (angebliche) wissenschaftliche Befunde, man kleidet das dann in das immer noch viele beeindruckende Gewand der Wissenschaftlichkeit und damit einhergehend der mitlaufenden Botschaft, dass es sich um einen objektiven Tatbestand handelt, der da vorgetragen wird.

Nun werden wir alle in diesen ganz eigenen Zeiten der Corona-Pandemie ständig konfrontiert mit den Ergebnissen von Studien und dem, was Wissenschaft, in diesem Fall im Kernbereich vor allem die Virologie, so produziert. Dabei haben viele erfahren müssen, dass es eben nicht so einfach ist, dass „die“ Wissenschaft zu bestimmten Erkenntnissen und daraus abgeleiteten Maßnahmen kommt. Sondern dass auch (und gerade) empirisch arbeitende Wissenschaften in der Regel unterschiedliche, sich teilweise widersprechende Befunde zu Tage fördern. Im internen Wissenschaftsdiskurs ist das eigentlich eine Selbstverständlichkeit (auch wenn es hier immer wieder die Offenheit negierende Positionen von Platzhirschen und Apologeten von Schulen und „Lagern“ gibt, die oftmals einen großen Teil ihrer Energie in die Zerstörung des „Gegners“ oder abweichender Meinungen investieren), in der Öffentlichkeit und dabei gerade auch in den Medien sorgt das für Irritationen bis hin zu ausgeprägten Frustrationserfahrungen, da man eigentlich eine klare Ansage erwartet, ob und wann man wohin abbiegen soll.

Und in den zurückliegenden fast zwei Jahren des Ausnahmezustandes im Gefolge der Versuche, auf die Herausforderungen der Corona-Pandemie zu reagieren, hat sich eine Lagerbildung vor unseren Augen abgespielt, die anfangs vielleicht noch fast spielerisch angelegt war (beispielsweise die Zuordnung zum „Team Drosten“ versus dem „Team Streeck“), zwischenzeitlich aber teilweise mehr als beunruhigende grenzüberschreitende Ausformungen angenommen hat, bei dem man nicht nur eine fortschreitende Radikalisierung einer Minderheit von „Gegnern“, „Leugnern“ oder was auch immer beobachten muss, sondern man wird auch mit einer wuchtigen fundamentalen Infragestellung basaler wissenschaftlicher Standards konfrontiert, verbunden mit der Verbreitung wirklich nur noch als völlig abseitiger Positionen.

In dieser sowieso schon erheblich aufgeladenen Gemengelage kommen dann immer wieder auch Versuche aus allen möglichen Wissenschaftsdisziplinen, ebenfalls von dem Aufmerksamkeitsmoment rund um Corona zu profitieren und/oder eine konkrete politische Botschaft mit Hilfe des überaus geschmeidigen Deckmantels von „Wissenschaft“ voranzutreiben und im medialen Diskurs zu platzieren.

Auch und gerade Wirtschaftswissenschaftler sind Teil der ganz eigenen Industrie, die sich rund um das Thema Corona herausgebildet hat – angesichts der ökonomischen (und sozialen) Folgen der Corona-Pandemie und dabei vor allem der ergriffenen Maßnahmen zur Bekämpfung der Pandemie ist das auch mehr als verständlich. Dabei ging und geht es immer auch um die Rechtfertigung oder das Verwerfen bestimmter Eindämmungsmaßnahmen, man denke hier an die Lockdowns bzw. Shutdowns, die seit dem Frühjahr 2020 in mehr oder weniger starker Intensität praktiziert wurden und werden. Und die damit einhergehenden Auswirkungen und mit Blick darauf die Ausgestaltung von Rettungsprogrammen und -maßnahmen. Wir sehen ökonomische und soziale Folgen der Corona-Krise, die natürlich – und auch hier: selbstverständlich – kontrovers beforscht werden. Dagegen ist überhaupt nichts einzuwenden, ganz im Gegenteil kann man nur in einer auch harten Auseinandersetzung über die Daten und Forschungsergebnisse Licht in die Dunkelheit der „Ökonomie der Corona-Krise“ bringen. Aber man muss jedenfalls hinsichtlich der sich als wissenschaftlich ausweisenden Beiträge erwarten dürfen, dass die Mindeststandards wissenschaftlichen Arbeitens eingehalten werden, um zu verhindern, dass man lediglich unter dem Deckmantel einer angeblichen „Wissenschaftlichkeit“ agiert.

Eines der verständlicherweise am heftigsten und dabei auch überaus kontrovers diskutierten Themen ist die Sinnhaftigkeit der Lockdowns. Also des Herunterfahrens des gesellschaftlichen und von Teilen des wirtschaftlichen Lebens. Das waren (und sind) nicht nur ganz erhebliche Restriktionen für die Menschen allgemein, sondern zahlreiche Existenzen werden dadurch gefährdet oder sind bereits vernichtet worden. Dann muss eine solche Maßnahme besonders gut begründet sein (eine analoge Herausforderung haben wir beim Thema Impfpflicht und deren Legitimation oder eben Nicht-Rechtfertigung).

Nun erreichen uns solche Botschaften:

Von einer „weltweiten Rumms-Studie“ spricht die BILD-Zeitung in der ihr eigenen Zuspitzung: »Diese Studie könnte die Corona-Politik in Deutschland und weltweit auf den Kopf stellen!«, meint der Autor des Beitrags: »Die staatlich verhängten, knallharten Lockdowns in Europa und in den USA in der ersten Corona-Welle hatten quasi keinen Effekt auf die Anzahl der Corona-Toten.«

Damit bekommen wir ein Lehrbuchbeispiel für die absolut notwendige kritische Sensibilität gegenüber der gerne verbreiteten Botschaft „Eine Studie hat ergeben“ frei Haus geliefert:

Laut Ökonomen der Johns-Hopkins-Universität haben Lockdowns während der ersten Corona-Welle kaum Leben gerettet. Die Corona-Lockdowns in Europa und den USA haben die Todeszahlen „nur um 0,2 Prozent reduziert“. Lockdwons seien folglich aufgrund ihrer Nicht-Wirksamkeit abzulehnen.

Das war die – zumindest in vielen Online-Medien sofort kopierte und verbreitete – und von vielen Kritikern bzw. Gegnern der Anti-Corona-Politik wie Honig abgeschleckte Botschaft einer „einer Übersichtsstudie der Johns-Hopkins-Universität“. Das hört sich nun wirklich mehr als seriös an, nicht irgendeine unbedeutende Einrichtung oder gar eine möglicherweise irrlichternde Einzelperson hat hier etwas zu Tage gefördert, sondern Ökonomen der angesehenen Johns-Hopkins-Universität in den USA. Dann wird da schon was dran sein.

Und auch das Deckblatt der angesprochenen „Übersichtsstudie“ kommt mehr als seriös daher:

Hier für jeden, den das interessiert, das Original der Studie:

➔ Jonas Herby, Lars Jonung, and Steve H. Hanke (2022): A Literature Review and Meta-Analysis of the Effects of Lockdowns on COVID-19 Mortality. Studies in Applied Economics No. 200, The Johns Hopkins Institute for Applied Economics, Global Health, and the Study of Business Enterprise, January 2022

Die Übersichtsstudie behauptet, eine sogenannte Metaanalyse zu sein, also praktisch eine Auswertung mehrerer Studien zur gleichen Fragestellung. Schauen wir uns einmal genauer an, was die da gemacht haben. In der Zusammenfassung führen die Verfasser aus:

»Mit dieser systematischen Überprüfung und Meta-Analyse soll festgestellt werden, ob es empirische Belege für die Annahme gibt, dass „Lockdowns“ die COVID-19-Mortalität verringern. Lockdowns sind definiert als die Auferlegung von mindestens einer obligatorischen, nicht-pharmazeutischen Intervention (NPI). NPIs sind alle staatlichen Anordnungen, die die Möglichkeiten der Menschen direkt einschränken, wie z. B. Maßnahmen, die die Bewegungsfreiheit innerhalb des Landes einschränken, Schulen und Geschäfte schließen und internationale Reisen verbieten. In dieser Studie wurde ein systematisches Such- und Screeningverfahren angewandt, bei dem 18.590 Studien identifiziert wurden, die sich potenziell mit der gestellten Frage befassen könnten. Nach einem dreistufigen Screening kamen schließlich 34 Studien in Frage. Von diesen 34 in Frage kommenden Studien qualifizierten sich 24 für die Aufnahme in die Meta-Analyse. Sie wurden in drei Gruppen eingeteilt: Studien zum Lockdown Stringency Index, Studien zum Shelter-in-Place-Order (SIPO) und spezifische NPI-Studien. Die Analyse jeder dieser drei Gruppen stützt die Schlussfolgerung, dass Lockdowns wenig bis gar keine Auswirkungen auf die COVID-19-Mortalität haben. Die Studien zum Stringenzindex zeigen, dass die COVID-19-Sterblichkeit in Europa und den Vereinigten Staaten durch Lockdowns im Durchschnitt nur um 0,2 % gesenkt werden konnte. SIPOs waren ebenfalls unwirksam und verringerten die COVID-19-Sterblichkeit im Durchschnitt nur um 2,9 %. Spezifische NPI-Studien finden ebenfalls keine breit angelegten Belege für spürbare Auswirkungen auf die COVID-19-Mortalität.
Während diese Meta-Analyse zu dem Schluss kommt, dass Lockdowns wenig bis gar keine Auswirkungen auf die öffentliche Gesundheit haben, haben sie dort, wo sie eingeführt wurden, enorme wirtschaftliche und soziale Kosten verursacht. Infolgedessen sind Lockdowns unbegründet und sollten als pandemiepolitisches Instrument abgelehnt werden.«

Klare Ansage. Sollte man denken. Aber offensichtlich ist es gerade nicht so – und die zwischenzeitlich vorgetragene massive Kritik aus Wissenschaftlerkreise kann man bereits in Umrissen erahnen, wenn man sich das in der Zusammenfassung beschriebene methodische Vorgehen anschaut, dass die drei Autoren gewählt haben:

Die Forscher haben in einer Meta-Analyse 24 Studien anderer Forscher ausgewertet. Ausgehend von 18.590 Studien, aus denen sie 34 (!) ausgewählt haben und von denen wurden dann noch einmal zehn Studien in den Papierkorb geschmissen. Die dann auch zitierte Hauptbotschaft aus der Analyse dieser 24 Studien war, dass Lockdown-Maßnahmen lediglich eine Reduzierung der Covid-Todesrate um 0,2 bis 2,9 Prozent bewirkt haben (im Vergleich zu Ländern, wo die Regierungen lediglich mit Empfehlungen gearbeitet haben). Aber bereits innerhalb des arg geschrumpften Samples von nur noch 24 Studien gibt es erhebliche Variationen: »Die untersuchten Studien geben jedoch kein einheitliches Bild ab, ihre Ergebnisse variieren deutlich voneinander. Die Autoren führen etwa auch eine Untersuchung an, der zufolge Lockdowns die Todeszahlen um 35,3 Prozent gesenkt haben. Auch konkrete Einzelmaßnahmen wie die Schließung von Einzelhandel und Gastronomie oder Vorschriften zum Tragen von Masken hätten laut einzelnen Studien Todesraten spürbar senken können – um 10,6, bzw. 21,2 Prozent«, so Nils Metzger in seinem Artikel über die Studie. Metzger ergänzt: »All diese Zahlen basieren letztlich auf einer kleinen Zahl an Einzelstudien, deren Ergebnisse vom Forscherteam anschließend noch gewichtet wurden. Die Untersuchung wurde lediglich auf der Webseite des JHU-Instituts veröffentlicht, nicht in einem wissenschaftlichen Journal. Andere Forscher haben sie noch nicht begutachtet. Dennoch griffen zahlreiche Medien die Studie bereits auf.« Und er benennt weitere kritische Aspekte:

»Wie hart waren die jeweiligen Lockdown-Maßnahmen in Ländern weltweit? Die Studie nutzt dafür den Covid-Stringency-Index der Universität Oxford. Dieser ist vermutlich die weltweit umfassendste Datenbank für staatliche Corona-Maßnahmen, aber nicht ohne methodische Probleme. Immer wieder wurde Deutschland dort als Land mit den härtesten Maßnahmen geführt – obwohl andere Staaten deutlich restriktiver vorgingen. Das liegt daran, dass der Index schlecht dafür geeignet ist, regional unterschiedliche Maßnahmen abzubilden. Es wurden stets die jeweils härtesten Maßnahmen eingetragen, selbst, wenn sie nur ein einzelnes Bundesland betrafen. Das verzerrt die Daten und lässt die Maßnahmen drastischer erscheinen, als sie tatsächlich waren.« Und er fährt fort: »In ihrer Meta-Analyse betrachten die Autoren fast ausschließlich Daten zu Lockdowns während der ersten Welle im Frühjahr 2020. Zu diesem Zeitpunkt waren Regierungen mit einer unbekannten Krankheit konfrontiert. Selbst über simple Maßnahmen, wie das Tragen von Schutzmasken, herrschte teils noch Unklarheit. Harte Lockdown-Maßnahmen lassen sich so auch mit Vorsicht angesichts mangelnder Information erklären. Was etwa Lockdowns während der in Deutschland deutlich tödlicheren Winter-Welle 2020/2021 bewirkt haben, kann die Studie nicht sagen. Es ist also unklar, ob das weitreichende Urteil der Autoren angesichts begrenzter Daten angemessen ist.« „Begrenzte Daten“ – das ist noch wirklich sehr nett und wohlwollend formuliert.

Experten zerreißen das Papier in der Luft – so dieser Artikel mit einer wenigen netten Überschrift: Kritik an Lockdown-Studie: „Bachelor-Student wäre durchgefallen“. Auch hier wird eingangs auf die erhebliche Varianz der Ergebnisse schon in der sehr kleinen Teilgruppe der ausgewählten 24 Studien hingewiesen: »Wie die mittlerweile vielzitierten 0,2 Prozent als Hauptergebnis der Studie zustande kommen, ist schwer nachzuvollziehen. Denn nahezu alle untersuchten Studien kommen – sowohl bei einzelnen Maßnahmen als auch in der Zusammenschau – auf wesentlich höhere Effekte: Immer wieder sind Werte um die 30 Prozent aufgeführt, eine Arbeit der US-Gesundheitsbehörde sieht einen Effekt durch Ausgangsbeschränkungen von geschätzten 59,8 Prozent. Insgesamt ist die Bandbreite der aufgeführten Effekte riesig und bewegt sich zwischen den genannten 59,8 und 0 Prozent. In einem Fall ist der Effekt sogar negativ, nach dieser Arbeit haben Ausgangssperren zu einer um 1,0 Prozent höheren Sterberate geführt.«

„Einen viel größeren methodischen Quatsch kann man nicht machen“

Klare Worte von Andreas Peichl, Professor für Volkswirtschaftslehre an der LMU München. „Eine Bachelorarbeit hätte man mit der Studie nicht bestanden.“

»Die 24 ausgewerteten Studien haben die Autoren aus mehr als 18.000 Arbeiten ausgewählt. Anschließend wurden auch die 24 übrig gebliebenen Studien extrem unterschiedlich gewichtet. Manche gingen mit dem Faktor 169 in die Metaanalyse ein, andere mit dem Faktor drei. Hier seien die Einzelstudien besonders hoch gewichtet worden, die bei den Lockdown-Maßnahmen keinen Effekt fanden, sagt Peichl.« Und er ist nicht allein mit seiner vernichtenden Kritik an dem Vorgehen in der „Übersichtsstudie“: »Die Biostatistikerin Sabine Hoffmann … schlägt in die gleiche Kerbe. Hoffmann kritisiert vor allem, dass fast ausschließlich Studien ausgewählt wurden, die Berechnungen anstellen, die für Infektionskrankheiten nicht geeignet seien. So hätten die Autoren, um das exponentielle Wachstum einer Infektionskrankheit abzubilden, Modelle ausgesucht, die für die Modellierung von lineare Zusammenhängen vorgesehen sind – was zu völlig anderen Ergebnissen führt … Für die schwer nachvollziehbare Gewichtung der Arbeiten benutzen die Autoren laut Hoffmann „einen Trick“, der grundsätzlich die Studien mit der niedrigsten Varianz am höchsten bewertet.« Mit der Folge, dass automatisch die Arbeiten am höchsten gewichtet werden, deren Ergebnis am nächsten bei Null liegt. Wie praktisch, wenn man eine bestimmte Botschaft schon vorher im Kopf hatte. „Wenn Sie diese Gewichtung benutzen, dann bekommen die Studien, die keinen Effekt finden, ein teilweise 50 mal so großes Gewicht. Und die einen großen Effekt finden – also irgendetwas bei 40 Prozent – bekommen kein Gewicht mehr. Das ist nicht zulässig.“

»Auch der Leiter des Instituts für Versorgungsforschung und Klinische Epidemiologie an der Universität Marburg, Max Geraedts, wirft den Autoren … vor, mit einer „eklektischen Literaturzusammenstellung“ absichtlich versucht zu haben, die von Ihnen gewünschte Aussage zu belegen.«

Weitere kritische Aspekte: »Professor Andreas Schuppert von der RWTH Aachen zweifelt zudem an der Fragestellung der Studie. Diese bewertet den Nutzen der Lockdowns anhand der verhinderten Todesfälle. Das sei aber in den meisten Fällen gar nicht das zentrale Ziel der Lockdowns gewesen, sagt der Arbeitsgruppenleiter am Institut für computergestützte Biomedizin im Interview mit dem Bayerischen Rundfunk. „Die meisten Lockdowns waren ja geschaltet worden, um eine Überlastung des Gesundheitssystems zu vermeiden.“ Insofern sei die Frage, wie sinnvoll es ist, die Effizienz eines Lockdowns an der Sterberate zu messen … Von den 18.000 zunächst gesammelten Studien seien viele rausgefallen, weil sie eben nicht die Mortalität betrachten würden, sondern zum Beispiel, ob sie die Infektionswelle gebremst haben oder eine Überlastung des Gesundheitssystems verhindert haben.« Zusammengefasst bleiben also viele Studien, die die Effizienz eines Lockdowns vielleicht sogar besser messen würden, wegen der Fragestellung der Autoren außen vor.

Man kann die Aufzählung der kritischen Stimmen durchaus beenden – es reicht offensichtlich. So bleibt am Ende noch der notwendige Blick auf diejenigen, die das in die Welt gesetzt haben. Dazu zitiere ich aus dem Beitrag von Nils Metzger: »Hauptautor Steve Hanke ist … kein unbekannter Wissenschaftler. Der Ökonom mit fast 400.000 Followern auf Twitter äußert sich regelmäßig meinungsstark zu Corona-Maßnahmen. Dabei vertritt er libertäre Positionen. Italiens Corona-Maßnahmen bezeichnete er jüngst als „faschistisch“. Die neue Studie bewarb er auf Twitter mit dem Satz „Lockdowns sind was für Verlierer“. Als Projektleiter beim libertären US-Thinktank Cato Institute setzt er sich gegen staatliche Interventionen in Wirtschaft und Gesellschaft ein. Als Regierungsberater macht er sich seit Jahrzehnten weltweit für die Privatisierung öffentlicher Ressourcen und Dienstleistungen stark.«