dl002: coronadaten

dl002: coronadaten

Shownotes DL002: Coronadaten

Intro (00:00:00)

Thema des Podcasts und der Folge (00:00:18)

Willkommen zu unserer zweiten Folge beim datenleben-Podcast, dem Podcast über Data Science.
Wir möchten mit euch in die vielfältige Welt der Daten eintauchen.
Hier sind wieder Helena und Janine um den Daten nachzuspüren.

Frei nach unserem Motto ‘Kenne Dein Messverfahren’ geht es dieses Mal um das Thema Coronadaten.

  • Tagtäglich werden uns neue Zahlen, Daten und Fakten präseniert
  • Aber nicht immer hören wir auch, warum und was diese Zahlen wirklich aussagen sollen
  • Es geht um den R-Wert und was der R-Wert mit der Art zu testen zu tun hat
  • Wie Fallzahlen erhoben werden und ob sie etwas darüber sagen können, wie das Virus sich ausbreitet
  • Wie werden die Zahlen der Verstorbenen erhoben und welche Rolle spielt die Übersterblichkeit?

Warum das Thema Coronadaten? (00:01:20)

  • Aktuell viel Relevanz für unser Leben, auch in Diskussionen mit Freunden und Familie
  • Wir werden mit vielen Daten und Zahlen konfrontiert, die uns auch verunsichern können, weil sie oft auch verkürzt dargestellt werden
  • Wir möchten explizit darauf hinweisen, dass wir natürlich weder Epidemologen noch Virologen sind
  • Daher werden wir keine Empfehlungen aussprechen, es geht darum zu zeigen, wie die Daten interpretiert oder auch fehlinterpretiert werden können
  • Damit jeder in der Lage ist, diese Daten für sich besser nachzuvollziehen

Einstieg: Warum ist März schon 3 Jahre her? (00:02:20)

  • Kein Zeitgefühl mehr in der Krise, daher ein paar Randdaten
  • Am 27.01.2020 gab es den ersten Fall von Covid-19 in Deutschland
  • Die ersten Fälle waren punktuell und nachvollziehbar
  • Am 26. Februar wurde die erste Folge vom Coronavirus Update mit Christian Drosten veröffentlicht
  • Kurz darauf, Ende Februar, wurde der Kreis Heinsberg zum ersten großen Ausbruch Deutschlands, bei dem nicht mehr die Infektionsketten nachvollzogen werden konnten
  • Hier wurde später dann die Heinsberg-Studie durchgeführt
  • Am 11. März gab die Weltgesundheitsorganisation (WHO) bekannt, dass sie Covid-19 offiziell als Pandemie einstufen
  • Mitte März traten flächendeckend die ersten Gesetze und Verordnungen in Kraft, die aufgrund der Pandemie beschlossen und erlassen wurden
  • Tagesschau kannte kein anderes Thema mehr als Covid-19
  • Je präsenter die Pandemie in Deutschland wurde, desto wichtiger wurde es für alle, auf dem Neuesten Stand zu sein
  • Menschen haben täglich die Zahlen abgerufen, es wurden interaktive Karten geteilt, es gab Talkshows, Nachrichtensendungen, Experteninterviews
  • Nicht selten gab es auch schwer nachvollziehbare oder widersprüchliche Informationen zu Gefahren und Maßnahmen
  • Immer aktuelle Zahlen, erwecken Erwartungen und sollen Vertrauen und Aktualität suggerieren
  • Aber warum das so nicht funktionieren kann, darüber reden wir heute
  • Denn Zahlen ohne Kontext, richten oft mehr Schaden an, als zu helfen

Der R-Wert, die Reproduktionszahl (00:05:33)

  • der R-Wert ist bekannteste Wert, der uns täglich berichtet wird
  • Die Reproduktionszahl gibt an, wie viele Personen ein infizierter Mensch ansteckt
  • Ausbruchsgeschehen wie in Wohnanlagen oder Fleischbetrieben, können diesen Wert drastisch ändern
  • Siehe hierzu auch den tägliche Lagebericht des RKI vom 23. Juni
  • Ohne, dass das gesamtgesellschaftlich eine Rolle spielt
  • Bleibt der Wert unter 1, wird die Pandemie langfristig abklingen
  • Am 26.06. lag der sensible R-Wert bei 0,83, bzw. der 7-Tage—R—Wert bei 0,67

R-Wert Definition (00:06:33)

  • Quelle zur R-Ẁert-Definition: Robert Koch-Institut: Antworten auf häufig gestellte Fragen zum Coronavirus SARS-CoV-2 / Krankheit COVID-19
  • “Die Reproduktionszahl, beschreibt, wie viele Menschen eine infizierte Person im Mittel ansteckt”
  • Am Anfang einer Pandemie ist die gesamte Bevölkerung für das Virus empfänglich
  • Es gibt keine Immunität, keinen Impfstoff und keinerlei Maßnahmen zum Schutz vor Infektionen
  • Der Startwert heißt R0, das ist die Basisreproduktionszahl; laut RKI liegt R0 bei SARS-CoV-2 zwischen 2,4 und 3,3
  • Jeder Infizierte steckt durchschnittlich etwas mehr als 2 bis etwas mehr als 3 Personen an
  • Ohne Maßnahmen gibt es einen exponentiellen Anstieg der Infiziertenzahlen, bis bis zu 70% der Bevölkerung infiziert sind
  • Infektionsschutzmaßnahmen verringern die Verbreitung, um das abzubilden gibt es die zeitabhängige Reproduktionszahl R(t)
  • Wenn R größer 1 ist, steigt die Anzahl täglicher Neuinfektionen
  • Wenn R gleich 1 ist, dann gibt es eine konstante Anzahl täglicher Neuinfektionen
  • Wenn R kleiner 1 ist, dann sinkt die Anzahl täglicher Neuinfektionen
  • Daraus ergibt sich, wie aktiv das Virus ist und welche Maßnahmen gerade vermutlich notwendig sind
  • Das RKI bestimmt den R-Wert anhand der Daten, die zu bestätigten Fällen von Gesundheitsämtern übermittelt werden
  • Es gibt allerdings einen Meldeverzug bei der Datenübermittlung, daher muss man das statistische Verfahren Nowcasting anwenden
  • Seit dem 14.05.2020 bildet das RKI im Situationsbericht zwei verschiedene R-Werte ab
  • Der sensitive R-Wert reagiert sehr empfindlich auf schnellen Sprünge in den Fallzahlen, zum Beispiel durch einzelne Ausbruchsgeschehen.
  • Das führt besonders bei niedrigen Anzahlen von Neuerkrankungen zu verhältnismäßig großen Schwankungen
  • Der stabilere 7-Tage-R-Wert, wird über einen längeren Zeitraum berechnet
  • Das gleicht Wochentagseffekte aus, die bei der Meldung von Neuerkrankungen auftreten
  • Auch das RKI sagt, der R-Wert kann nicht allein als Maß für Wirksamkeit/Notwendingkeit von Maßnahmen herangezogen werden
  • Absolute Zahl der Neuinfektionen muss ebenfalls niedrig sein, um effektiv Kontaktpersonen ermitteln zu können

Warum der R-Wert problematisch ist (00:11:20)

  • Daraus sieht man schon verschiedene Probleme:
  • Nowcasting, als statistische Methode, muss nicht exakt sein, Abweichungen zu den tatsächlichen Zahlen sind möglich
  • lokale Ausbrüche haben einen großen Effekt auf diese Zahl, wenn die Gesamtinfektionen niedrig sind
  • Deswegen ist die Gesamtzahl auch wichtig
  • Mitte Juni haben wir das in einem groqen Fleischereibetrieb erlebt, das hatte keinen Effekt auf Deutschland insgesamt, sondern auf Maßnahmen vor Ort
  • Daher ist auch der 7-Tage-R-Wert sinnvoll für den Gesamttrend
  • Ein weiteres Problem ist, dass die Zahl sich vor allem auf die Vergangenheit bezieht, diese aber eventuell nicht vollständig ist, weil Daten fehlen
  • Analyse des Helmholtz Zentrums für Infektonsforschung in Braunschweig zeigt, dass sich der R-Wert für die Vergangenheit ändert
  • Wir können immer nur in Bezug auf das Handeln, was wir jetzt wissen
  • Als zu Beginn der Anstieg noch exponentiell war, hat man Maßnahmen ergriffen, die vielleicht zu intensiv war, stattdessen hätte man Masken tragen sollen
  • Dass kann man aber erst hinterher sagen, weil jetzt eine Studie für Jena zeigt, die früher Masken eingeführt haben, wie der Effekt dieser Maßnahme war
  • Andere Untersuchungen sagen ja auch, dass das Virus früher in Europa aktiv war, ohne, dass man es wusste, aber auch das weiß man erst hinterher
  • Diskrepanz zwischen dem eigenen Wohnort (einzelne Fälle in einer Stadt), während in Deutschland die Fallzahlen insgesamt schnell anstiegen
  • War sehr sinnvoll so früh Maßnahmen zu ergreifen, auch wenn die Zahlen vielleicht noch nicht so dramatisch waren, wie anderswo
  • Fazit: Unser Wissen über die Vergangenheit ändert sich. Wir können nicht im Nachhinein sagen: wir hätten damals schon wissen müssen, dass xy

Infektionszahlen und wie getestet wird (00:17:39)

  • Gerade in der Anfangsphase wurden wir ja mit absoluten Infektionszahlen konfrontiert
  • Es wird berichtet die Infektionszahl ist gesunken – was richtig, aber irreführend sein kann -> Wochentagseffekte
  • Man muss wissen bei den reinen Infiziertenzahlen wissen, wie konkret getestet wird und diese Zahlen zu Stande kommen
  • Beispiel: Am 11.06.2020 titelte die Tagesschau (im Newsticker) “Schweden verzeichnet Rekordanstieg bei Neuinfektionen”
  • Schweden hat zuvor wenig getestet und angefangen das auszuweiten
  • Daher gibt es vermutlich keinen Anstieg an Neuinfektionen, sondern nur an entdeckten Infektionen
  • Gutes Beispiel dafür, dass es wichtig ist, zu wissen, wie viel getestet wird
  • In Deutschland wurde verhältnismäßig viel getestet, die absoluten Zahlen lassen sich daher mit denen anderer Länder nicht vergleichen
  • Verändert man die Anzahl der Tests, verändert sich zugleich “künstlich” die Anzahl der Infiziertenzahlen
  • Das kann man auch politisch einsetzen: Länder, die wenig testen, wirken nach außen, als wäre Covid-19 kein Problem
  • Auffällig wirkte hier zum Beispiel Russland zu einem bestimmten Zeitpunkt am Beginn der Ausbreitung in Europa
  • Länder, deren Einwohner weniger reisen, sind später betroffen
  • Wann wird denn getestet und wann werden sie ausgewertet? (Schichtbetrieb, Wochendendbetrieb)
  • Schwankungen durch Arbeitstage und Wochenenden
  • Wird bei der Meldung gesagt, wann die Infektion passiert?
  • Covid-19-Dashboard zeigte deutlich einen Wochentagseffekt, weswegen auch nachgebessert wurde: Nachträgliche Meldungen wurden farblich markiert
  • Artikel von 538 diskutiert anschaulich das Thema der Infektionszahlen und des R-Wertes
  • Vier ausgedachte Nationen wurden beschrieben, wie sie mit Tests umgegangen sind und sich das ausgewirkt hat auf die Werte
  • Ergebnis ist zum Beispiel, dass ein Land, dass wenig testet könnte entweder versucht sein Maßnahmen zu früh zu beenden oder zu spät einzuführen
  • Was zu schlimmeren Auswirkungen auf die Bevölkerung führen kann
  • Sie stellen dar, welche Diskrepanzen zwischen dem tatsächlichen R-Ẁert der Bevölkerung und dem druch Tests ermittelten R-Wert auftreten können
  • Fazit: Das Messverfahren ist entscheidend. Die selben Infiziertenzahlen haben verschiedene Bedeutung, je nachdem ob viel getestet wird, oder nur bestimmte Gruppen

Wie werden die Zahlen der Verstorbenen erfasst? (00:25:03)

  • Es gibt viele Faktoren, die eine genaue Erhebung der Daten erschweren, es sind immer nur Trends
  • Woher sollen wir wissen, wie verbreitet das Virus wirklich war oder ist?
  • Eventuell hilft ein Blick auf die verzeichneten Tode, wovon ausgehend man vielleicht abschätzen kann, wie viele infiziert gewesen sein müssten
  • Aber ist das wirklich eine genauere Schätzung?
  • Ein Problem: Länder erfassen unterschiedlich die Todesursache
  • z.B. unterscheiden manche – und manche nicht – zwischen “durch” oder “mit” Covid-19 verstorben
  • Das ist auch medizinisch keine einfache Frage
  • Wenn wir den Wert der Verstorbenen als Basis nehmen wollen, um auf Infiziertenzahlen hochzurechnen, muss man auch viele weitere Effekte beachten
  • Wie gut ist z.B. das Gesundheitssystem aufgestellt?
  • Wenn es nicht überlastet ist, wird der Faktor zwischen Verstorbenen und Gesamtinfizierten ein anderer sein, als wenn es überlastet wäre
  • Die Zahlen aus Norditalien würden für Deutschland als Berechnungsbases daher nicht passen
  • So etwas wurde dann zum Beispiel mit der Heinsberg-Studie für Deutschland versucht, aber das Rauschen der Werte ist ziemlich groß
  • Die Ausgangszahl war zu gering, um sie auf ganz Deutschland zu beziehen, daher anfällig für Rauschen
  • Beispiel Quantenphysik: “shot noise”; wenn ein Lichtteilchen auf einen Filmsensor trifft, ist es sehr zufällig, wann die ankommen
  • Misst man dann lichtschwache Sachen, wie Sterne, kann das Rauschen durch das nicht konstante Auftreffen die Ergebnisse überlagern
  • Das gleiche passiert hier bei den Fallzahlen von Covid-19 auch
  • Zum Thema verzerrte Statistiken haben wir uns einen Artikel von 538 zum Thema Ungezählte Tote angesehen
  • Auf Totenscheinen gibt es meist mehrere Zeilen auf denen verschiedene wahrscheinliche Todesursachen eingetragen werden können
  • Dies erschwert es dann, dass die Todesursache eindeutig einem statistisch erfassbaren Wert zugeschrieben werden kann
  • In den USA gibt es in verschiedenen Counties abweichende Regeln
  • Zum Beispiel ist nicht überall bei Verstorbenen ein Test auf Covid-19 vorgeschrieben, d.h. jemand fällt aus der Statistik, wenn er erkrankt war
  • Das erschwert die Vergleichbarkeit, allein deswegen kann man von den Todeszahlen nicht auf die Gesamtverbreitung hochrechnen
  • Länder erfassen über ihre Bevölkerung verschiedene Statistiken, u.a. Todesursachen
  • Vom Erstellen eines Totenscheins bis zur Erfassung in der Statistik dauert es bis zu zwei Jahre
  • Auch das zeigt: Man kann die aktuelle Situation nur schätzen
  • Meldeverzüge, Korrekturen, finale Ergebnisse brauchen Zeit
  • Ist aber auch in der Natur der Sache, wir müssen mit unvollständigen Daten jetzt leben und Entscheidungen treffen
  • Aber wir müssen auch wissen, dass sich die Daten nochmal ändern werden über das, was aktuell passiert

Warum und wie wird die Übersterblichkeit erfasst? (00:33:14)

  • Wir hatten schon den R-Wert, die Fallzahlen und die Zahlen der Verstorbenen; alle scheinen zu ungenau zu sein
  • Aber genau deswegen gibt es diese verschiedenen Werte, die zusammengenommen besser einen Trend abbilden können
  • Ein weiterer Ansatz ist das Betrachten der Übersterblichkeit
  • Übersterblichkeit beschreibt ein vermehrtes aufkommen von Todesfällen einer bestimmten Gruppe oder der Gesamtbevölkerung innerhalb eines bestimmten Zeitraumes
  • Immer verglichen mit den Zahlen der Vorjahre für den gleichen Zeitraum und die gleiche Gruppe oder der Gesamtbevölkerung
  • Es ist eine statistische Modellrechnung
  • Beispiel Todesfälle durch Influenza beim RKI
  • Es ist ein Schätzergebnis, das auf historischen Daten beruht
  • Man zieht von der Zahl aller Todesfälle während einer Influenzawelle die Zahl von Todesfällen ab, die vermutlich ohne Influenza aufgetreten wäre
  • Die Differenz stellt dann die Übersterblichkeit (Exzess-Mortalität) dar
  • Grund: Nicht alle Todesfälle während einer Influenzawelle wird auch Viren untersucht
  • Oft folgt auf die Influenzaerkrankung eine Lungenentzündung, das Virus ist nicht mehr nachweisbar, die Todesursache ist eine bakterielle Lungenentzündung
  • Daher wird die Influenza praktisch nie auf dem Totenschein als Todesursache erfasst
  • Gibt es hierzu denn jetzt bereits Aussagen, was das Coronavirus angeht? Welche Zahlen liegen hier vor?
  • Eine bekannte Webseite ist euromomo.eu, zeichnet Übersterblichkeit einiger europäischer Länder auf
  • Für April in Deutschland ist ein deutlicher Anstieg der Sterbefallzahlen gegenüber den Vorjahren erkennbar
  • Im Mai bereits nicht mehr, deutet darauf hin, dass die ganzen Maßnahmen funktioniert haben
  • In Großbritannien ist ebenfalls die Übersterblichkeit deutlich sichtbar geworden: Office for National Statistics: Deaths registered weekly in England and Wales, provisional: week ending 5 June 2020
  • Problem: Man braucht eine Baseline, wie viele Menschen üblicherweise in den Monaten, die man sich ansieht, sterben
  • Maßnahmen können aber auch anders auf die Zahlen von Todesfällen wirken
  • Social Distancing könnte vielleicht die Suizidrate bei Menschen mit psychischen Erkrankungen erhöhen
  • Kontrolltermine bei Ärzten oder geplante Operationen im Krankenhaus wurden verschoben
  • Das waren Effekte, die die Übersterblichkeit eventuell erhöhen, es gibt aber auch gegenteilige Effekte
  • Berufsverkehr ist ab Mitte März zum erliegen gekommen, freie Autobahnen, Verkehrsunfallzahlen also eventuell zurückgegangen
  • Freizeitaktivitäten sind ausgefallen, die vielleicht risikobehaftet sind
  • Natürlich passieren aber anekdotischerweise die meisten Unfälle im Haushalt, vielleicht hat das Zu-Hause-Bleiben also auch einen Effekt

Fazit (00:40:26)

  • “Flatten the Curve” war nicht nur deswegen sinnvoll, weil weniger Menschen erkranken und an Covid-19 versterben
  • Sondern weil gerade am Anfang die Informationslage sehr dünn war, jetzt wissen wir als Gesellschaft schon deutlich mehr
  • Auswirkungen der Krankheit, welche Effekte auftreten, was hilft, wie Ansteckung passiert
  • Dafür war es nötig die Zeit zu gewinnen, indem die Pandemie abgeschwächt/verlangsamt wurde
  • So hatten wir in Deutschland das Glück nicht so hart getroffen zu werden
  • Wie anfangs gesagt, haben wir uns für dieses Thema entschieden, weil erlebt haben, dass diese vielen Zahlen und Darstellungen auch verunsichern können
  • Daten als Produzent von Unsicherheit: In den Nachrichten werden wir mit immer aktuellen Daten und Fakten zur weltweiten und hiesigen Situation versorgt
  • Dass dieser Dauerstrom an immer neuen Zahlen und Beschreibungen auch verunsichern kann, und speziell auch Nachrichten Ängste schüren können, ist dabei nicht neu
  • Speziell zur Corona-Pandemie hat die Deutsche Angst-Hilfe einen Angstfrei-News gestartet
  • Über die genaueren Absichten hat sich Christian Zottl beim Deutschlandfunk Nova Podcast Eine Stunde > Was mit Medien (Minute 02:10-12:30) geäußert
  • Er wies unter anderem darauf hin, dass es bei ihrem Angebot vor allem darum geht ausgewogen und ohne Dramatisierung der Sachlage zu berichten
  • Ursprünglich für Menschen mit einer Angsterkrankung gedacht, wird das Angebot auch immer mehr von allen möglichen Menschen genutzt
  • Bedarf nach sensitiv kuratierten Nachrichten scheint offensichtlich gestiegen
  • Daten als Produzent von Sicherheit: Gut gemachte Informationen und Nachrichten können aber auch genau das Gegenteil bewirken
  • Warum? Weil sie das nicht greifbare beschreiben und erfassbar machen können
  • Es ist eine Frage des Umgangs und eben des Kontextes: Kenne Dein Messverfahren!
  • Wir hoffen, dass wir mit einer genaueren Betrachtung der Verbundenen Problematiken zeigen konnten, dass diese Daten zwar wichtig sind, aber sie auch immer nur einen Trend abbilden
  • Man sollte sich nicht zu sehr von den Werten vereinnahmen lassen und nicht jeden Tag gucken, wie es jetzt steht, sondern auf die Gesamtsituation blicken

Nächstes Thema: Unfallstatistik am 15.08.2020 (00:45:25)

  • Wir hatten ja beim Thema Übersterblichkeit schon die Frage ob weniger Verkehrsunfälle zu geringerer Übersterblichkeit führen können
  • Ausserdem betrachten wir Verkehrsteilnehmer (z.B. Altersgruppen) und welche Effekte nicht sonderlich gut dargestellt werden

Call to Action (00:46:10)

  • Wenn ihr uns weiter hören möchtet:
  • Twitter unter https://twitter.com/datenleben
  • Webseite: https://www.datenleben.de/
  • Schreibt uns Feedback, Fragen oder Themenvorschlägen!

Schlagworte zur Folge

Corona, Coronavirus, Covid-19, Reproduktionszahl, Infektionszahlen, Übersterblichkeit

Quellen

Weiterführende Links


Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.