COVID-19: Grenzen der Vorhersagbarkeit

Update 10.10.2020: Bei der Betrachtung der Kalenderwochen hatte meine SQL Abfrage einen kleinen Fehler. Ich habe die Wochen mit einem Sonntag begonnen und bei Null angefangen zu zählen. Die 27. Kw war also in den Betrachtungen die 28. Kw. Aus Fehlern kann man lernen, und so hat dieser Fehler zu weiteren Einsichten geführt. Ich habe den Artikel korrigiert und die Betrachtungen ergänzt.

Es ist nicht  einfach, die Entwicklung der CoViD-19 Fallzahlen für DE vorherzusagen. Zum einen schwanken die Zahlen von Tag zu Tag stark, zum anderen sind sie vom Wochentag abhängig. Zum anderen sind sie vor bestimmten Ereignissen abhängig. So wurden in der Urlaubszeit mehr Menschen angesteckt, als danach. Im Herbst wird wieder mit der Zunahme der Infektionen gerechnet.

Überblick

Schauen wir zuerst in den Verlauf der Fallzahlen seit den ersten Fällen am 24.02.2020 in Deutschland.

Fallzahlen DE vom 24.02. bis 08.10.2020

Sonntag ist in der Regel der Tag mit den niedrigsten Meldungen/Erkrankungen (im Diagramm rot). Stabiler als die täglichen Werte sind Wochenwerte oder gleitende Mittelwerte.

Epidemiologischer Modelle wird ein annähernd exponentielles Wachstum zu Beginn einer Krankheitsausbreitung angenommen. Aufgrund der sehr kleinen Zahl Infizierter im Vergleich zur Bevölkerung (~0,4%) ist diese Annahme für Deutschland derzeit hinreichend genau.

Prognose A

Zuerst wollen wir die Hypothese des exponentielle Wachstums anhand der Anfangsphase prüfen. Dazu führen wir eine lineare Regressionsanalyse auf den Logarithmus der Fallzahlen des Zeitraumes 07. bis 27.03.2020 durch.  Das Ergebnis extrapolieren bis zum 03.04.2020, also eine Woche voraus.

Regressionsanalyse und Prognose A

Das Diagramm zeigt, dass die Fallzahlen innerhalb des 95%-Vertrauensintervalls [CI 95%] verlaufen, aber am 27.03. zur Seite ausbrechen. Die Ursache ist klar: Wir haben am 23.03. Maßnahmen ergriffen, die die Infektionen reduziert haben.  Bis zum 27.03. stimmt unsere Annahme des exponentielle Wachstums. Das lag zwischen 17% und 23%.

Prognose B

„COVID-19: Grenzen der Vorhersagbarkeit“ weiterlesen

Excel auf der command line in Datenbank importieren

Das Robert-Koch-Institut (RKI) stellt die kumulativen Corona-Fallzahlen in einer Excel-Tabelle bereit. Sonderlich schön ist die Tabelle nicht, aber sie liefert die Daten.

Auf dem Blatt „Fälle-Todesfälle-gesamt“ sind die Fälle und Todesfälle nach Tagen in Zeilen aufgeführt. Die anderen Blätter enthalten Daten der Bundesländer, die hier nicht interessieren.

Für eigene Auswertungen möchte ich die Tabelle herunterladen und in eine SQL-Datenbank (MariaDB) importieren. Die anschließende Auswertung erfolgt mittels R Script.

„Excel auf der command line in Datenbank importieren“ weiterlesen

Kerze ausblasen – mit und ohne Maske

Da oft behauptet wird, Masken würden gar nicht gegen COVID-19 helfen, hier ein kleines Video. Tatsächlich lässt sich eine Kerze mit Maske ausblasen. Allerdings muss die Distanz zwischen Maske und Kerze recht klein sein.

Nun darf sich jeder ausrechnen, wie weit Tröpfchen und Aerosole durch eine Maske geschleudert werden.

COVID-19: Steigt die Zahl der Infizierten wirklich?

Um die Antwort vorwegzunehmen: Ja!

Das RKI veröffentlicht die wöchentlichen Testungen und die positiven Ergebnisse zu SARS-CoV-2, COVID-19 oder Corona seit der 10. Kalenderwoche 2020. Die Zahlen habe ich in der unten abgebildete Tabelle zusammengetragen und um die von mir geschätzte Prävalenz (der Anteil der wirklich Infizierten unter den Getesteten) erweitert.

„COVID-19: Steigt die Zahl der Infizierten wirklich?“ weiterlesen

COVID-19

Das Sars-CoV-2 hält seit Wochen die Welt in Atem – und wird es noch eine Weile tun. In den letzten Tagen habe ich die Fallzahlen verfolgt. Die Gesamtstatistik für Deutschland führt das Robert-Koch-Institut (RKI). Dies Zahlen hinken allerdings stark hindert der Zeit her. Aus NRW wurden sie teilweise über mehrere Tage nicht aktualisiert. Auch fasst das RKI die Zahlen auf der Ebene Bundesland zusammen. Eine Statistik nach Städten und Kreisen gibt es nur bei den Ländern.

Die Daten der Bundesländer haben allerdings sehr unterschiedliche Qualität und Formate. Eine einheitliche Quelle habe ich bisher nicht gefunden. Deshalb habe ich ein paar Scripte geschrieben, die die Web-Seiten herunterladen und die Daten extrahieren.

Die Scripte habe ich auf / covid-19-data-collector veröffentlicht. Im dortigen Verzeichnis /data sind die gesammelten Daten als .CSV gespeichert.

  • Robert-Koch-Institut (RKI)
  • Bayern
    • Kreise (BYK)
    • Regierungsbezierke (BYR)
  • Hessen (HES)
  • Niedersachsen (NIE)
  • Nordrhein-Westfalen (NRW)
  • Südwesten (SW)
    • Baden-Würtemberg und
    • Rheinland-Pfalz

Weltweite Zusammenfassungen gibt es in GitHub: