4-Felder-Tafel

Untertestung

Das RKI veröffentlicht regelmäßig die Testungen und Positivrate der PCR-Test-Ergebnisse der Labore. Regelmäßig taucht dann die Frage der Untertestung der Kinder bei Twitter oder Facebook auf. Je nach Meinung wird eine Unter- oder Übertestung diagnostiziert. Letztere ist eher selten ist, es wird nur die Untertestung abgestritten.

Stellt sich die Frage: Was ist Untertestung?

Wer hat nun Recht? Die Verfechter der Untertestung oder die anderen. Dazu müssten wir wissen, was der eine oder andere unter  „Untertestung“ versteht. Irgendwo wird es doch definiert sein, wenn viele drüber reden.

Also ziehe ich – wie immer – das Internet mit der Hilfe von Google zu Rate. Es findet sich wenig wissenschaftlich Verwertbares zu diesem Bgriff. Eine Suche nach „+Untertestung“ ergibt gerade mal 1130 Treffer. Verfeinerte Suchen deuten darauf hin, dass dieser Begriff hauptsächlich bei Twitter und Facebook versendet wird.

Ich habe zwei Artikel herausgepickt, die etwas verdeutlichen, worum es geht.

Süddeutsche Zeitung vom 22.11.2020

… wurden Daten von mehr als 110 000 Kindern und Jugendlichen ausgewertet, die … sich einem Corona-Test unterzogen hatten. Nur 0,53 Prozent dieser Tests fielen positiv aus. Einen Unterschied in der Positivenrate von Kindern über 12 Jahre und jüngeren fanden die Kliniken nicht.

„Dass es eine hohe Dunkelziffer unter Kindern und Jugendlichen gibt, ist damit sehr unwahrscheinlich“, sagt Johannes Hübner,[..], „unserer Meinung nach sollte man die Schulen offen lassen.“ Für Peter Walger [..] ist das Ergebnis der Erhebung „ein ganz dicker Stein im Mosaik: Es gibt keine relevante Untertestung bei Kindern, die uns jetzt noch irgendwelche Geheimnisse offenbart“.

Drei Tage vorher ist im Tagesspiegel zu lesen:

Das Problem heißt „Untertestung“

… Das Problem heißt „Untertestung“: Ältere Teenager und Erwachsene entwickeln nach einer Covid-19-Infektion hinreichend auffällige Symptome, so dass sie sich vergleichsweise häufig testen lassen.

Dass dem so ist, belegt eine Antikörper-Studie an Kindern in München, bei denen sechsmal mehr Coronainfektionen festgestellt wurden, als per PCR-Test diagnostiziert wurden. Erst wenn die unerkannt infizierten Kinder ältere Menschen, etwa die Eltern selbst, anstecken, gehen diese zum Testen und tauchen bei Positivtestung in den Statistiken auf.

Unterschiedliche Studien oder Erfassungen mit unterschiedlicher Interpretation.

Wir sehen, die Annahme, dass Kinder zu selten getestet werden, beruht auf folgender, qualitativer Argumentationskette: Weil infizierte Kinder häufig keine Symptome entwickeln, werden womöglich zu selten getestet. Kurz: Wenig Wissen, aber viel Meinung.

Für mich klingt der Begriff „Untertestung“ nach zu wenig testen. Würde der Begriff „Untererfassung“ verwendet, wäre die Sache klar. Würden wir mehr testen, würden wir auch mehr erfassen. Doch gibt es wirklich eine hohe Dunkelziffer? Testen wir Kinder und Jugendliche zu wenig?

Wie immer gibt es – je nach Interessenlage – eine mehr oder weniger hohe Dunkelziffer, die natürlich nur vermutet werden kann, sonst läge sie nicht im Dunkel. Wenn das Problem zu klein ist, muss die Dunkelziffer eben erhöht werden.

Was aber klar wird: Wenn Kinder – gefühlt – zu wenig getestet werden, sprechen viele von Untertestung, nicht von Untererfassung.  Es gibt eine hohe Dunkelziffer ist etwas anderes, als „Untertestung“.

Nur lässt es sich mit den Zahlen der Testungen untermauern, dass Kinder zu wenig getestet werden? Und ist dies absolut oder relativ zu einer anderen Größe zu sehen?

Welche statistischen Größen gibt es, die Frage der Unter- oder Übertestung von bestimmten Gruppen zu messen? Die Frage stellt sich nur, wenn nicht alle getestet werden können. Als erstes sind daher die Anzahl der Testungen, sowie der positiven oder negativen Ergebnisse zu betrachten. Natürlich spielt Größe der Population eine Rolle, aus der die zu Testenden ausgewählt werden. Und es spielt auch eine Rolle, wie die Testungen auf die einzelnen Gruppen verteilt sind.

Nur zur Klarstellung: Es geht nicht darum, ob irgendeine Gruppe Treiber der Infektionen ist. Es geht um die Frage, ob die verschiedenen Gruppen zu viel, zu wenig oder ausreichend getestet werden.

Schauen wir uns die folgende Tabelle aus dem wöchentlichen Situationsbericht des RKI „Laborbasierte Surveillance SARS-CoV-2“ an:

Getestete Personen nach Altersband
Getestete Personen nach Altersband

Die linke Spalte gibt das Altersband an. Die zweite Spalte die Population in DE des Altersband zum 31.12.2019. Darauf folgen die Spalten Anzahl der Personen (Nicht Testungen) und positive Ergebnisse aus der Tabelle 4 der kumulierten Personen der Wochen 42 bis 53. Zu beachten ist, dass die Testkriterien in der 46. Kw geändert wurden und Daten nicht direkt mit den Vorwochen vergleichbar sind.

Danach folgen drei Spalten mit den prozentualen Anteilen der Altersbänder an den jeweiligen Spalten 2 bis 0. In den nächsten drei Spalten findet sich der Anteil der getesteten Personen an der Population im Altersband, gefolgt von der Positivrate und Number Needed to Test (NNT). Die NNT ist die Anzahl der Personen, die getestet werden müssen, um ein positives Testergebnis zu erhalten.

Zuerst vergleichen wir die Altersanteile der Population / Bevölkerung mit den Altersanteilen in der Getesteten. Altersanteil unterscheiden sich deutlich. Bei einer repräsentativen Stichprobe (Getestete aus Bevölkerung) dürften die Altersanteile Angesicht der Größe der Stichprobe statistisch nicht so extrem abweichen. Warum machen sie es doch?

Vortest

Nun vor dem PCR-Test liegt ein Vortest. Mit diesem Vortest soll die Prävalenz für den nachfolgenden PCR-Test erhöht werden. (Wenn es heißt, dass ab der 46. Kalenderwoche die Testkriterien geändert wurden, dann geht es nicht die Kriterien des PCR-Tests, sondern die Kriterien des Vortests)

Um einen PCR-Test zu erhalten, müssen Sie z.B. Symptome haben oder einen längeren Kontakt zu einem Infizierten. Nachzulesen beim RKI. Die einzelnen Kriterien sind für unsere Betrachtung nicht von belang. Im Grunde liegt vor dem Vortest ein Vortest, denn es muss ja einen Grund für den Vortest geben. Gehen wir einfach davon aus, jeder prüft sich jeden Tag, ob er sich infiziert haben könnte. Wenn ja, durchläuft er den Vortest beim Arzt oder Gesundheitsamt. Auch das Gesundheitsamt prüft, wer Kontakt zu einem Infizierten hatte und führt dann den Vortest durch. Dieses Ganze Prozedere betrachten wir als Vortest.

Die Wahrscheinlichkeit einen Vortest zu bekommen und zu „bestehen“ ist offensichtlich nicht für alle Altersgruppen gleich, wie die Spalte Anteil Getesteten bezogen auf den Bevölkerungsanteil (Spalte 8) zeigt. Der Anteil der Getesteten 0-4 ist mit 4,14% der geringste aller Altersgruppen. Dagegen haben 80+ (7,61%) und 15-34 /7,77%) die höchsten „Durchtestung“.

Dies kann daran liegen, dass es Unterschiede bei den Voraussetzungen zum Vortest gibt (symptomlose Kinder) oder der Vortest nicht für alle Altersgruppen gleichermaßen geeignet ist. Wie stellen Sie den Geschmacksverlust bei einem 1-Jährigen fest? Oder das die Altersgruppen unterschiedlich durchdrungen sind.

Bis auf die Altersgruppe 35-60 liegen alle weit vom Mittelwert 6,23% entfernt. Entweder machen zu wenige den Vortest oder es gibt tatsächlich weniger Verdachtsfälle in den Altersgruppen oder der Vortest schließt in manchen Altersgruppen zu viele aus. Oder, oder, oder. Wir wissen es einfach nicht. (Jedenfalls nicht aus den öffentlichen Daten des RKI.)

Wir wissen nicht, wie viele Kinder 0-4 durch den Vortest durchfallen. Wie wissen nur, dass ihn 164.172 erfolgreich bestanden haben und mit einem PCR-Test getestet wurden. Von daher hilft es uns diese überhaupt nicht bei der Frage, ob wir Kinder 0-4 über-, unter- oder ausreichend testen.

Wir wissen nicht, wie viele Kinder durch den Vortest gefallen sind und eigentlich zum PCR-Test hätten geschickt werden müssen (False negative, Fehler 2. Art). Die Sensitivität des Vortestes liegt ganz tief im Dunkeln. Dies ist die berühmte Dunkelziffer, über die viel spekuliert wird. Wir könnten zwar annehmen, jeder macht den Vortest für sich jeden Tag, aber das hilft nicht weiter. Für einen symptomlosen Infizierten, der keine Kontaktperson hat, bei der er sich angesteckt hat, hat keien Grudn für einen PCR-Test. Würden wir eine Vier-Felder-Tafen erstellen, würden wir nur die obere Zeile kennen und die Gesamtsumme.

4-Felder-Tafel
4-Felder-Tafel für Altersgruppe 0 – 4

Gleiches gilt natürlich für alle anderen Altersgruppen.

Nächster Ansatz: Die Positivrate hängt offensichtlich mit dem Altersband – und dem Vortest – zusammen, sonst wäre sie in allen Altersbändern gleich. Der Vortest ist unterschiedlich geeignet.

In einem Punkt können wir etwas über den Vortest sagen, wir können seine Spezifität schätzen. Wenn der Vortest besagt: Der Testling könnte infiziert sein, dann waren es bisher 4,98% Kindern im Alter 0 – 4 (Spalte Positivrate).

Der Punktschätzer für die Spezifität des Vortestes liegt also bei Kindern bei 4,98% aufgerundet 5%. Dies wäre mit anderen Worten die positive Vorhersagekraft des Vortestes. Je nach Altersband schwankt die Positivrate von 4,98% bis 14,26%. Je älter, desto höher.

Einen Test, der in 85% – 95% der Fälle ein falsches Ergebnis liefert, würde normalerweise niemand einsetzen. Ein so schlechter Test reduziert kaum die Kosten und wir wissen nicht, wie viele und durchs Netz gehen. Die gute Nachricht für alle, die zum PCR-Test müssen: Ruhe bewahren, die Wahrscheinlichkeit nicht infiziert zu sein, ist hoch.

Und wieder gibt es einen Bias: Nicht jeder ist beim persönlichen Vortest ehrlich. Es gibt genügend Menschen, die den Vortest selbst durchführen, bestehen und trotzdem zur Arbeit statt zum Arzt gehen. Diese geistigen Aussetzer können wir aber nicht dem Vortest anlasten. Es sind keine echten False Negative. Wie viele es sind, wissen wir nicht.

Wieder sind wir der Frage der Untertestung nicht einen Schritt nähergerückt. Aber wir haben noch den Kehrwert der Positivrate. Ich habe sie hier Number Neeeded to Test (NNT) genannt.  Häufiger wird der Begriff Number Needed to Screen oder Diagnose genutzt; die Verwendung ist allerdings analog. Hier ist es die Anzahl der Personen, die  zu testen sind, um ein positives Ergebnis zu bekommen.

Im Altersband 0 – 4 müssen 20,1 Personen getestet werden, um eine infizierte Person zu finden. Das ist mehr als das Doppelte des Durchschnittes. Für das Altersband 80+ sind es sieben Personen – also ein Drittel.

Die NNT ist meines Erachtens der anschaulichste Wert um eine Aussage zur Untertestung – im Sinne von zu wenig testen – zu machen.

Nehmen wir an, wir haben keine weiteren Informationen:

Wenn ich 20 weitere Testkits für 20 Personen bekomme, in welchem Altersband sollte ich sie aus epidemiologischer Sicht einsetzen?

Natürlich für über 80-Jährige, denn dort werde ich wahrscheinlich drei und nicht nur zwei oder einen Fall finden. Ein infiziertes Kind mehr zu finden, ist teuer und geht bei begrenzten Kapazitäten nur zu Lasten andere Altersgruppen, in denen es offensichtlich mehr Infizierte gibt. Das wäre kontraproduktiv.

Ein Gegenargument wäre, das Kinder in der Kita mehr Kontakte als alte Menschen haben und das Virus stärker verbreiten könnten, weil sie mehr anstecken können. Aber auch darüber streiten sich die Geister und „you name it – you have it“ für jede Spekulation findet sich ein Spekulant. Die konsolidierte Meinung scheint mir auf dem Weg von weniger als Erwachsene über genauso zu mehr zu sein. Aber dies war hier nicht die Frage.

Wenn wir – in Sinne von zu wenig – von Untertestung sprechen wollen, dann käme dies nur für die Altersgruppen 35+ in Frage, denn das Altersband 0-34 liegt über dem Durchschnittswert. Kurz: In diesem Sinne sind Kinder und Jugendliche übertestet und die älteren untertestet.

Was tun?

Der Vortest wäre für Kinder so anzupassen, dass er spezifischer (und sensitiver?) wird, damit weniger, nicht mehr Kinder getestet werden. (Das ist nie eine schlechte Idee!) Die gesparten Testkit sind für über 80-Jährige einzusetzen, um ein Maximum an Infizierten zu finden.

Das steht jedoch unter dem Vorbehalt, dass es eine Dunkelziffer bei über 80-Jährigen gibt. Ohne diese Dunkelziffer ist die gesamte Überlegung hinfällig. Dann finde ich keinen zusätzlichen Infizierten.

Fazit

Die Number Needed to Test sagt uns: Wenn es eine hohe Dunkelziffer gibt, dann testen wir nicht zu wenig Kita-Kinder, sondern die falschen Kinder. Und bei Schülern deutet die Number Needed to Test von 12,63 nicht auf eine Untertestung im Vergleich zu älteren Altersbändern.

PS:

In der Schule sitzen Kinder mit Mindestabstand an Einzeltischen. Nach links und rechts, vorne und hinten beträgt der Abstand genau den Mindestabstand. Aufgrund der Dauer des Kontakts werden diese vier Kinder getestet. Diagonal beträgt der Abstand das 1,4-fache des Mindestabstandes. Diese diagonal sitzenden Kinder werden neuerdings. Das verdoppelt die Anzahl der zu testenden Kinder.

Die Number Needed to Test für unter 5-Jährige ist doppelt so hoch, wie der Durchschnitt. Zu früh gefreut: Die unter 5-Jährigen sitzen nicht still an Tischen auf einem „Schachbrett“.