Covid-19-Fallzahlen – das Problem der „falsch positiven Ergebnisse“

Zurzeit werden in Deutschland täglich rund 55.000 Test auf das SARS-CoV2-Virus durchgeführt, von denen aktuell rund ein Prozent positiv ausfällt. Durchgeführt werden diese Tests mit einem sogenannten PCR-Test. Es ist jedoch bekannt, dass diese Tests, obgleich sie vielfach als „Goldstandard“ bezeichnet werden, eine – wenn auch sehr kleine – Fehlerquote haben. Bei 55.000 Tests pro Tag würde jedoch bereits ein Prozent falsch positiver Ergebnisse 550 positive Testergebnisse von Menschen generieren, die das Virus überhaupt nicht in sich tragen. Diese Zahl übertrifft die aktuellen Neuinfektionen pro Tag. Aber wie viele falsch positiven Fälle gibt es wirklich? Und was könnte man jetzt schon tun, um deutlich mehr Datensicherheit zu erreichen und vielleicht unnötige Schutzmaßnahmen zu beenden? Von Jens Berger und Martin Beck.

Dieser Beitrag ist auch als Audio-Podcast verfügbar.

Podcast: Play in new window | Download

Während negative Testergebnisse[1]bei einer exponentiellen Ausbreitung und hohen Infiziertenzahlen problematisch sind, stellt am Ende einer Epidemie bei geringen Infiziertenzahlen der Effekt von falschen positiven Testergebnissen ein Problem dar – gemeint sind hiermit Proben von real Nicht-Infizierten, die fälschlicherweise ein positives Ergebnis ergeben. Dieses Thema wurde auch bereits in einzelnen internationalen Studien[2] behandelt. Die Wahrscheinlichkeit, mit der tatsächlich Nichtinfizierte irrtümlich als Infizierte getestet werden, hängt aber nicht nur von der Leistungsfähigkeit des Tests selbst ab (dessen Parameter der Sensitivität und Spezifität), sondern auch von der tatsächlichen Durchseuchung der getesteten Menschengruppe. Die Zusammenhänge werden auch vom RKI so beschrieben und in dem folgenden Interview mit Prof. Haditsch sehr ausführlich an Rechenbeispielen (ab Minute 11) dargestellt.

Für die Beantwortung der Frage, wie sicher die Testergebnisse sind, gibt es eine sehr gute Möglichkeit: Man muss nur anonyme, verdeckte Testproben an alle Labore schicken, einige mit SARS-CoV-2-Viren und einige ohne diese Viren, und dann die richtigen und falschen Ergebnisse anschauen. Genau dies ist im April in Kooperation mit der Charité durch einen INSTAND-Ringversuch geschehen, um die einzelnen Labore zu zertifizieren. Die Labore mussten alle PCR-Testproben[3] korrekt als positiv oder negativ analysieren und zurückmelden, um das Zertifikat zu erhalten.

Die Ergebnisse sind für den Laien nicht ganz einfach zu interpretieren, da weltweit 463 Laboratorien (von 488 angemeldeten aus 36 Ländern) Ergebnisse zurückgemeldet haben, die mit sehr unterschiedlichen Reagenzien und Hersteller-Testkits durchgeführt wurden. Unterschiedlich sind auch die Ergebnisse, je nachdem mit welcher der sechs möglichen Genregionen der Virus-RNA der Test durchgeführt wurde. Jedoch gibt die Zusammenfassung für die Proben ohne SARS-CoV-2 schon einen gewissen Überblick über die Fehlerquote der PCR-Ergebnisse.

Qualitative Ergebnisse der drei SARS-CoV-2 negativen Proben […]: Für die drei SARS-CoV-2-negativen Proben […] erbrachten die Teste zum Genom-Nachweis von SARS-CoV-2 unabhängig von der untersuchten Gen-Region überwiegend richtig negative Ergebnisse (97,8% bis 98,6% richtige qualitative Ergebnisse).

Zur Fehlerquote von 1,4% bis 2,2% schreibt INSTAND:

Es ist abzuklären, ob diese falsch positiven Ergebnisse auf ein Spezifitätsproblem der angewendeten Teste oder auf eine Verschleppung von SARS-CoV-2 bei der Testdurchführung bzw. auf Verwechselungen mit anderen Proben in diesem Ringversuch in den betreffenden Laboren zurückzuführen sind.

Wichtig ist, dass in den Resultaten nicht nur die Parameter des Tests selbst (dessen Spezifität manche Hersteller mit 100% angeben, d.h. von allen wirklich negativen Proben werden auch 100% als negativ gemessen) enthalten sind, sondern auch andere Fehlerquellen wie Vertauschungen und Verschleppungen. Das soll korrekterweise weiter „abgeklärt“ werden.

Bis dahin stellt sich die Frage, wie diese Ergebnisse zu bewerten sind. Unklar ist beispielsweise, ob die Ergebnisse dieser weltweiten Überprüfung auch auf Deutschland anwendbar sind. Leider werden die Daten nicht nach dem Standort der Labors aufgeschlüsselt. Manche Tests verwenden auch mehrere Genregionen und haben so viel weniger falsch positive Ergebnisse. Auch das RKI empfiehlt, in mindestens zwei Genregionen zu testen. Ob dies die Fehlerwahrscheinlichkeit minimiert, ist jedoch ebenfalls offen, da einige Testkits gleich auf mehreren Genregionen falsche positive Ergebnisse liefern[4]. Die Nachfrage bei einigen Laboratorien haben zudem ergeben, dass sie nur auf einer Genregion testen und die Fehlerquote so bei über einem Prozent und im Bereich der gemeldeten Neuinfizierten liegen könnte.

Bis diese Probleme ausgeräumt sind, melden die Labors jeden positiven Test in Deutschland an das Gesundheitsamt und die falschen positiven Ergebnisse gehen so – unabhängig von der konkreten Fehlerursache – in die offiziellen Statistiken des RKI ein, auf deren Basis die Politik ihre Maßnahmen verhängt.

Was kann man also sofort tun, um die Datenlage zu verbessern?

Die Daten des INSTAND-Ringversuchs für die deutschen Laboratorien getrennt veröffentlichen
Es muss eine Prüfung erfolgen, ob alle Laboratorien, die PCR-Test-Ergebnisse an die Gesundheitsbehörden melden, wirklich zwei Tests in unterschiedlichen Genregionen durchführen und den Bestätigungstest idealerweise mit einem anderen Testkit durchführen.
Die Gesundheitsministerien der Länder müssen als Weisungsbefugte allen Gesundheitsämtern vorgeben, wie im Fall von positiven Testergebnissen je nach Situation vorzugehen ist:
- ohne Symptome: immer ein Kontroll-PCR-Test in einem anderen Labor
- ohne aktuelle Symptome, wenn Grippesymptome vor ein bis zwei Monaten: ein serologischer Test, falls noch nichtinfektiöse alte Viren-RNA vorhanden
- auch Antikörpertests können trotz vorhandener Unsicherheiten sehr zur Klärung eines Falles beitragen
- erheblich aufwändiger wären traditionelle Virentests mit Anzucht in der Petrischale

Jedenfalls wären die zusätzlichen Kosten deutlich geringer zu veranschlagen als die gegenwärtige Unsicherheit mit Quarantänemaßnahmen und gesundheitlichen wie wirtschaftlichen Kollateralschäden. Die Rechengrößen des RKI mögen ja bei einer pandemischen Infektionslage mit hohen Wachstumsziffern von Interesse sein; in einem Szenario mit sehr geringen Infektionszahlen sind sie jedoch höchst vage und fehleranfällig – nicht zuletzt durch die Möglichkeit eines falschen positiven Ergebnisses. Der Handwerker sagt: Wer viel misst, misst Mist. Vielleicht trifft das auf die Epidemiologen ja auch zu?

Solange die Politik sich bei ihrer Bewertung von „Maßnahmen“ auf eben jene Werte stützt, die durch falsche positive Ergebnisse beeinflusst werden könnten, sollte diese Fehlerursache untersucht und im besten Falle beseitigt werden. Bislang ist die Studienlage zu diesem Problem äußerst dünn. Man manövriert sich im „Blindflug durch den Lockdown“, wie es die NachDenkSeiten in einem anderen Artikel formulierten. Bedenkt man die Schäden, die der Lockdown auf sehr vielen Gebieten verursacht, ist dieser Umstand nicht mehr hinzunehmen. Hier sind die Gesundheitsbehörden des Bundes und der Länder gefordert, Klarheit zu schaffen.

Titelbild: angellodeco/shutterstock.com

[«1] Studien aus den USA ergaben hier schockierende Fehlerquoten von 21% bis 67%. Aktuelle Metastudien beziffern die durchschnittliche Quote falsch negativer Tests mit ca. 13%. Ein Ringversuch des deutschen INSTAND zur Zertifizierung von Laboratorien, der in Kooperation mit der Charité durchgeführt wurde, kam hier je nach Konzentration des Virus in den Proben auf Fehlerquoten von bis zu 7,0%. Von 1.000 durchgeführten Tests an tatsächlich Infizierten würden demnach 70 Patienten fälschlicherweise ein negatives Ergebnis bekommen.

[«2] Eine Evaluierung der verschiedenen PCR-Tests, durchgeführt von der renommierten Schweizer Foundation for Innovative New Diagnostics kam zu dem Ergebnis, dass diese bei negativen Proben „nur“ eine Spezifizität von 96% aufwiesen – d.h. dass sie in vier Prozent aller Fälle ein falsches positives Ergebnis lieferten. Eine Studie der US-Wissenschaftler Andrew N. Cohen und Bruce Kessel schätzt die Quote falscher positiver Tests (FPR) auf Basis der FPR bei anderen Viren „konservativ“ auf 0,8%. Eine weitere Studie von Oxford-Wissenschaftlern weist korrekterweise darauf hin, dass das Risiko einer FPR abhängig von der Anzahl der positiv Infizierten ist und dieses Risiko mit fallender Infektionszahl stetig steigt. Für stark sinkende Infiziertenzahlen kalkulieren die Wissenschaftler mit einer FPR von 1,5%.

[«3] Bei einem PCR-Test wird – vereinfacht dargestellt – anhand menschlicher Zellen, die aus einem Rachen- oder Nasenabstrich stammen, überprüft, ob in den Zellen bestimmte Gensequenzen des zu testenden Virus nachweisbar sind. In Zeiten der exponentiellen Ausbreitung von Covid-19 wurden diese Tests vor allem auf das Risiko falsch negativer Ergebnisse überprüft.

[«4] Von 373 virenfreien Proben im INSTAND-Ringversuch wurden zwei Proben auf der meist genutzten Gensequenz E-Gen fälschlicherweise als SARS-CoV2-positiv getestet. Pikant ist in diesem Zusammenhang, dass genau die Testkits der Hersteller, die auf dieser Gensequenz FPR lieferten (es handelt sich um Kits des südkoreanischen Herstellers Seegene und des Berliner Herstellers TIB MOLBIOL) auch bei anderen Gensequezen falsche positive Ergebnisse lieferten. Höher ist die FPR bei Proben, die nicht SARS-CoV2, sondern ein herkömmliches Corona-Virus wie das Coronavirus 229E als Probe enthielten. Hier betrug die FPR bei der Gensequenz E-Gen 4,8% oder 18 von 373 Proben und betraf die Testkits von sieben Herstellern. Neben Seegene und TIB MOLBIOL wiesen hier auch die Kits des türkischen Herstellers Anatolia Geneworks, des US-Unternehmens Cepheid und des chinesischen Unternehmens Liferiver falsche positive Ergebnisse bei anderen Gensequenzen auf. Leider geht aus der Studie nicht hervor, ob es sich bei den falschen positiven Ergebnissen auf den verschiedenen Gensequenzen um ein und dieselbe Probe handelte. Sollte dies der Fall sein, würde auch der Bestätigungstest mit diesem Kit ein falsches positives Ergebnis liefern. Keine Informationen ergaben auch unsere Nachfragen, ob beim Bestätigungstest aus Sicherheitsgründen das Testkit eines anderen Herstellers verwendet wird.