Unstatistik des Monats: Falsch positive Chatkontrolle

Seit Mitte Mai werden die Pläne der EU zur anlasslosen Durchsuchung von Mail- und Messenger-Inhalten heiß diskutiert. Der Gesetzentwurf wie auch seine Behandlung durch die Medien und die Bundesregierung sind unsere Unstatistik des Monats Juni. Denn schon allein aus statistischen Gründen schlägt die EU mit der angestrebten Chatkontrolle einen Irrweg ein.

smartphonescreen mit Apps
Bild von Thomas Ulrich auf Pixabay

Einerseits wurden die mit dem Gesetz verbundenen Eingriffe in die Privatsphäre
der Nutzer und die statistischen Probleme durchaus abgewogen: „Laut EU sollen
die Provider Scan-Methoden verwenden, die nach dem Stand der Technik in der
Branche den geringsten Eingriff in die Privatsphäre darstellen - auch um
Fehlalarme so weit wie möglich [zu] begrenzen“, schreibt der Deutschlandfunk.
Andererseits haben mehr als 70 Grundrechtsorganisationen dennoch - und aus
statistischer Sicht zu Recht - gegen das Gesetz protestiert und u.a. eine Petition
dagegen gestartet. Auch Volker Wissing, Minister für Digitales und Verkehr, will
laut FAZ „mit allen Argumenten dagegen vorgehen“. Inzwischen hat die
Bundesregierung einen Katalog mit 61 kritischen Fragen an die EU-Kommission
geschickt, der auf dem Portal Netzpolitik.org veröffentlicht wurde.

Die hier interessierende Frage Nr. 7 des Katalogs beschäftigt sich mit der
Problematik der möglichen falsch positiven Treffer: „Wie ausgereift sind die
modernen Technologien zur Vermeidung falsch positiver Treffer? Welcher Anteil
an falsch-positiven Treffern ist zu erwarten, wenn Technologien zum Nachweis von
Grooming eingesetzt werden? Hält es die COM [Kommission] zur Verringerung der
falsch-positiven Treffer für notwendig, vorzuschreiben, dass Treffer nur dann
veröffentlicht werden, wenn die Methode bestimmte Parameter erfüllt (z.B. eine
Trefferwahrscheinlichkeit von 99,9 Prozent, dass der betreffende Inhalt
angemessen ist)?“

Diese Frage legt die Vermutung nahe, dass trotz aller Debatten um falsch positive
Corona-Tests immer noch sehr wenige politische Entscheidungsträger und
Medienvertreter die Brisanz dieses Problems erkannt haben. Denn bei einer schier
unvorstellbaren Zahl an täglich verschickten Nachrichten, von denen lediglich ein
(glücklicherweise) sehr kleiner Anteil missbräuchliche Inhalte enthält, führt selbst
ein exzellenter Algorithmus zu einer sehr großen Zahl an Fehlalarmen.

Allein auf WhatsApp und allein in Deutschland werden pro Tag rund 3 Milliarden
Nachrichten verschickt (siehe Beiträge von Chip.de und Messengerpeople.com).
Angenommen, nur 0,0001 Prozent, also insgesamt 3.000 aller dieser Nachrichten,
enthalten unangemessene Inhalte. Dann werden 99,9 Prozent davon oder 2.997
Nachrichten entdeckt. Zugleich werden jedoch von den nach wie vor fast 3 Milliarden „unschuldigen“ Nachrichten 0,1 Prozent, also fast 3 Millionen
Nachrichten, als unangemessen fehlklassifiziert. Die wären dann mit einem
weiteren Algorithmus oder schlimmstenfalls von Menschen erneut zu prüfen. Und
das jeden Tag.

Selbst mit einer viel besseren Methode, die 99,999 Prozent aller Nachrichten
korrekt als „angemessen“ oder „unangemessen“ erkennt, kommen auf jede
richtigerweise als unangemessen erkannte Nachricht zehn Nachrichten, die vom
Algorithmus zu Unrecht als unangemessen deklariert werden.

Nun könnte man einwenden, dass Algorithmen nicht nur einzelne Nachrichten
klassifizieren, sondern ganze Chatverläufe. Das verschiebt aber lediglich das
Problem. Denn im Zweifelsfall müssen zwar weniger, aber dafür umso längere
Nachrichtenverläufe zusätzlich geprüft werden. Das Risiko, dass ein von einer KlI-
Anwendung verdächtigter Nutzer zu Unrecht ins Visier gerät, bleibt auf jeden Fall
unzumutbar hoch.

Und das ist es, was die Chatkontrolle für beide Seiten unverhältnismäßig macht.
Für den Bürger, der selbst beim Einsatz moderner Technologien mit hoher
Wahrscheinlichkeit unschuldig ist, wenn er verdächtigt wird. Und für Behörden,
die dann kaum noch etwas anderes zu tun haben, als zu Unrecht Verdächtigte
wieder zu entlasten. Wenn Minister Wissing und der Rest der Bundesregierung es
ernst meinen damit, alle Argumente auf den Tisch zu bringen, dann sollte dieses
Argument auf dem Silbertablett serviert werden.

--------------------

 

Ihre Ansprechpartner dazu:

Katharina Schüller (STAT-UP) Tel.: (089) 34077-447
Sabine Weiler (Kommunikation RWI) Tel.: (0201) 8149-213

Mit der „Unstatistik des Monats“ hinterfragen der Berliner Psychologe Gerd
Gigerenzer, der Dortmunder Statistiker Walter Krämer, die STAT-UP-Gründerin
Katharina Schüller und RWI-Vizepräsident Thomas K. Bauer jeden Monat sowohl
jüngst publizierte Zahlen als auch deren Interpretationen. Alle „Unstatistiken“
finden Sie im Internet unter www. unstatistik.de und unter dem Twitter-Account
@unstatistik. Unstatistik-Autorin Katharina Schüller ist zudem Mit-Initiatorin der
„Data Literacy Charta“, die sich für eine umfassende Vermittlung von
Datenkompetenzen einsetzt. Die Charta ist unter www.data-literacy-charta.de
abrufbar.

Bei Weiterverbreitung von Texten aus der Reihe "Unstatistik des Monats" muss
klar erkennbar sein, dass es sich um die Übernahme eines fremden Textes
handelt. Zudem ist die Quelle https://www.unstatistik.de zu nennen.