Mit Vektoren gegen Fake News

„Ich sehe Desinfektionmittel, das es in einer Minute auslöscht. Eine Minute. Und es gibt eine Möglichkeit, wie wir so etwas machen können, und es ins Innere des Menschen bringen, fast wie eine Reinigung.“ 

Dieser Vorschlag von Ex-Präsident Trump, gegen das Corona-Virus Desinfektionsmittel zu spritzen, hatte fatale Folgen. Alle Experten konnten nur den Kopf schütteln und viele mit etwas Verstand und Hintergrundwissen nahmen Trump schon lange nicht mehr ernst. Andere aber, wie meine Oma zum Beispiel, lassen sich von solchen Nachrichten stark verunsichern. Wie oft ich schon meine nervöse Oma am Telefon überzeugen musste, dass alte Menschen nicht deshalb als erstes geimpft werden, um sie als Versuchskaninchen zu nutzen. Oder dass die Impfung nicht durch und durch schlecht ist, weil die Cousine des Schwagers einer Nachbarin nach der Impfung doch krank geworden ist. Im Zeitalter der digitalen Kommunikation verbreiten sich Fake News schneller denn je und besonders während der Pandemie werden ängstliche Menschen nur noch mehr verunsichert. Und meine Oma muss sich nicht nur die Gerüchte der Nachbarin anhören, sondern bekommt tagtäglich auf Facebook Fake News von dubiosen Webseiten vorgeschlagen (ja, meine Oma ist tatsächlich auf Facebook). 

Jetzt sind Falschmeldungen auf Social Media durchaus kein neues Problem. Aber im Kampf gegen Fake News können wir einiges verbessern. Momentan läuft es so: Wenn ich Fake News sehe, kann ich das melden und wenn die Nachricht oft genug gemeldet wurde, untersucht sie die Armee von Fact-Checkern. Nun kann man sich leicht vorstellen, dass die Armee der Fact-Checker Hilfe benötigen könnte. Am besten von Algorithmen. 

Wort=Zahl, Satz=Vektor 

Algorithmen sind besonders gut darin, große Datenmengen sehr schnell mit anderen großen Datenmengen zu vergleichen. Es ist also sinnvoll, die Maschine genau dafür einzusetzen: Wir füttern die Maschine mit News, sie vergleicht diese mit bereits überprüften News und sagt uns, ob es nun Fake News sind oder nicht. Der naheliegendste Ansatz ist, ähnliche Sätze zu finden. Ist die Schnittmenge an Wörtern zwischen zwei Sätzen sehr groß, dann haben sie höchstwahrscheinlich den selben Inhalt. Möchte man meinen. 

Das beste Gegenmittel gegen Corona ist Ingwertee. 

In Zeiten von Corona hilft eine ruhige Minute mit Ingwertee gut als Gegenmittel gegen Stress. 

Die Schnittmenge der Wörter in diesen Sätzen ist sehr groß. Für uns Menschen ist aber sofort klar, dass die Aussage der beiden Sätze sich komplett unterscheidet. Unser Algorithmus muss also auch den Kontext in den Sätzen verstehen können. Und hier kommt das sogenannte Word Embedding ins Spiel. Hierbei wird ein Satz grammatisch dekompostiert und jedem Wort eine Zahl zugeordnet. Diese Zahlen werden zusammengefasst und damit wird ein Satz zu einem Vektor. Mit Vektoren kann der Algorithmus natürlich viel besser umgehen. Bei einem Vergleich zwischen Vektoren sind sie sich umso ähnlicher, je näher sie im Vektorraum zueinander liegen und je kleiner der Winkel zwischen ihnen ist. Wir haben also eine Methode gefunden, wie eine Maschine Sätze miteinander vergleichen kann und dabei den Kontext mitberücksichtigt. 

Make it cluster 

Damit nicht jeder neue Satz mit jedem Satz aus der bereits bewerteten Datenbank verglichen werden muss (wir kennen alle das quadratische Problem), übernimmt das ein trainiertes neuronales Netz. Das neuronale Netz nimmt den neuen zu untersuchenden Satz beziehungsweise Vektor und sortiert ihn in thematisch gegliederte Cluster ein. Dabei sind die Cluster nach Wahrheitsgehalt sortiert. Das heißt, es gibt ein Cluster namens „Trump: Desinfektionsmittel spritzen -> Fake News“, in dem alle Sätze als falsch identifiziert sind oder es gibt ein Cluster „Masken helfen gegen Ausbreitung des Virus -> Wahre News“, in dem alle Aussagen als richtig identifiziert wurden. Kann ein Satz in keinem Cluster eingegliedert werden, dann fängt es ein neues an. Und wenn dieses neue Cluster groß genug ist, dann ist es vielleicht wert, einen eigenen Fact-Check zu bekommen. Denn wenn nur Onkel Albert irgendeine Verschwörungstheorie auf seiner Facebookseite teilt, dann ist das noch keine Gefahr. Wird diese Verschwörungstheorie aber aufgegriffen und taucht immer wieder auf und wird damit in den Augen des Algorithmus ein Cluster, dann wird sie gefährlich und es sollte etwas gegen das Gerücht getan werden. 

Der Kampf gegen Fake News ist wichtig für die Gesellschaft. Nicht nur deswegen, damit ich meine Oma nicht jeden Tag davon überzeugen muss, dass die neuen Gerüchte falsch sind. Und um dabei effizienter zu werden, brauchen wir jede Hilfe, die wir kriegen können. Auch, beziehungsweise besonders von Algorithmen. Aber nachdem Trump jetzt nicht mehr im Amt ist, sollte die Fake News-Rate signifikant zurückgegangen sein. 

Quellen: 

https://arxiv.org/abs/1908.10084

https://en.wikipedia.org/wiki/Word_embedding

Autor

6 Kommentare

  1. Nice blog. Found this while searching through

    Antworten
  2. I have read so many posts about the blogger lovers however this post is really a good piece of writing, keep it up

    Antworten
  3. whoah this blog is wonderful i really like reading your articles. Keep up the great paintings! You realize, a lot of people are hunting round for this info, you could help them greatly.

    Antworten
Einen Kommentar abschicken

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Völlig losgelöst

Völlig losgelöst

Messebesuch auf der Internationalen Luft- und Raumfahrtausstellung ILA 2024 in Berlin Die diesjährige ILA steht ganz im Zeichen der Zeit: Ein großer Teil der Aussteller ist aus der Rüstungsindustrie. Noch vor dem Einlass bekommt man gleicheine Ausgabe des Military...

Ein Gespräch mit Ulrich Walter

Ein Gespräch mit Ulrich Walter

über Wissenschaft, Raumfahrtund die Kunst der Vermittlung Prof. Dr. Ulrich Walter (* 9. Februar 1954 in Iserlohn) ist ein deutscher Physiker und ehemaliger Wissenschaftsastronaut. Bis zu seinem Ruhestand im März 2023 lehrte er an der Professur für Raumfahrttechnik an...

Space Debris

Space Debris

Against common intuition, space isn’t empty; it’s packed with junk. But what threats does space junk pose? What is the current situation? And what can be done in response to possible threats? All man-made objects placed into the Earth orbit that serve no function are...

[mailpoet_form id="1"]