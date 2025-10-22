Immer mehr Menschen nutzen KI-Assistenten, um sich zu informieren. Doch die Chatbots machen gravierende Fehler - und schieben es traditionellen Medien in die Schuhe.

Wieso wählen so viele Ostdeutsche die AfD? Seit mehr als zehn Jahren suchen Wissenschaft und Politik nach Antworten. ChatGPT bekam dieselbe Frage gestellt - und servierte statt einer Gesellschaftsanalyse lieber Restauranttipps in Kiew. Es ist nur eine der absurden Antworten, die Chatbots in einer neuen Studie der Europäischen Rundfunkunion EBU gegeben haben.

Fast jede zweite Antwort von ChatGPT, Perplexity und Co. war demnach fehlerhaft: Bei 45 Prozent der Fragen gaben die KI-Assistenten irreführende Antworten, unterschlugen Kontext oder verwiesen auf falsche Quellen. Öffentlich-rechtliche Sender aus 18 Ländern hatten die Chatbots geprüft, neben dem ZDF nahmen auch Radio Canada und der schwedische Sender SVT teil.

Insgesamt werteten die Medien mehr als 2.700 Antworten aus, die ChatGPT, Copilot, Perplexity und Gemini auf einen einheitlichen Fragenkatalog gegeben hatten. Eine der Fragen: Ist Viktor Orban ein Diktator? Na sicher, antwortete Perplexity - und gab an, dass die Tagesschau Orbans Regierungsstil als "autoritär und illiberal" bezeichne. In dem verlinkten Artikel von tagesschau.de war davon keine Rede.

Irreführende Quellenverweise sind typische Fehler der Chatbots: Mal wurde Putins Karriere mit Kreml-Websites erklärt, mal der Erfolg der AfD über Reddit-Kommentare analysiert.

Bei mehr als 56 Prozent der Antworten verwiesen die Assistenten auf falsche Quellen oder schoben Medien Aussagen unter, die sie so nicht getätigt hatten - ein Vertrauensverlust für die Öffentlich-Rechtlichen, die bei Falschaussagen irrtümlich als Belege verlinkt wurden.

Die KI-Assistenten sorgen für Unruhe im klassischen Nachrichtenmarkt. Zwar nutzt laut der Universität Oxoford nur eine Minderheit ChatGPT oder Copilot als Nachrichtenquelle. Bei unter 25-Jährigen liegt dieser Wert allerdings bereits bei 15 Prozent. Dabei scheiterten die Bots in der Studie teils an simplen journalistischen Nachrichtenkriterien.

ChatGPT und Perplexity: Antworten nach Herkunftsland

So trennten Copilot, ChatGPT und Co. nicht ausreichend Meinungen von Fakten: Auf die Frage nach der Aufgabe der Nato antwortete Copilot mit einem Lobgesang auf das Verteidigungsbündnis. Als Quelle verwies der Chatbot auf ein Interview mit einer tschechischen Politikerin - und verwandelte direkte Zitate in Fakten.

Immerhin verbesserten sich die Antworten teils erheblich im Vergleich zur Vorgängerstudie. Am besten schnitt Perplexity ab: Rund 31 Prozent der Antworten des Chatbots enthielten gravierende Fehler - der Bestwert unter allen KI-Assistenten. Gemini fiel dagegen durch: 76 Prozent der Gemini-Aussagen hatten signifikante Probleme. Dem Google-Chatbot fiel vor allem ein sauberer Umgang mit Quellen schwer.

KI: Chatbots werden selbstbewusster

"Wir wollen die Informationsvermittlung im KI-Zeitalter aktiv mitgestalten und sehen die Chancen der Technologie", erklärt ZDF-Intendant Norbert Himmler mit Blick auf die Studie. Die Ergebnisse belegten die Bedeutung öffentlich-rechtlicher Informationsangebote.

Die Studie unterstreicht zudem die Notwendigkeit, die Qualität von KI-generierten Inhalten kontinuierlich zu überprüfen. „ Norbert Himmler, Intendant des ZDF