Roboter als Reporter

Tief in der Nacht, wenn der Online-Spätdienst seine Rechner längst heruntergefahren hat und die Kollegen der Frühschicht noch schlummern, werden einige Reporter bei der „Los Angeles Times“ erst richtig produktiv. Allerdings sind die Nachteulen nicht menschlich. Seit zwei Jahren saugen sich die Algorithmen des Datenbank-Ressorts sämtliche öffentlich zugänglichen Daten aus den Polizeiberichten zusammen und verorten sie auf einer interaktiven Karte. Wenn etwas ungewöhnlich erscheint –mehr Morde in einer normalerweise ruhigen Gegend oder ein spürbarer Rückgang von Raubüberfällen in einem notorisch gefährlichen Viertel – dann erkennt ein Algorithmus unmittelbar die Relevanz in den Daten und verfasst eigenständig einen Blogeintrag aus Standard-Textbausteinen. Das geschieht mehrmals pro Woche und bei Bedarf auch mehrmals innerhalb von 24 Stunden. Dass bei einer Metropolregion mit 114 Stadtteilen und 3,8 Millionen Einwohnern im Stadtgebiet (City of Los Angeles) sowie 158 Orten und zehn Millionen Einwohnern im gleichnamigen Landkreis (Los Angeles County) eine Software effizienter Texte, Tabellen und Grafiken produzieren kann als ein Journalist, liegt auf der Hand. Verblüffend ist allerdings, wie geschmeidig und geräuschlos Kollege Robo-Reporter in den USA im Hintergrund von immer mehr Redaktionen seine Dienste verrichtet.

Dass Algorithmen journalistische Recherchen unterstützen, ist an sich nichts Neues. Computer Assisted Reporting (CAR) gab es schon in den 80er Jahren. 2007 schrieb der Journalist und Programmierer Adrian Holovaty eine Datenbanksprache zur automatisierten Abfrage von Kriminal- und weiteren Statistiken für seine hyperlokale Plattform Everyblock, die inzwischen zu NBC News gehört. Ein neuer Trend ist jedoch, dass Algorithmen Daten nicht nur aus den Quellen auslesen und analysieren, sondern auch eigenständig Texte verfassen können, wenn sie entsprechend programmiert und trainiert werden. Besonders gut eignen sich dafür Themengebiete, in denen strukturierte Daten im Mittelpunkt stehen und die Nutzer wiederum planbare Erwartungen an einen standardisierten Textaufbau haben. Das ist vor allem der Fall bei Börsenberichten, Jahresbilanzen von Unternehmen, Spielberichten von Sportereignissen, Wettberichten oder eben Verbrechensmeldungen.

Erfolgreiche Start-ups

In den USA haben sich neben der „L.A. Times“ vor allem zwei Start-ups auf Roboterjournalismus spezialisiert. „Automated Insights“ in North Carolina bietet unter anderem automatisiert verfasste Sportberichte zu massenattraktiven Sportarten und beliefert damit statistikverliebte amerikanische Sportfans auf diversen Webportalen. Und „Narrative Science“ in Chicago ist aus einem Forschungsprojekt namens „Stats Monkey“ von Journalisten und Software-Ingenieuren hervorgegangen. Mittlerweile beliefert die Agentur 30 Medienunternehmen und Webdienste mit computergenerierten Beiträgen aus öffentlichen und nichtöffentlichen Quellen. Zu den bekannten Kunden gehört der Wirtschaftsdienst forbes.com. Dieser kennzeichnet die eingekauften Finanznachrichten jeweils mit der Autorenzeile „Von Narrative Science“ und mit einem Kasten, der erklärt, dass Narrative Science über seine proprietäre Plattform Daten in Berichte und Analysen transformiert. „Noch nicht eine einzige Beschwerde“ über den automatisierten Lesestoff habe es bei den anspruchsvollen Nutzern des Webdienstes bisher gegeben, betonte Forbes-Produktchef Lewis DVorkin kürzlich gegenüber dem Magazin „Wired“.

Gründe für die behauptete Zufriedenheit der Nutzer dürften darin liegen, dass die Algorithmen nicht nur stilistisch sauber schreiben und sich keine Rechtschreibfehler leisten (zwischen Texten von Narrative Science und softwaregenerierten Übersetzungsprogrammen liegen Welten). Außerdem stellen sie Daten wann immer möglich in einen historischen Kontext. „Unsere Geschichten werden von Daten getragen, aber sie geben die Daten nicht einfach kommentarlos wieder“, sagt Kristian Hammond, Chefingenieur von Narrative Science. „Wir vergleichen Jahresbilanzen von Unternehmen. Bei Sportberichten ermöglichen Daten aus mehreren Saisons Trendanalysen, Rankings und Vorhersagen über die voraussichtliche Bedeutung des Spiels über die aktuellen Statistiken hinaus.“

In all diesen Fällen gelte die simple Regel: Je mehr Daten zur Verfügung stehen, desto gehaltvoller wird der Bericht. Algorithmen stöhnen nicht über die Stecknadel im Heuhaufen. Die Technologie sei so weit ausgereift, „dass in fünf Jahren der erste Roboter-Reporter einen Pulitzer-Preis gewinnen wird“, behauptet Hammond selbstbewusst.

Während Forbes bei der Kennzeichnung computergenerierter Beiträge Transparenz zeigt, wollen andere Kunden von Narrative Science allerdings lieber ungenannt bleiben. Die befürchteten Vorbehalte der Nutzer gegenüber dem vemeintlichen Billigjournalismus könnten sonst Reichweite kosten. Doch umgekehrt behagt unter den Profis in der Medien- und Informationsbranche nicht jedem die Vorstellung, dass Algorithmen den Journalisten (in puncto Tempo ohnehin überlegen) künftig sogar in puncto Qualität in vielen Bereichen ebenbürtig sein könnten. „90 Prozent aller Texte können in fünf Jahren von Algorithmen verfasst werden“, prophezeit Hammond. „Durch Narrative Science werden journalistische Überprüfungen der Richtigkeit zur reinen Belletristik“, behauptet dagegen der Informationsdienst „Deutsche Mittelstands Nachrichten“ in einem Beitrag vom Februar 2012 und konstruierte das Szenario, dass automatisierte Tradingprogramme aufgrund ungeprüft von Algorithmen übernommenen Fehlinformationen Insiderhandel erleichtern könnten. Dass die Software der Trader keine geschriebenen Berichte, sondern Daten gleich an den Quellen ausliest, stört in dieser Logik nicht weiter. Überzeugender wirkt hingegen die Nachdenklichkeit, mit der selbst ein Algorithmus-Experte wie Ben Welsh von der „Los Angeles Times“ zugibt, dass Roboter bei programmierbaren Aufgaben durchaus Journalisten überflüssig machen könnten (s. Interview).

Erweiterung statt Ersatz

Eine häufig geäußerte Vision der Innovatoren ist allerdings, dass Software Journalisten nicht ersetzen, sondern vielmehr befähigen soll, Aufgaben und Projekte anzugehen, die ohne Unterstützung durch künstliche Intelligenz eine Sisyphusarbeit oder gar unmöglich wären. „Wir erweitern den Journalismus“, sagt Kristian Hammond. „Wir erschaffen aus Daten neue Möglichkeiten des Erzählens.“ Vor allem der Sport mit seinen unzähligen Datenbergen und in der Fläche medial weitgehend unbeachteten Wettbewerben bietet dazu zahlreiche Möglichkeiten. Der findige bayerische Jungunternehmer Michael Wagner erkannte eine Marktchance im Sammeln und Vernetzen von Amateurberichten selbst aus den untersten Ligen und gründete die Plattform fupa.net (s. a. Journalisten-Werkstatt „Hyperlokale Partner-Konzepte“, MM 06/12). Noch einen Schritt weiter geht Narrative Science in den USA. Während Eltern und Großeltern bei den Begegnungen in der „Little League“ (Baseball-Kinderligen) am Spielfeldrand Spielstände in eine beliebte iPhone-App namens Gamechanger eingeben, greifen die Algorithmen aus Chicago in Echtzeit die kollektiven Daten ab und verfassen erste bebilderte Berichte schon vor dem Schlusspfiff. Diese können natürlich wiederum per iPhone-App gleich vor Ort angeschaut und herumgereicht werden. 2011 verfasste die Software von Narrative Science 400.000 solcher Berichte, in diesem Jahr sollen es mehr als 1,5 Millionen werden.

In deutschen Medien werden Schreibroboter bisher nicht eingesetzt. Das liegt zum einen an der Sprachbarriere (die Dienste der Anbieter gibt es bisher nur auf englisch), aber sicherlich auch an der hierzulande stärker verbreiteten Skepsis gegenüber technischen Innovationen im Journalismus. Noch wird auch Datenjournalismus, d
er ohne schreibende Roboter auskommt, nur von wenigen deutschen Onlinemedien wie „Zeit Online“, sueddeutsche.de oder taz.de betrieben, da mögen Algorithmen in den Autorenzeilen erst recht futuristisch erscheinen. Die FAZ veröffentlichte im Frühjahr 2010 als Reaktion auf den bevorstehenden Markteintritt des US-Anbieters Stat-Sheet eine Satire in ihrem Sportteil: einen angeblich von einem Algorithmus verfassten Bericht aus der Fußballbundesliga. Die nicht besonders subtile Botschaft des Beitrags lautete: Solch ein Schund wäre von einer Herrschaft der Algorithmen im Sportjournalismus zu erwarten.

Doch die Satire wurde von den Lesern wohl nicht erkannt, jedenfalls gab es auf das klischeetriefende Versatzstück keinen einzigen Kommentar. Die redaktionelle Lehre, die daraus zu ziehen wäre, lautet allerdings: Warum sollten sich talentierte Reporter in unterbesetzten Redaktionen mit lapidaren Spielberichten befassen, wenn Kollege Roboter in der gleichen Zeit Dutzende nach Schema F gestrickte Texte abliefern und der menschliche Reporter sich anspruchsvolleren Themen widmen könnte? Zum Beispiel der im Sportjournalismus unterentwickelten investigativen Recherche? Oder der Visualisierung komplexer Datensätze?

Humorlose Computer

Ein mediales Zukunftsfeld bleibt den Algorithmen bisher noch weitgehend verschlossen – die Analyse und Verarbeitung unstrukturierter, sogenannter qualitativer Daten. „In 30 Jahren werden wir zurückschauen und es seltsam finden, dass wir qualitative Daten früher manuell ausgewertet haben“, glaubt Robbie Allen, Gründer und Chef von Automated Insights. Die Herausforderungen sind allerdings größer. Noch beherrschen die Algorithmen nur Sprachbestandteile, die sie mit bereits bekannten Strukturen abgleichen können, während das menschliche Gehirn auch auf Intuition und den eigenen Erfahrungshorizont zurückgreifen kann. Deshalb verstehen Menschen Witze, Computer aber nicht.

Doch erste Durchbrüche bei der algorithmischen Gefühlsauswertung sind bereits geschafft. Die Auswertung von Lob und Ärger in Tweets und Facebook-Updates verschafft der Kinobranche regelmäßig schon im Vorfeld neuer Filmstarts einen zuverlässigen Eindruck, ob ein Blockbuster oder ein Flop bevorsteht. Automatisierte Sentimentanalysen spielen auch im politischen Journalismus eine immer größere Rolle. Der Kurznachrichtendienst Twitter kündigte im August 2012 einen neuen Dienst an, den „Twindex“. Der politische Index soll Anbietern aus Politik, Wirtschaft und Medien ermöglichen, Stimmungen der Twitternutzer gegenüber den Kandidaten im US-Wahlkampf in Echtzeit auszuwerten. Zwischen der Auswertung von Sentiments und der automatisch verfassten Analyse in Worten liegt aber kein großer Schritt. Algorithmen wiederum, die 140 Zeichen auswerten und in eigenständigen Berichten wiedergeben können, lernen früher oder später auch mit längeren Textdateien umzugehen. Und damit dürfte auch der Sturm auf die letzte Bastion menschlicher Äußerungen – Gefühle und Ironie, Prosa und Poesie – durch nüchterne Algorithmen nur eine Frage der Zeit sein. Mit Wetten über einen Pulitzer-Preis für den ersten algorithmisch verfassten Essay sollte man dennoch wohl vorsichtig sein.

Ulrike Langer Redaktionsmitglied von „medium magazin“ und freie Fachjournalistin für digitale Themen in Seattle/USA.

mail@medialdigital.de

Link:Tipps

Textlinks:

„Can an Algorithm Write a Better News Story Than a Human Reporter?“, „Wired“, 24.04.2012, http://bit.ly/I90PA3

„Journalists Debate Value of Robots“, Poynter, 26.04.2012, http://bit.ly/RC3kyN

„Twitter Unveils the Twindex, a New Political Index“, „New York Times“, 01.08.2012, http://nyti.ms/MRVAIa

„Neuer Trend: Wirtschafts-Journalisten werden von Robotern ersetzt“, Deutsche Mittelstands Nachrichten, 18.02.2012, http://bit.ly/RC31nC

„Bayern müssen die Katze im Dorf lassen“, Satire bei faz.net, 28.03.2010, http://bit.ly/S3Nad6

Videotipps:

Robbie Allen, Narrative Science: Interview auf der O’Reilly Tools of Change Konferenz 2012: http://youtu.be/_3Hl55VfkTk

Ben Welsh, „Los Angeles Times“: Vortrag beim International Symposion on Online Journalism 2012, http://vimeo.com/44747897#

Kristian Hammond, Narrative Science: gesammelte Vorträge und Interviews auf der Unternehmenshomepage: www.narrativescience.com/videos/

Erschienen in Ausgabe 09/202012 in der Rubrik „Medien und Beruf“ auf Seite 34 bis 34 Autor/en: Ulrike Langer. © Alle Rechte vorbehalten. Der Inhalt dieser Seiten ist urheberrechtlich geschützt. Für Fragen zur Nutzung der Inhalte wenden Sie sich bitte direkt an die Redaktion.