Diktieren statt tippen?

Mit dem Slogan „Sie sprechen, Ihr PC schreibt“, bewirbt Linguatec sein Programm „Voice Pro 11“. „Sprechen Sie mit Ihrem PC“ kontert die Werbung von Nuance für „Dragon NaturallySpeaking“. So einfach soll das sein? Sind die Programme auch im journalistischen Alltag einsetzbar? Kann man Artikel diktieren, statt zu tippen?

Es gibt zig Gründe, nicht mehr zu Tippen und stattdessen zu Diktieren. Seien es körperliche Behinderungen oder schlicht Bequemlichkeit. Das Argument, diktieren ginge schneller als tippen, lässt sich nur bedingt aufrechterhalten. Für Standardtexte mag das stimmen. Sowie die Texte jedoch etwas anspruchsvoller werden, stoßen die Programme, so ihr Wortschatz nicht entsprechend trainiert wird, an schnell ihre natürlichen Grenzen.

Technische Standards. Mit beiden Programmen lässt sich erst auf Rechnern mit 1,25 GB RAM und einer Taktfrequenz von 2,8 Ghz flüssig arbeiten. Anders lautende Versprechungen in der Werbung sind praxisfremd.

Richtiges Mikro. Vorweggenommen: Beide Programme bieten nahezu identische Leistungen hinsichtlich der Erkennungsgenauigkeit von Text, Unterschiede gibt es jedoch bei der Navigation und dem Komfort beim Training. Auch der Preis für beide Programme ist mit 199 Euro für die Version „Dragon NaturallySpeaking Preferred“ und „Voice Pro 11“ identisch. Allerdings beinhaltet der Preis von „Voice Pro 11“ ein hochwertiges USB Mikrofon von Sennheiser, während Nuance sich mit einem normalen Kopfbügelmikrofon zufrieden gibt. Wir haben bei unseren Untersuchungen jeweils die Originalmikrofone verwendet. Die Angaben hinsichtlich der Genauigkeit der Spracherkennung bei „Dragon NaturallySpeaking“ beziehen sich also auf Verwendung des konventionellen Mikros, welches durchweg auch befriedigende Ergebnisse zeigte, die jedoch durch den Einsatz eines USB-Mikros deutlich gesteigert werden konnten. Überhaupt steht und fällt die Leistungsfähigkeit der Programme mit der Auswahl des Mikrofons. Ein immer gleichmäßiger Abstand zum Mund ist unverzichtbar. Es ist jedem Anwender dringend zu empfehlen, das Programm seiner Wahl nach Möglichkeit mit unterschiedlichen Mikros auszuprobieren.

Benutzerdatei. Spracherkennungssoftware ist vornehmlich für Standardtexte konzipiert. Konfrontiert man sie mit Prosa, sind die Programme – sofern untrainiert – überfordert, wie ein Test mit Goethes Faust zeigte. Erst nach dem Training bewältigten beide Programme die Aufgabe fehlerfrei. Und damit sind wir schon bei der Korrektur dessen, was die Werbung verspricht. Beide Programme werden mit einem Tutorial ausgeliefert, welches man tunlichst abarbeiten sollte. Das Basistraining, bei dem vorgegebene Texte geübt werden, dauert jeweils 90 Minuten. Hierbei handelt es sich nicht um ein reines Texttraining, sondern um eine Analyse der Sprache des Benutzers. Das Resultat wird in einer Benutzerdatei gespeichert. Auf diese Weise können Anwender mit völlig unterschiedlicher Artikulation bei Dialekten identisch gute Ergebnisse erzielen. Das Anlegen von Benutzerprofilen wie auch die allgemeine Installation klappte bei beiden Programmen problemlos. Auch die Erklärungen der Funktionsweise sind nicht zu beanstanden. Allerdings hatte der Drachen hierbei die Nase ein wenig vorn. In das Programm ist ein Lern-Video implementiert, welches die Arbeitsweise anschaulich und leicht nachvollziehbar erläutert. Bei „Voice Pro 11“ muss man das Handbuch bemühen.

Neues Vokabular. Die grundlegenden Programmfunktionen sind bei beiden Programmen. Man diktiert frisch drauflos. Sollten die Programme Begriffe nicht richtig verstehen, kann man sie mit Sprachkommandos wie „Streich das“, beziehungsweise mit „Wähle“ oder “ kennzeichnen und ein Korrekturfenster öffnen, dem ähnlich klingende Begriffe zu entnehmen sind. Diese Begriffe muss das Programm natürlich kennen oder gelernt haben. Bei beiden Programmen gibt es die Möglichkeit, sie mit Listen oder Dokumenten in den gängigen Textformaten zu füttern. Es ist erstaunlich, wie gut die Programme dieses Procedere beherrschen. Für die Beurteilung haben wir die Programme mit mehreren Fachartikeln zum Thema „Klimaschutz“ gefüttert. Nach dieser Übung wurden fast alle Fachbegriffe korrekt verstanden. Beim Training von einzelnen Worten, das heißt nicht aus Dokumenten entnommen, ist „Dragon NaturallySpeaking“ jedoch im Vorteil. Das Bestandsvokabular lässt sich über die Tastatur um einzelne Begriffe erweitern. Bei „Voice Pro 11“ lässt sich diese Prozedur nur über Dokumente und Listen erreichen. Das muss nicht unbedingt ein Nachteil sein, wenn man sich zu Beginn der Arbeit entsprechende Listen anlegt und sie von den Programmen abarbeiten lässt. Und hier sind wir beim zweiten wichtigen Punkt. Beide Programme folgen in der nicht trainierten Version nur allgemeingültigen linguistischen Algorithmen, Fachvokabular muss hingegen trainiert werden. Und der Anwender muss sich zumindest am Anfang zwingen, die Korrekturvorschlags-Funktion zu verwenden, und keinesfalls Korrekturen über die Tastatur einzugeben. Nur so kann man den Lernprozess nachhaltig unterstützen, denn direkte Korrekturen über die Tastatur kann die Software nicht „lernen“.

Textverarbeitung & E-mails. Kryptische Begriffe lassen sich auf einfache Weise im Buchstabiermodus eingeben. Dazu sagt man einfach „Buchstabieren starten“; anschließend ergänzt die Software nur Buchstaben. Beide Programme werden mit einer kleinen Textverarbeitung ausgeliefert. Mit diesen Programmen lassen sich die meisten Schreibaufgaben problemlos erledigen oder aber per Copy & Paste in MS Word übertragen. Es lässt sich auch in die meisten Windows-Anwendungen diktieren, mit der Einschränkung, dass die Befehlssätze nur unter Windows XP zur Verfügung stehen. Diktate in MS Word und Excel machten keinerlei Probleme.

Mit beiden Programmen lassen sich auch Desktop-Operationen bzw. die Navigation zwischen verschiedenen Programmen durchführen. Beispielsweise öffnet der gesprochene Befehle „Öffne Mail“ bei „DragonNaturally Speaking“ das E-Mail-Programm, welches nach Befehlsaufruf nahezu uneingeschränkt zur Verfügung steht.

Makros. Ein großer Vorteil von „Voice Pro 11“ muss noch betont werden. Hier lassen sich Makros erstellen, das heißt, individuelle zusammengestellte Textblöcke innerhalb eines Diktats auf ein einzelnes, frei wählbar definiertes Kommando reduzieren. Das funktioniert auch mit Navigiermakros, die eine Folge von Tastenanschlägen und Mausklicks zusammenfassen. Bei „Dragon NaturallySpeaking Preferred“ steht die Makro-Funktion leider nur in der deutlich teureren Professional Edition zur Verfügung.

Fazit: Die Programme taugen tatsächlich dazu, Tastatureingaben weitgehend durch das gesprochene Wort zu ersetzen. Den Werbeversprechen der Hersteller sollte man jedoch nicht blind vertrauen. Um das Optimum aus den Programmen herauszuholen, ist es unverzichtbar, sie ausgiebig zu trainieren. Das mag anfangs aufwendig erscheinen. Der Aufwand reduziert sich jedoch beim fortschreitenden Training, da die Programme „lernen“ und nichts „vergessen“. Anwender, die dies nicht beherzigen, werden enttäuscht sein; bringen sie sich doch um eine erhebliche Arbeitserleichterung, die Diktieren statt Tippen mit sich bringt.

Ein Punkt soll abschließend nicht verschwiegen werden. Es ist ein riesiger Unterschied, Artikel druckreif zu diktieren statt zu tippen. Aber auch das lässt sich in relativ kurzer Zeit erlernen.

Axel Voss ist freier Journalist in Pinneberg. eMail: autor@mediummagazin.de

Downloadtipp: Den ausführlichen Testbericht von Axel Voss finden Abonnenten unter www.mediummagazin.de, Rubrik download.

Erschienen in Ausgabe 4/2008 in der Rubrik „Leben“ auf Seite 70 bis 71 Autor/en: Axel Voss. © Alle Rechte vorbehalten. Der Inhalt dieser Seiten ist urheberrechtlich geschützt. Für Fragen zur Nutzung der Inhalte wenden Sie sich bitte direkt an die Redaktion.