Computerdiktat: Sprechen statt Schreiben?
(Beitrag in Verwaltungsmanagement.Info,
Version 2.1, Stand: 2001)
Die neuen Programme zur Spracherkennung sind inzwischen (2001) auf einem Stand, dass sie eine nützliche Hilfe bei der Produktion von umfangreicheren Fließtexten sein können.
Die Programme unterscheiden sich in wesentlichen Punkten. Das mit entsprechender Marktmacht weit verbreitete IBM-Programm ViaVoice schnitt im Vergleich zu DragonDictate NaturallySpeaking deutlich schlechter ab, vor allem im Komfort
Ergebnis: etwa 30% Geschwindigkeitsvorteil für Dragon NaturallySpeaking (jeweils Versionen 1998).
Diese Vorteile gelten auch für die neuen Versionen, mit denen Leistung und Komfort erneut deutlich gesteigert werden konnten. Aber IBM konnte in den wesentlichen Punkten, wo DragonDictate besser abschneidet, nicht aufholen (Patentschutz?)
Einzelheiten s. die unten wiedergegebenen Beiträge:
Neuer Test der aktuellen Versionen von DragonDictate
und IBM ViaVoice |
In den BBB-Informationen 237 (Juli/August 1999), wurde über die beiden am meisten verbreiteten Spracherkennungsprogrammen DragonDictate NaturallySpeaking und IBM ViaVoice, Versionen 1998, berichtet.
Ein ergänzender Test der aktuellen Versionen bestätigt, dass die Leistungsfähigkeit sich erneut wesentlich verbessert hat.
Der Vergleich zwischen beiden Programmen fällt allerdings - auch nach den deutlichen Verbesserungen bei IBM - erneut zugunsten von DragonDictate NaturallySpeaking aus. Das liegt wohl daran, dass für wichtige Leistungsmerkmale Patentschutz besteht und IBM deshalb nur schwer aufholen kann.
Erkennungsleistung
Es besteht ein deutlicher Unterschied in der Erkennungsleistung. DragonDictate hat ein wesentlich größeres Vokabular, so dass die unterschiedlichen Wortformen, vor allem die Endungen, sowie die meisten Komposita weitgehend richtig erkannt werden. Damit sinkt die Fehlerquote und der Komfort steigt, weil Korrekturen lästig und zeitraubend sind und den Arbeitsfluß unterbrechen. |
Unverändert gelten die übrigen Vorteile für DragonDictate, die in dem früheren Bericht ermittelt worden sind und die hier noch einmal aktualisiert und im Überblick dargestellt werden:
Die wichtigsten Vorteile von DragonDictate |
Bildung von Komposita (zusammengesetzten Wörtern)
|
Schnelligkeit und Komfort von Korrekturen
|
Arbeitsfluß - Lernen im Hintergrund
|
Empfehlungen für den Einsatz
Gestiegenes Leistungsvermögen, verbesserter Benutzerkomfort und verringerte Trainingszeiten vor Nutzung der Programme vergrößern die Einsatzmöglichkeiten der Spracherkennung auf allen Arbeitsplätzen, bei denen Textproduktion in nennenswertem Umfang anfällt.
Ab einer Nutzungsintensität von drei Stunden Textproduktion pro Monat halte ich den Einsatz von DragonDictate für eindeutig wirtschaftlich - vorausgesetzt, der Nutzer ist bereit, die erforderliche Sprachdisziplin aufzubringen.
Computerdiktatprogramme in der
Bewertung: (August 1999)
Überlegungen zum Einsatz in der Bundesverwaltung
(Beitrag in den BBB-Informationen 237 (Juli/August 1999), überarbeitete Fassung) |
|
Ausgangslage des Vergleichs | Der Programmbewertung liegen folgende Voraussetzungen zugrunde: Beide Programme wurden vom Benutzer trainiert, das Arbeitsumfeld ist auf die Nutzung eines Computerdiktatprogramms ausgerichtet, der Benutzer ist geübt im Umgang mit den beiden Programmen und ein vorgegebener Fließtext diente als Diktatvorlage. Diese Bedingungen, verbunden mit einer konzentrierten Sprechweise unabdingbar für eine gute Spracherkennungsquote, bildeten die Voraussetzungen für die Tests. |
Arbeitsgeschwindigkeit: bis zu 900 Anschläge pro Minute | Mit den im Vergleichstest verwendeten Programmversionen 1998 konnten Arbeitsgeschwindigkeiten (Diktat einschließlich Korrektur) von 100 bis 200 Anschlägen pro Minute erreicht werden. Mit DragonDictate NaturallySpeaking, Version 1999, wurde im Einzelfall eine Erkennungsgeschwindigkeit von 900 "Anschlägen pro Minute" erreicht und eine Erkennungsgenauigkeit von über 98 Prozent: Von über 100 Wörtern wurden 2 falsch erkannt; die Korrektur war in beiden Fällen einfach und schnell per Sprachbefehl möglich. |
Hardware-Anforderungen | Um ein befriedigendes Zeitverhalten zu gewährleisten, ist eine leistungsfähige Hardware-Ausstattung zu empfehlen: mindestens Pentium II-Rechner 233 MHz mit 128 MB EDO-RAM. Dies ist von noch größerer Bedeutung, wenn nicht unmittelbar in das Computerdiktatprogramm diktiert werden soll, sondern in ein Textverarbeitungsprogramm. |
Vergleich Dragon / IBM: Dragon bringt 30% mehr Leistung |
Für Aufgabenbereiche mit umfangreichem Vokabular und eher komplexer Sprache hat DragonDictate NaturallySpeaking besser abgeschnitten als IBM ViaVoice. DragonDictate NaturallySpeaking erlaubt eine um mindestens 30% höhere Arbeitsgeschwindigkeit und bietet mehr Komfort bei geringerer Anstrengung. Für Einsatzgebiete mit begrenztem einheitlichem Wortschatz könnte IBM ViaVoice leistungsfähiger sein, was aber in weiteren Tests noch zu prüfen wäre. |
Korrekturen sind unvermeidlich.
Deshalb sind Schnelligkeit und Komfort bei der Korrektur entscheidend |
Um die Arbeitsgeschwindigkeit mit Computerdiktatprogrammen zu beurteilen, ist das Hauptaugenmerk auf den Korrekturaufwand und erst in zweiter Linie auf die Erkennungsquote zu legen. Die entscheidenden Unterschiede beim Korrekturaufwand liegen in der hierfür benötigten Zeit, im Komfort und in der damit verbundenen Anstrengung, Stichwort:"Ergonomie". Eine ergonomisch sinnvolle Arbeitsweise ist nur möglich, wenn auf einen ständigen Wechsel zwischen Diktat einereits und Korrektur über die Tastatur andererseits verzichtet werden kann; wenn also Änderungen per Sprachbefehl durchgeführt werden können. Die Erkennungsquote ist bei disziplinierter Sprechweise inzwischen aber so gut, dass der Sinn eines Diktats in aller Regel erkennbar bleibt und eine Korrektur in Entwürfen, Protokollen und Vermerken nur in den wenigsten Fällen erforderlich ist. Aus ergonomischer Sicht ist ein individuell einstellbares Kopfmikrofon unbedingt zu empfehlen: Der Nutzer kann entspannt vor dem Bildschirm sitzen und hat beide Hände frei, um bei Bedarf in seinen Papierunterlagen zu blättern. Zudem bietet ein Kopfmikrofon den Vorteil, dass Umgebungsgeräusche wie das Telefonklingeln oder eine Unterhaltung in unmittelbarer Nähe keinen Einfluss auf die Aufzeichnungsleistung des Programms hat. |
Formatierungen im normalen Textprogramm vornehmen | Formatierungen sollten weiterhin in einem (unter Windows laufenden) Textverarbeitungsprogramm vorgenommen werden, da DragonDictate und ViaVoice lediglich die Möglichkeit für einfache Formatierungen bieten. Die Gesamtsteuerung des jeweiligen Programms ist wohl nur ein Angebot für "Computerfreaks". Eine Überarbeitung im Textverarbeitungsprogramm ist allerdings ohnehin erforderlich, da die Computerdiktatprogramme keine automatische Silbentrennung und keine Überprüfung der Grammatik anbieten. Der Wechsel zum Textverarbeitungsprogramm, z. B. Word, ist bei DragonDictate wie auch bei ViaVoice unproblematisch. |
Lernen muß im Hintergrund stattfinden! | Ein wichtiger Vorteil von DragonDictate im Vergleich zu ViaVoice ist die sofortige Übernahme von neuen Wörtern, d.h.: DragonDictate "lernt" im Hintergrund, während bei ViaVoice das Diktat unterbrochen werden muss. Es ist also ein Wechsel zu Maus und Tastatur erforderlich, um im Text zu navigieren oder das Korrekturfenster zu öffnen. Erst dadurch werden z. B. unbekannte zusammengesetzte Wörter (Komposita) von ViaVoice als neue Wörter übernommen. |
Das Programm muss sinnvolle Alternativen bei Korrekturen anbieten | Bei der Korrektur eines Wortes bietet DragonDictate zudem sinnvolle Alternativen an, die man per Sprachbefehl auswählen kann. Zuletzt gesprochene Textteile können mit DragonDictate mit dem Sprachbefehl "Streiche das" gelöscht und durch neu diktierten Text ersetzt werden.. Die Arbeit mit ViaVoice wird auch dadurch erschwert, dass der gesprochene Text erst mit erheblicher Zeitverzögerung auf dem Bildschirm erscheint. |
Kriterien für die Auswahl eines Programms | Wer ein Computerdiktatprogramm einsetzen möchte, sollte bei der Auswahl eines geeigneten Programms folgende Kriterien berücksichtigen: |
|
|
Fortbildungsbedarf? | Das Fortbildungsangebot der Fachhochschule des Bundes zum Thema "Wirtschaftlicher Einsatz des Computerdiktats" hat bisher keine nennenswerte Resonanz gefunden.. Das mag daran liegen, dass es noch zu wenig Pilotanwender in der Bundesverwaltung gibt oder aber diese keinen Fortbildungsbedarf erkennen. Möglicherweise müssen Fortbildungsveranstaltungen zu diesem Thema neben Pilotanwendern auch potentiellen Anwendern zugänglich sein. |
Verantwortlich und ©
Copyright: Prof. Dr. Burkhardt
Krems
Köln, 2005-01-03.
Kontakt |
Impressum