Spracherkennung Wie mein Handy mich versteht

Das erste Spracherkennungssystem von IBM beherrschte vor 50 Jahren genau 16 Worte. Heute lassen sich mit intelligenter Software nicht nur Texte mit erstaunlich wenig Fehlern diktieren, sondern auch Smartphones oder Navigationssysteme bedienen.

Aus dem Arbeitsalltag vieler Rechtsanwälte und Ärzte sind Spracherkennungssysteme schon seit geraumer Zeit nicht mehr wegzudenken. Aber nicht nur in Kanzleien, Kliniken und Praxen werden Diktate heute digital verarbeitet und mit Hilfe von Software in geschriebenen Text umgewandelt.

Aktuelle Programme wie Dragon NaturallySpeaking 11.5 richten sich ausdrücklich auch an Anwender, die nur gelegentlich einen Text verfassen müssen oder schnell einen Eintrag auf Facebook platzieren möchten. Außerdem erobert die Spracherkennung die Smartphones und Tablet Computer.

Noch vor der Entwicklung der ersten PCs versuchte IBM, Systeme für die maschinelle Erkennung gesprochener Sprache zu entwickeln. Die "IBM Shoebox" aus dem Jahr 1961 erkannte jedoch nur 16 Worte: die Zahlen von Null bis Neun und außerdem die mathematischen Anweisungen "minus", "plus", "subtotal", "total", "false" und "of".

Englischsprachige Rechenaufgabe

Damit konnte das System aber immerhin die englischsprachige Rechenaufgabe "Five plus three plus eight plus six plus four minus nine, total" verstehen und die korrekte Antwort "17" ausspucken. IBM gehörte auch in den 80er und 90er Jahren mit ViaVoice zu den führenden Anbietern von Spracherkennungsprogrammen, fokussierte sich dann aber auf große gewerbliche Anwendungen, wie sie beispielsweise in Call Centern zum Einsatz kommen.

Die ViaVoice-Technologie für Privatanwender und kleinere Unternehmen landete bei Nuance, dem Hersteller der Dragon-Programme. Das Thema Spracherkennung auf dem PC oder Mac ist heute unauflösbar mit dem Unternehmen Nuance und seiner Marke Dragon verbunden. Auch Spracherkennungstechnologie des europäischen Elektronikriesen Philips landete dort.

Neben der Windows-Programmfamilie Dragon NaturallySpeaking bietet Nuance inzwischen eine Lösung für das Macintosh-System von Apple (Dragon Dictate 2.5) an. Im Umfeld des Dragon-Anbieters Nuance bieten spezialisierte Integratoren umfangreiche Lösungspakete, die auf einer Schnittstelle zu der Nuance-Technologie aufsetzen.

Das sind zum Beispiel Workflows von Diktaten in einer Großklinik oder in der hessischen Justiz. Die Technologie von Nuance wird auch von etlichen Autoherstellern verwendet. Auf der Technikmesse IFA präsentiert beispielsweise Ford seine Lösungen auf der Basis der Nuance-Schnittstelle. Im Auto geht es darum, das Mobiltelefon ohne unfallträchtige Fummelei zu bedienen oder das Navigationssystem kurz und knapp anzuweisen, dass man nach Hause fahren möchte.