"Vergiss deinen Regenmantel nicht!" antwortet die Sprachsteuerung Siri von Apple auf die Frage nach dem Wetter. Intelligente Sprachsteuerung verändert das Bild vom dummen Computer.
Zugegeben: Die Stimme klingt noch immer ein bisschen so, wie man sich Computer landläufig vorstellt: Super zum Knacken riesiger Zahlenkolonnen, aber ungeeignet für alles, was mit dem richtigen Leben zu tun hat. Blechtrottel eben. Doch die enormen Leistungssteigerungen, die es im Bereich der Computerchips gegeben hat, und das Internet machen mittlerweile Anwendungen massentauglich, die früher höchstens Supercomputer bewältigen konnten.
Anzeige
Der Dienst Siri etwa, der in Apples neuem iPhone 4s in einer noch vorläufigen Version zum Einsatz kommt und dem die etwas maschinell klingende Stimme gehört, könnte mit einigen anderen neuen Entwicklungen dazu beitragen, das allgemeine Bild vom stupiden Zahlenfresser nachhaltig zu verändern.
"Vergiss deinen Regenmantel nicht" - Antworten wie diese gibt Siri auf Fragen, wie man sie sowohl in der Formulierung wie in der Aussprache auch seinem Partner stellen könnte: "Wie wird denn das Wetter morgen?" Weil Siri auf einen Riesenfundus an Daten aus dem Internet zurückgreift, liefert der Dienst natürlich auch gleich noch eine Wetterkarte samt Temperaturprognosen mit.
Doch er kann noch mehr. Mit ihm lassen sich sprachgesteuert auch Kurznachrichten oder E-Mails versenden. Siri ist dabei intelligent genug, Zusammenhänge zu verstehen. Er fragt gar nicht erst nach, ob man das Wetter in Honolulu oder München wissen will, sondern guckt von sich aus nach dem Standort des Handys.
Ähnlich ist auch der Ansatz beim System Sync, das der Autobauer Ford nächsten Jahr in seinem Mittelklasse-Wagen Focus anbieten wird. Anstatt sich Befehle merken zu müssen und unnatürlich abgehackt zu sprechen, kann man (fast) so reden, wie einem der Schnabel gewachsen ist. Nur im Falle allzu dialektgefärbter Aussprache müssen die Systeme auch heute noch meistens kapitulieren.
Es ist für die Systeme ohnehin schwierig genug, den Redefluss, wie er sich im natürlichen Sprechen ergibt, überhaupt erst einmal in die Abschnitte zu unterteilen, die einzelne Wörter sein könnten. Bei den beiden beispielhaft beschriebenen Systemen macht das die Cloud - ein übers Internet angesteuerter Verbund von Rechnern. Erst deren geballte, parallel arbeitende Rechenkraft macht es möglich, schon kurz nach der Eingabe zu Hypothesen darüber zu kommen, was der Sprecher gesagt haben könnte.
Es ist nämlich eine Mischung aus Wahrscheinlichkeitsrechnung und Datenbank-Abfragen, die dabei zum Einsatz kommt. Wirklich verstehen kann der Computer Sprache nicht. Sprachmuster, die das System erkennt, werden mit denen bereits gespeicherter Muster verglichen.
Deshalb funktionieren Spracherkennungssysteme, die sich auf ein begrenztes Vokabular beziehen, schon sehr gut. So gibt es beispielsweise ein solches System für Röntgenärzte, die damit mit den Händen auf den Bildern herumdeuten und gleichzeitig den Befund diktieren können.
- Apple stellt iPhone 4S vor Das iPhone kann jetzt sprechen 04.10.2011
- Neues Smartphone iPhone 4S macht Apple zum Getriebenen 05.10.2011
- Webcams als Diebstahlschutz Mann erwischt Einbrecher aus 8000 Kilometer Entfernung 23.11.2011
- Digital-Möbel "Surface" Microsoft kündigt Comeback des Tisch-Computers an 19.11.2011
- Arthur Levinson wird Apple-Verwaltungsratschef Noch ein Nachfolger für Steve Jobs 16.11.2011
(SZ vom 10.10.2011/mri)
Oh Mann, dieser Apple-Hype nervt mittlerweile nur noch. Da kaufen die eine Firma und bauen deren Know-How ein. Ein Know-How, das, wie der Artikel sagt, auch in anderen Systemen schon integriert ist. So kann z.B. das Samsung Galaxy auch schon per Sprachsteuerung "von sich aus nach dem Standort des Handys" gucken und Restaurants finden. Diese Hype-Spracherkennung ist lediglich eine Weiterentwicklung längst bekannter Systeme. Aber weil es von Apple kommt, wird wieder so getan als hätte Apple die Welt neu erfunden. Auch wenn der Artikel eine Verallgemeinerung vortäuscht, geht es ja im Kern doch nur um Apple. Es nervt!
"So gibt es beispielsweise ein solches System für Röntgenärzte,...und gleichzeitig den Befund diktieren können."
Gibt es in brauchbarer Form ja erst seit Minimum 15 Jahren. (Tipp: Google Ads rechts unten auf der Seite). und das kann das Iphone nun auch - ich bin sprachlos! Obwohl - dann bringt's ja gar nichts.
"Spracherkennungssysteme, ... beispielsweise ein solches System für Röntgenärzte, die damit mit den Händen auf den Bildern herumdeuten und gleichzeitig den Befund diktieren können."
---------
Wie kann man mit einem Spracherkennungssystem "Hände herumdeuten"