Mozilla: Die eigene Stimme spenden

Die Tech-Giganten Amazon, Apple, Google und Microsoft treiben die Entwicklung der Spracherkennung immer weiter voran. Damit Sprachdatenbanken, die hinter solchen Anwendungen stecken, auch für kleinere Entwickler zugänglich sind, um neue Apps zu programmieren, hat Mozilla das „Project Common Voice“ ins Leben gerufen.

Studententarife© nenetus / Fotolia.com
19.07.2017, 17:46 Uhr

Sprachassistenten erfreuen sich wachsender Beliebtheit. Siri wohnt im iPhone und ab Ende des Jahres auch im HomePod, Cortana in jedem Windows 10 PC, Alexas Eigenheim heißt Echo, aber sie wird auch Untermieterin bei Ford und im HTC U11 und Googles Assistent ist ab 8. August endlich auch in Deutschland anzutreffen. Alle diese Programme haben einen langen Entwicklungs- und Lernprozess hinter sich gebracht.

Als wir 2011 die Sprachassistenten testeten, führten diese noch recht simple Tätigkeiten aus und waren in ihrem Funktionsumfang noch sehr eingeschränkt. Jahre später haben die großen Technik-Konzerne aus den bisher aufgelaufenen Fragen, Befehlen und Wutanfällen gelernt und ihre Sprachassistenten weiterentwickelt. Sie haben umgangssprachliche Redewendungen und Dialekte gelernt, sind viel tiefer in das System des Smartphones, des PC oder der eigens für sie produzierten Hardware integriert und lesen nicht mehr nur den Wetterbericht vor, sondern steuern damit das Smart Home, Autos und die Informationen, die sie für uns heraussuchen.

Sprachdatenbank als Bibliothek für neue Assistenten-Apps

Diese Systeme sind mit der Zeit immer schlauer geworden. Mozilla befürchtet aber, dass das Wissen, um Spracherkennung immer besser zu machen, bei den großen Tech-Firmen verbleibt, und somit „die nächste Welle der Innovatoren außen vor bleibt“. Schon heute erkennt „Bixby“, der Assistent von Samsung, Befehle im Kontext, liest Alexa nur Schlagzeilen von Medien vor, die wir in unsere Filterbubble lassen oder führt Googles Assistent Dialoge mit seinesgleichen, wenn man ein zweites Gerät daneben stellt.

Live-Video von seebotschat auf www.twitch.tv anzeigen

Auf der Webseite des “Project Common Voice” oder per iPhone App kann man nun seine eigene Stimme spenden. Indem vorgegebene Textpassagen vorgelesen und dann als Audio-Datei gespeichert werden, die andere User wiederum auf ihre Richtigkeit überprüfen, soll eine Datenbank mit 10.000 Stunden Sprachaufnahmen entstehen, die Ende des Jahres jedermann zur Verfügung gestellt werden soll