Amazon Polly ersetzt Ivona Text-to-Speech Engine

Geschätzte Lesezeit: 2:17 min.

Text-to-Speech (TTS), also die automatische, computergenerierte Umwandlung und Ausgabe eines geschriebenen Textes in gesprochene Worte, war schon früh ein Teil von dedizierten eBook Readern. Amazon war einer der Vorreiter und hatte bereits vor einigen Jahren mit TTS experimentiert.

Im Jahr 2009 musste sich Amazon allerdings Kritik der amerikanischen Authors Guild gefallen lassen, dass der Versandriese kein Recht hätte, eBooks automatisch vorzulesen und so die Zahlung von Tantiemen umgehen würde. Zu der Zeit hatten Amazon eBook Reader noch eingebaute Lautsprecher, wie z.B. im Fall des Kindle Touch. Mit dem Start des ersten Kindle Paperwhite ging diese Ära zu Ende und Amazon verzichtete auf die entsprechende Funktionalität.

Text-to-Speech Comeback bei Amazon Echo und Kindle

Im Jahr 2017 feierte die Text-to-Speech Funktion am Kindle in abgewandelter Form ihr Comeback. Dabei stand die Einführung von Barrierefreiheit im Fokus, sodass der eReader auch von Menschen mit einer Sehbehinderung bedient werden kann.

Diese Funktion wurde von Amazons hauseigener IVONA Text-to-Speech Engine unterstützt. Den polnischen TTS-Spezialisten hatte der Versandriese bereits im Jahr 2013 übernommen. Wie sich später herausgestellt hat, stand dabei offensichtlich nicht (nur) Amazons Kindle im Fokus, sondern die Echo-Produkte, die mittlerweile einen integralen Teil von Amazons Produktstrategie darstellen.

Abseits der Textumwandlung integrierte Amazon schließlich auch den eigenen Audible Hörbuchservice in die Kindle-Modelle. Inzwischen ist die proprietäre Hörbuchunterstützung Teil aller aktuellen Amazon eReader.

In der Zwischenzeit wurde die sehr gute IVONA-Engine und die Sprachausgabe immer natürlicher. Gleichzeitig führte man dem Zeitgeist entsprechend auch eine Beta für einen cloudbasierten Service (IVONA Speech Cloud Beta) ein.

IVONA verabschiedet sich

Es dauerte dann noch ein wenig, bis Amazon Polly als Fortführung der Speech Cloud angekündigt wurde. Dabei stand auch maschinelles Lernen zur Weiterentwicklung im Vordergrund.

Text-to-Speech with Amazon Polly

Mit dem heurigen Jahr folgte dann schließlich auch markenseitig die vollständige Umstellung. IVONA ist mittlerweile aus dem Amazon Angebot verschwunden und wurde durch Amazon Polly ersetzt. Die Webseite des polnischen Unternehmens verweist in einem kurzen Text-Statement auf den neuen Service. Außerdem wird auf das polinischen Entwicklungszentrum verwiesen, wo der Dienst weiterhin entwickelt wird.

Man darf gespannt sein, welche Auswirkungen diese Umstellung auf bisherige IVONA-Partner haben wird. Auf der Amazon Polly Webseite ist lediglich eine nutzungsabhängige Preisstruktur zu finden. Ein vollständiges Offline-Angebot scheint es demnach nicht mehr zu geben.

Im eReader-Sektor nutzt bisher auch PocketBook die IVONA-TTS-Engine. Gerätebesitzer können sich Texte automatisch vorlesen lassen und verschiedene Sprachen und Stimmen selbst herunterladen. Sofern PocketBook eine unbefristete Lizenz zur IVONA-Nutzung besitzt, dürfte es kein Problem geben (abgesehen von der fehlenden Weiterentwicklung), wenn diese zeitlich befristet ist, dann scheint Amazon Polly nach derzeitigem Kenntnisstand aufgrund des Preismodells keine passende Alternative zu sein.