GEISST

Generator für emotional individualisierbare Synthetik-Stimmen

Motivation

In der heutigen Medienproduktion fallen viele Ressourcen dafür an, dass Beiträge zunächst produziert und anschließend auch oft in Form von diversen Fassungen für unterschiedliche Plattformen weiterverarbeitet werden, zum Beispiel zu Kurzvideos auf TikTok und Instagram oder zu Postings auf LinkedIn. Dieser Prozess ist für jeden digitalen Kanal anders und verlangt oft eine größtenteils händische Anpassung von Inhalt und Optik als auch eine komplette Neuvertonung.

Ziele und Vorgehen

Ziel des Verbundvorhabens GEISST ist es, ein Generator für „emotional individualisierbare Synthetik-Stimmen“ zu entwickeln. Dieser soll Medienunternehmen in die Lage versetzen, die für die Umgestaltung des Beitrags anfallenden Sprachaufnahmen mittels individueller Stimmprofile und frei wählbarer Tonalität sowie Emotionalität automatisiert zu erstellen. Die dafür benötigten wissenschaftlichen und technischen Arbeiten befassen sich vor allem mit der KI-basierten Signalanalyse und Sprachsynthese. Die entwickelten Technologien sollen in einem Demonstrator zusammengeführt werden. Der Demonstrator soll anschließend mit dem assoziierten Projektpartner AUTO BILD evaluiert werden. Darüber hinaus werden auch ethische und rechtliche Aspekte sowie gesellschaftliche Auswirkungen und Risiken der Technologie beleuchtet, wie etwa die Gefahr durch Missbrauch von synthetisierten Stimmdaten oder auch die Rolle des Vertrauens in die Medien allgemein.

Innovationen und Perspektiven

Die Ergebnisse aus dem Vorhaben werden einen wesentlichen Beitrag dazu liefern, Medieninhalte effizienter gestalten zu können. Neben den Anwendungen im Medienbereich können die hier entwickelten Technologien auch in anderen Branchen eingesetzt werden. Denkbar ist ein Einsatz in der Medizin, z. B. eine Stimmprothese bei krankheitsbedingtem Stimmenverlust oder in Form von intelligenten Assistenzsystemen in diversen Konsumentenbereichen. Außerdem können die ethische und rechtliche Bewertung des Vorhabens als Referenz für weiterführende Vorhaben dienen.

Projektinformation

Projektleitung

nachtblau GmbH
Straßenbahnring 18
20251 Hamburg

Volumen

0,997 Mio. € (inkl. Projektpauschale für die beteiligte Hochschule)

Laufzeit

04/2023 – 09/2025

Projektpartnerinnen und -partner

Fraunhofer-Institut für Digitale Medientechnologie (FhG IDMT) Hochschule der Medien Stuttgart (HdM) – Institut für Digitale Ethik