Sorge vor politischem Missbrauch: OpenAI schafft Software zum Klonen von Stimmen

Wirtschaft

Sorge vor politischem MissbrauchOpenAI schafft Software zum Klonen von Stimmen

30.03.2024, 14:16 Uhr

Folgen auf:

Künstliche Intelligenz kann schreiben, Bilder und Videos erzeugen, sprechen und bald Stimmen klonen. Dafür reiche eine 15-sekündige Aufnahme, sagen die ChatGPT-Erfinder von OpenAI über ihre jüngste Entwicklung. Aus Sicherheitsgründen lassen sie offen, wann die Software für die breite Öffentlichkeit nutzbar wird.

Der ChatGPT-Entwickler OpenAI arbeitet an einer Software zum Klonen menschlicher Stimmen - hält sie wegen Sorgen vor Missbrauch aber vorerst zurück. "Voice Engine verwendet Texteingaben und eine lediglich 15-sekündige Audioprobe, um natürlich klingende Sprache zu erzeugen, die dem Originalsprecher sehr ähnlich ist", schreibt der US-Konzern in einem Blog-Eintrag. OpenAI arbeite seit 2022 an dem Programm, unter anderem um Software zu verfeinern, die Text in Sprache umwandelt.

Ob und wann Voice Engine für die breite Öffentlichkeit nutzbar wird, ist offen. Gerade in einem Wahljahr berge eine solche Anwendung erhebliche Risiken, schreibt OpenAI. Wegen möglichen Missbrauchs gehe der Konzern deshalb "behutsam und sachkundig" an die Frage einer Freigabe heran. OpenAI erhoffe sich einen Diskurs über Chancen und Risiken der Technologie und wolle weitere Tests durchführen.

Im Januar hatten fingierte Anrufe Angst vor Manipulationen mithilfe Künstlicher Intelligenz im Rennen ums Weiße Haus geschürt. In automatisierten Anrufen hatte eine Stimme, die der von US-Präsident Joe Biden zum Verwechseln ähnlich klang, Demokraten in New Hampshire dazu aufgerufen, nicht an den Vorwahlen teilzunehmen. Solche sogenannten Robocalls sind ein gängiges Wahlkampf-Instrument in den USA.

Mehr Reichweite für Videos?

OpenAI verwies in seiner Mitteilung aber auch auf die Chancen der Anwendung. Mit einem Partner habe OpenAI daran geforscht, wie die synthetischen Stimmen beim Lesenlernen unterstützen können. Potenzial habe Voice Engine außerdem beim Übersetzen etwa von Videos und Podcasts, die anschließend ein breiteres Publikum erreichen könnten. Wichtig sei in jedem Fall, dass sich die geklonte Stimme zuvor als KI-generiert zu erkennen gebe.

Auch ntv.de setzt bereits seit zwei Jahren synthetische Stimmen ein, die geschriebene Texte vorlesen: In einem Innovationsprojekt wurde unter anderem die Stimme von RTL-Moderator Maik Meuser mithilfe einer selbstlernenden Sprach-Technologie von Microsoft künstlich nachgebildet. Um Missbrauch zu verhindern, wird bei dem Einsatz der Stimmen ein strenger "Code Of Ethics" beachtet: Die Technologie darf nur eingesetzt werden, wenn sie für Nutzerinnen und Nutzer von ntv.de als solche erkennbar ist. Ausgeschlossen sind alle Inhalte, die Meinungsbildung manipulativ beeinflussen können. Zudem werden Stimmen von Politikern nicht synthetisiert.

Quelle: ntv.de, chr/dpa

ChatGPT Künstliche Intelligenz