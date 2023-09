Rezepte, Gute-Nacht-Geschichten, Reisetipps: Der Chatbot ChatGPT soll bald auch auf Spracheingaben und hochgeladene Fotos reagieren können. Dies soll eine barrierefreie und kreativere Nutzung ermöglichen. Auch Spotify möchte das neue Angebot nutzen.

Bisher konnten sich Nutzende nur per Tastatur mit dem Chatbot ChatGPT unterhalten, künftig könnte ein richtiges Gespräch möglich sein. Dafür soll das Programm nach einem Update auf Spracheingaben und hochgeladene Fotos reagieren, wie die Entwicklerfirma der Künstlichen Intelligenz, OpenAI, mitteilte.

Die neue Technologie öffne Türen zu vielen kreativen und auf Barrierefreiheit ausgerichteten Anwendungen, hieß es. Das Angebot soll zunächst nur für kostenpflichtige Versionen des Programms verfügbar sein. Nutzerinnen und Nutzer könnten "bei einer Reise ein Foto knipsen", es auf die Plattform laden und sich dann über Besonderheiten der Gegend unterhalten, erklärte das Unternehmen. Auf Fotos des Kühlschrankinhalts könne die KI mit Rezeptvorschlägen reagieren und selbst für Gute-Nacht-Geschichten lasse sich die Sprachfunktion des Programms nutzen.

Für mehr Realismus in den Gesprächen arbeitete OpenAI den Angaben zufolge mit Synchronsprecherinnen und -sprechern zusammengearbeitet. Die Funktionen sollen in den kommenden Wochen zunächst für ChatGPT-Plus- und Enterprise-Nutzende eingeführt werden und dann sowohl für Smartphones mit Apple-Betriebssystem als auch für Android-Geräte zur Verfügung stehen. Zeitgleich kündigte der schwedische Streamingdienst Spotify an, die OpenAI-Technologie zu nutzen, um Podcasts in verschiedene Sprachen zu übersetzen.

Dabei würden Stimme und Sprachstil der Originalversion beibehalten. Zunächst sollen englischsprachige Podcasts auf Spanisch, Französisch und Deutsch übersetzt werden. Generative KI-Programme wie ChatGPT wurden der Öffentlichkeit erstmals vor knapp einem Jahr zugänglich gemacht. Sie sind beispielsweise in der Lage Essays, Gedichte oder Unterhaltungen aus sehr kurzen Eingabeaufforderungen der Nutzenden zu generieren.