Technik

Maschine schlägt Mensch LipNet liest besser Lippen als Profis

Lippenlesen.jpg

Schwierig ist vor allem, ganze Sätze von den Lippen abzulesen.

(Foto: imago/ZUMA Press)

In Großbritannien entwickeln Forscher eine Maschine, die besser Lippen lesen kann als ein Mensch. Das ist wesentlich schwerer als Sprache zu erkennen und daher wissenschaftlich eine kleine Sensation.

Forscher der University of Oxford haben eine Maschine entwickelt, die mithilfe von Googles Künstlicher Intelligenz (KI) "DeepMind" besser Lippenlesen kann als ein Mensch. "LipNet" greift auf Algorithmen zurück, die gesprochene Worte einer Person aus einem Video rein über das visuelle Erkennen der Lippenbewegungen erfassen. Nach einem Training mit knapp 29.000 Beispielen habe die Software sogar menschliche Konkurrenten überflügelt und eine Trefferquote von rund 93 Prozent erzielt, berichtet "Pressetext". "Erfahrene menschliche Lippenleser kommen lediglich auf eine Quote von 79,6 Prozent", sagen die Wissenschaftler.

Bislang sei es außerdem nur möglich gewesen, einzelne Wörter aber keine ganzen Sätze zu erkennen, so die Experten. Mit LipNet könne man aber nun endlich das erste System präsentieren, das die Fähigkeit besitzt, auch ganze Sätze von gesprochenen Wörtern zu erfassen.

Großes Potenzial

"Lippenlesen spielt eine wichtige Rolle, wenn es um die menschliche Kommunikation und das gegenseitige Verstehen von Sprache geht", schreiben die Forscher in ihrem wissenschaftlichen Papier zu LipNet. Die Forscher betonen aber nicht nur den hohen Stellenwert, sondern auch die enorme Schwierigkeit dieser Tätigkeit für Menschen. "Die Lippenbewegungen können oft sehr latent und schwer zu erkennen sein. Deshalb ist der Grad der erzielbaren Genauigkeit bei menschlichen Lippenlesern auch relativ niedrig", erklären die Wissenschaftler.

Aufgrund dieses Umstands sei es ein erklärtes Ziel des Teams gewesen, diesen Prozess zu automatisieren und gleichzeitig eine deutliche Steigerung der Genauigkeit zu erreichen. "Maschinelle Lippenleser haben ein riesiges Anwendungspotenzial etwa zur Verbesserung von Hörapparaten, für lautlose Diktate auf öffentlichen Plätzen, verdeckte Gespräche in lauten Umgebungen oder biometrische Identifizierungen", erläutern die Forscher. Zum jetzigen Zeitpunkt sei allerdings noch kein wirklich ausgereiftes Produkt am Markt erhältlich.

Quelle: n-tv.de, kwe/pte