Regionalnachrichten

Rheinland-Pfalz & SaarlandStudie: Künstliche Intelligenz scheitert an "Meenzerisch"

18.05.2026, 19:22 Uhr
Ein-Forschungsteam-hat-sich-mit-KI-und-dem-Mainzer-Dialekt-auseinandergesetzt

Künstliche Intelligenz tut sich laut einer Studie schwer mit dem Mainzer Dialekt. Forscher nennen Gründe, woran das liegen könnte und warum es aus ihrer Sicht auch kulturpolitisch bedeutsam ist.

Mainz (dpa/lrs) - Künstliche Intelligenz hat einer aktuellen Studie zufolge offenbar große Probleme mit dem Mainzer Dialekt. Zu diesem Ergebnis kommt ein von der Johannes Gutenberg-Universität (JGU) Mainz geleitetes Forschungsteam. Demnach verstehen aktuelle KI-Modelle Wörter des sogenannten Meenzerisch häufig nicht oder deuten sie falsch.

"Sprachvarianten wie Meenzerisch sind ein wichtiger Teil kultureller Identität, verschwinden aber gleichzeitig aus dem alltäglichen Gebrauch", sagte Minh Duc Bui vom Institut für Informatik der JGU, der die Studie zusammen mit Katharina von der Wense leitete, laut einer Mitteilung. "In der digitalen Sprachforschung werden regionale Dialekte bisher kaum berücksichtigt."

KI mit Wörterbuch gefüttert

Für die Untersuchung digitalisierte ein Forschungsteam ein Mainzer Dialektwörterbuch aus dem Jahr 1966. Daraus entstand nach Angaben der Wissenschaftler ein maschinenlesbares Lexikon mit 2.351 Dialektwörtern und ihren hochdeutschen Bedeutungen.

Anschließend testeten die Forschenden mehrere frei verfügbare Sprachmodelle unterschiedlicher Größe. Diese sollten einerseits die Bedeutung von Dialektwörtern erklären und andererseits aus hochdeutschen Definitionen die passenden Begriffe im Mainzer Dialekt erzeugen.

Geringe Trefferquote

Das Ergebnis: "Die getesteten Modelle scheitern sowohl beim Verstehen als auch beim Produzieren des Dialekts", sagte Bui. Beim Erklären von Wörtern hätten die Modelle im Schnitt nur eine Trefferquote von 4,24 Prozent erreicht. Beim Erzeugen von Dialektbegriffen aus Definitionen habe die Genauigkeit sogar nur bei 0,56 Prozent gelegen.

Ko-Autor Peter Herbert Kann von der Philipps-Universität Marburg sieht darin auch ein kulturpolitisches Problem. "Das ist aus technischer Sicht interessant, zeigt aber auch, wie schnell kleinere Sprachformen in digitalen Anwendungen unsichtbar werden können", sagte er laut Mitteilung.

Nach Einschätzung der Forschenden liegt eine Ursache darin, dass Dialekte überwiegend gesprochen werden und deshalb nur wenige digitale Textdaten existieren. Langfristig seien spezielle Datensätze und neue Trainingsmethoden nötig, um regionale Sprachvarianten besser in KI-Systeme einzubinden.

Quelle: dpa

Regionales