KI für das Ostfriesische Platt
Von Thilo Wilts
Künstliche Intelligenz ist aus unserem heutigen Tag kaum noch wegzudenken. In vielen Haushalten steht eine Alexa von Amazon oder eine Siri von Apple wartet darauf, uns wieder einmal einen Witz erzählen zu können. Doch das sind nur die sichtbaren Dinge, vieles spielt sich im Hintergrund ab. Zum Beispiel, wenn ein Text auf einem Smartphone in einem Messenger Programm wie WhatsApp geschrieben wird. KI hilft uns, unsere Fehler zu korrigieren und schlägt Worte vor, die wir wahrscheinlich als nächstes schreiben werden. Bisher war die Möglichkeit, dies zu Nutzen, nur auf Sprachen wie Deutsch, Englisch oder auch Niederländisch beschränkt.
Wir arbeiten aktiv an einer KI, die uns bei der Korrektur, der automatischen Vervollständigung und Vorhersage von Wörtern im Ostfriesischen Platt unterstützt. Dazu greifen wir auf Texte von unserem Vereinsmitglied Onno Feldmann zurück, der bereits E-books in Ostfriesischem Platt veröffentlich hat. Eine weitere Quelle ist das ebenfalls von ihm betriebene Wörterbuch (oostfraeisk.org). Die KI liest die Texte und findet automatisch häufig zusammen vorkommende Worte. Dafür wird ein großer Teil des Satzgefüges untersucht und nicht nur naiv auf einzelne Wortzusammenhänge geschaut.
Technisch wird hierfür ein so genanntes Long short-term memory (LSTM) Netz, eine besondere Form eines neuronalen Netzes, trainiert. LSTM zeichnen sich dadurch aus, dass sie besonders gut für Anwendungsfälle dieser Art in der Linguistik eingesetzt werden können.
Das aktuelle Problem ist die geringe Datenbasis. Auch wenn die zuvor erwähnten E-books ein guter Einstiegspunkt sind, da sie aus natürlicher Sprache bestehen, reichen diese noch nicht aus, um ein wirklich gutes LSTM zu erstellen, das zuverlässige Vorhersagen trifft. LSTM müssen in der Regel mit einer großen Datenmenge aus natürlich sprachlichen Texten trainiert werden, von der sie die Struktur der Sprache lernen können.
Aktuell erreichen wir eine Genauigkeit von ~60% (Stand: Oktober 2020). Die ist für den Anfang kein schlechtes Ergebnis. Aber damit geben wir uns noch nicht zufrieden. Wir arbeiten kontinuierlich an der Verbesserung des LSTM. Unser Ziel ist es, das Ostfriesische Platt, auch mit Hilfe von künstlicher Intelligenz, weiter zu stärken und mehr Menschen zugänglich zu machen. Bei Fragen können Sie uns gerne kontaktieren unter vorstand@jungfraeiske-maeinskup.frl