Meet the Innovators: Alexandru Jerpelea über sein Übersetzungstool zur Erhaltung des Aromunischen
12.11.2024Alexandru Jerpelea, ein 17-jähriger Schüler aus der rumänischen Hauptstadt Bukarest, hat das erste neuronale maschinelle Übersetzungssystem für Aromunisch, eine von etwa 200.000 Menschen auf dem Balkan gesprochene Minderheitensprache, entwickelt. Sein bahnbrechendes Tool, zugänglich über AroTranslate.com, ermöglicht Übersetzungen zwischen Aromunisch und Rumänisch, Aromunisch und Englisch sowie Englisch und Rumänisch. Alexandrus Leidenschaft für Computerlinguistik hat in Rumänien nationale Aufmerksamkeit erregt, und Medien berichten über seine bedeutende Arbeit. In diesem Interview spricht Alexandru, der auch als Redner beim bevorstehenden 8. Forum der Europäischen Minderheitenregionen (26.–27. November 2024 in San Sebastián/Donostia, Baskenland) auftreten wird, über die Inspiration hinter seinem Projekt, die Herausforderungen, denen er begegnete, sowie die Bedeutung seiner Initiative für den Erhalt des Aromunischen.
Alexandru, könntest du kurz erklären, was genau du erfunden hast und wie es der aromunischen Sprache zugutekommt?
Gemeinsam mit Sergiu Nisioi von der Universität Bukarest sowie mit Unterstützung der aromunischen Gemeinschaft in Rumänien und anderen Ländern – insbesondere mit Hilfe von Florentina Costea, die mich der Gemeinschaft vorstellte – haben wir das erste neuronale maschinelle Übersetzungssystem für Aromunisch, eine balkanromanische Sprache, geschaffen. Das Projekt erforderte den Aufbau eines Datensatzes von über 80.000 rumänisch-aromunischen Satzpaaren, die aus verschiedenen Quellen gesammelt wurden, sowie eine auf Aromunisch zugeschnittene Datensammlungspipeline. Dieses von KI angetriebene Übersetzungstool zielt darauf ab, Aromunisch zugänglicher zu machen. Weitere technische Details des Projekts findet man in unserer Veröffentlichung: https://arxiv.org/abs/2410.17728.
Was hat dich dazu inspiriert, das erste maschinelle Übersetzungssystem für Aromunisch zu entwickeln?
Meine Inspiration kam vom Selbststudium der Computerlinguistik sowie vom Beobachten anderer maschineller Übersetzungsprojekte für gefährdete Sprachen wie Sami und Cherokee. Diese Bemühungen für andere Sprachen haben mich dazu motiviert, etwas Ähnliches für Aromunisch zu schaffen.
Was bedeutet es für dich, einen so bedeutenden Beitrag zur Erhaltung der aromunischen Sprache zu leisten?
Ich bin stolz darauf, dass dieses Projekt Aufmerksamkeit für die Erhaltung des Aromunischen geweckt hat. Onlineartikel und Social-Media-Beiträge helfen dabei, das Bewusstsein in der Öffentlichkeit zu schärfen. Im Hinblick auf die akademische Welt hoffe ich, dass unser Korpus mehr Forschung zur Digitalisierung des Aromunischen anregen wird. Obwohl unser Projekt ein bedeutender Schritt nach vorn ist, bleibt es ein Prototyp mit Einschränkungen, und das Aromunische steht weiterhin vor Herausforderungen. Obwohl dieses Projekt allein die Sprache nicht „retten“ wird, hoffe ich, dass wir einen Schritt in die richtige Richtung unternommen haben.
Welche Herausforderungen hast du bei der Entwicklung dieses Übersetzungssystems erlebt?
Die größte Herausforderung war die Datensammlung. Obwohl unser Korpus (Datensatz) der größte seiner Art für Aromunisch ist, ist er im Vergleich zu ressourcenreichen Sprachen, die oft Datensätze mit Millionen oder sogar Milliarden von Sätzen haben, immer noch recht klein. Wir beabsichtigen, darauf aufzubauen und dies zu verbessern.
Welche Reaktionen hast du von der aromunischen Gemeinschaft auf deine Erfindung erhalten? Wie haben die Medien in Rumänien auf deine Arbeit reagiert?
Die aromunische Gemeinschaft war sehr begeistert und bot konstruktives Feedback zu den Fehlern der Software, was sehr wertvoll war. Große rumänische Medien haben unser Projekt vorgestellt, was auch bei Nicht-Aromunisch-Sprechern Begeisterung auslöste. Wir haben Nachrichten von Menschen erhalten, die sich der Situation der Sprache nicht bewusst waren, und wir sind froh, helfen zu können, das Bewusstsein für ihre Herausforderungen zu schärfen.
Was sind deine Pläne für zukünftige Projekte im Bereich der Sprachtechnologie?
Nächstes Jahr werde ich mit der Universität beginnen; ich habe vor, das Studium des NLP (Natural Language Processing) fortzusetzen und zu weiteren Projekten für Sprachen mit geringen Ressourcen beizutragen. Sobald das Zulassungsverfahren für die Universität abgeschlossen ist, werde ich mich wieder der Weiterentwicklung des aromunischen Übersetzungssystems widmen.
Weitere Informationen zu Alexanders Arbeit:
- AroTranslate – Aromanian Machine Translator: Erkunden Sie Alexanders Tool, das Übersetzungen zwischen Aromunisch und Rumänisch, Aromunisch und Englisch sowie Englisch und Rumänisch ermöglicht.
- Digi 24-Interview auf YouTube: Sehen Sie sich Alexanders Fernsehinterview an, in dem er Einblicke in die Entwicklung seines Tools gibt (auf Rumänisch).
- Libertatea-Artikel: Lesen Sie einen Artikel über Alexanders Projekt, in dem die Reaktionen der aromunischen Gemeinschaft und die Bedeutung der Initiative hervorgehoben werden (auf Rumänisch).
Pressemitteilungen
- Türkische FUEN-Mitgliedsorganisationen beim UN-Forum für Minderheitenfragen
- Europäisches Dialogforum der FUEN nahm an der 17. Sitzung des UN-Forums für Minderheitenfragen teil
- 8. Forum der Europäischen Minderheitenregionen: Tag Zwei thematisiert die Rolle von Minderheitensprachen in Unterhaltung und Medien
- 8. Forum der Europäischen Minderheitenregionen: Über die Rolle von Minderheitensprachen im digitalen Zeitalter
- Das 8. Forum der Europäischen Minderheitenregionen startet morgen – Verfolgen Sie die Diskussionen live auf YouTube!
- Die FUEN ruft die EU-Abgeordneten dazu auf, die Wiederherstellung der Intergruppe für Minderheiten zu unterstützen
- Interview: Elizabete Krivcova über ihre Rolle als Fürsprecherin für Minderheitenrechte in Lettland
- Teilnehmerinnen und Teilnehmer des 27. AGSM-Seminars sehen Extremismus als akute Gefahr
- Interview: Christina Gestrin über digitale Herausforderungen und Chancen für Schwedisch in Finnland
- Meet the Innovators: Iona Mercer und Mirren Buchanan über die Revolutionierung des Gälischlernens mit „SpeakGaelic“