KI trainieren, um die telefonischen Nachrichten der Mutter zu übersetzen

Bildrechte
Bonaventure Dossou

Bildbeschreibung

Bonaventure Dossou arbeitet an einem KI-Modell, um Fon ins Französische zu übersetzen

Bonaventure Dossou hat viel darüber nachgedacht, wie man Telefongespräche mit seiner Mutter verbessern kann.

Sie sendet ihm oft Sprachnachrichten in Fon, einer beninischen Sprache, während er in Russland studiert. Er versteht jedoch einige der Sätze, die sie verwendet, nicht.

"Meine Mutter kann Fon nicht schreiben und ich spreche die Sprache nicht sehr gut, aber ich spreche fließend Französisch", sagte Dossou gegenüber der BBC.

"Ich bitte meine Schwester häufig, mir zu helfen, einige der Sätze zu verstehen, die meine Mutter verwendet", sagte er.

Eine Frau, die auf einem Motorrad fährt

Getty

Fon Sätze in EnglischQuelle: Bonaventure Dossou

Eine Verbesserung seines Fon durch Lernen kommt nicht in Frage, da es wie Hunderte anderer afrikanischer Sprachen meistens gesprochen und selten dokumentiert wird, so dass es nur wenige, wenn überhaupt, Bücher gibt, die Grammatik und Syntax lehren.

Aus Neugier und basierend auf Daten, die aus einer Bibel von Fon zu French Jehovah Witness stammen, entwickelten Herr Dossou und Chris Emezue, ein nigerianischer Freund, ein Übersetzungsmodell für künstliche Intelligenz (KI), ähnlich wie Google Translate, das sie FFR nannten. Es ist noch in Arbeit.

Die beiden Studenten gehören zu mehreren KI-Forschern, die afrikanische Sprachen in Natural Language Processing (NLP) verwenden, einem Zweig der KI, der Computer unterrichtet und ihnen hilft, menschliche Sprachen zu verstehen.

Wäre die Welt nach der Covid-19-Pandemie nicht zum Stillstand gekommen, hätten Herr Dossou und Herr Emezue ihre Kreation Hunderten von Teilnehmern bei vorgestellt eine der weltweit größten KI-Konferenzen, ICLR, in der äthiopischen Hauptstadt Addis Abeba diese Woche.

Es wäre das erste Mal gewesen, dass die Veranstaltung in Afrika stattfand.

Anstatt die Veranstaltung abzusagen, beschlossen die Organisatoren, sie virtuell abzuhalten.

Sie könnten auch interessiert sein an:

KI-Innovationen wurden als Treiber der sogenannten vierten industriellen Revolution herausgestellt, die fast jeden Aspekt unseres Lebens radikal verändern wird, einschließlich unserer Arbeitsweise.

Einige Analysten haben Big Data, das KI-Systeme antreibt, als neues Öl bezeichnet.

Derzeit wird Afrika als verlierend angesehen, wenn es darum geht, die KI-Zukunft mitzugestalten, da die Mehrheit der geschätzten 2.000 Sprachen des Kontinents als "mit geringen Ressourcen" eingestuft wird, was bedeutet, dass es an Daten über sie und / oder was ist verfügbar wurde nicht indiziert und in nützlichen Formaten gespeichert.

Behebung der Sprachlücke

Afrikanische Sprachen werden beim Erstellen von NLP-Anwendungen wie Sprachassistenten, Bilderkennungssoftware, Verkehrswarnsystemen und anderen nicht berücksichtigt.

Aber afrikanische Forscher arbeiten daran, dieses Handicap zu beseitigen.

"Wir konzentrieren uns darauf, Afrika auf die NLP- und AI-Forschungskarte zu setzen", sagte Dr. Ignatius Ezeani von der University of Lancaster gegenüber der BBC.

"Wenn Ihre Sprachressourcen nicht öffentlich verfügbar, kostenlos und offen sind, verfügen die Forscher nicht über die Daten für kreative Lösungen im laufenden Betrieb. Wir müssen uns beispielsweise immer auf Google verlassen, um die Richtung der Forschung zu bestimmen", sagte Dr. Ezeani.

Bildrechte
Ignatius Ezeani

Bildbeschreibung

Dr. Ezeani arbeitet an einem maschinellen Übersetzungsprojekt von Igbo ins Englische

Die Konferenz in Äthiopien sollte eine große Sache für afrikanische Forscher sein, denen unter anderem die Teilnahme an früheren ICLR-Konferenzen in den USA und Kanada verweigert wurde, um sie von globalen KI-Gesprächen auszuschließen.

"Die Konferenz in Addis nicht zu haben, war ein schwerer Schlag, es hätte die Vielfalt der Konferenz massiv verändert", sagte Jade Abbott, Gründer von Masakhane, einer Forschungsbewegung für maschinelle Übersetzung für afrikanische Sprachen, gegenüber der BBC.

Masakhane, was in isiZulu "Wir bauen zusammen" bedeutet, hat 150 Mitglieder in 20 afrikanischen Ländern. Die Mitgliedschaft steht allen offen, die sich für Sprachübersetzungen interessieren.

"Wir bauen eine Gemeinschaft von Menschen auf, die sich für afrikanische Sprachen interessieren und Übersetzungsmodelle erstellen möchten. 30% der Weltsprachen sind afrikanisch. Warum also nicht 30% der NLP-Veröffentlichungen?" Frau Abbott fragte.

Bildrechte
Jade Abbott

Bildbeschreibung

Jade Abbott präsentierte ihren Vortrag über Masakhane auf der virtuellen ICLR-Konferenz

Das Netzwerk konzentriert sich auf die Förderung der Sprachübersetzung für Afrikaner durch Afrikaner und fördert die offene gemeinsame Nutzung von Ressourcen und die Zusammenarbeit, um Forschern dabei zu helfen, auf der Arbeit des anderen aufzubauen.

Meistens bedeutet dies jedoch, von vorne zu beginnen.

Eine mit Masakhane verbundene Forscherin beispielsweise sammelt derzeit Daten von Sprechern der Damara, einer Khoisan-Sprache – berühmt für ihren Klick-Sound – in Namibia, sagte Frau Abbott.

Bisher haben Masakhane-Mitglieder 35 Übersetzungen von 25 afrikanischen Sprachen durchgeführt, fügte sie hinzu.

Die Medienwiedergabe wird auf Ihrem Gerät nicht unterstützt

MedienunterschriftEin Leitfaden zur Kultur und Sprache der Khoisan

Neben Masakhane gibt es weitere Initiativen zum Aufbau und zur Stärkung der Netzwerke von KI-Forschern auf dem Kontinent:

  • Deep Learning Indaba, das die KI in Afrika fördert und eine jährliche Konferenz abhält
  • Data Science Africa, das die Forscher des Kontinents verbindet
  • BlackinAI, eine Initiative, die die Einbeziehung schwarzer Menschen in den Bereich der künstlichen Intelligenz fördert

Dr. Ezeani nennt sie "stille Kämpfe" von Afrikanern, die im KI-Bereich arbeiten.

Er sieht in diesen Engagements einen Beitrag zur Erweiterung der Kapazitäten des Kontinents sowohl im Hinblick auf den Aufbau der KI-Infrastruktur als auch auf die Fähigkeiten von Forschern und Entwicklern.

"Dies ist nicht nur für die Anerkennung wichtig, sondern auch für die tatsächliche Bewältigung unserer lokalen Herausforderungen, beispielsweise in den Bereichen Gesundheit, Landwirtschaft, Bildung und Regierungsführung, mit hausgemachten und zielgerichteten Lösungen", sagte er.

"Vielleicht können wir auch irgendwann die Verantwortung übernehmen und die Erzählung kontrollieren", fügte er hinzu.

Hey Alexa, sprichst du Igbo?

Dr. Ezeani arbeitet derzeit an einer maschinellen Übersetzung der nigerianischen Igbo-Sprache ins Englische.

"In fünf bis zehn Jahren werde ich in der Lage sein, mit Alexa in Igbo oder einer anderen Minderheitensprache zu interagieren, was eine große und erfüllende Leistung sein wird", sagte Dr. Ezeani.

Derzeit unterstützt keiner von Alexa von Amazon, Siri von Apple und Google Home, die Hauptakteure auf dem globalen Markt für Sprachassistenten, eine einzige afrikanische Muttersprache. Google Translate ist für 13 afrikanische Sprachen, einschließlich Igbo, aktiviert, jedoch alles andere als perfekt.

Dr. Ezeani sagte, dass die Arbeit, die er und andere leisten, Tech-Unternehmen dazu verleiten könnte, afrikanische Sprachen in ihre Geräte zu integrieren.

Er warnt jedoch davor, dass afrikanische Forscher, die im KI-Bereich arbeiten, von originellen Ideen angetrieben werden sollten, "die für die Menschen tatsächlich nützlich sind" und keine Eitelkeitsprojekte verfolgen sollten.

"Wir können prüfen, ob beispielsweise die Übersetzung von Igbo nach Yoruba und umgekehrt tatsächlich nützlicher ist als die Übersetzung von Igbo nach Englisch, oder ob Sprach- oder Visual-to-Text-Systeme mehr erforderlich sind als Text-zu-Text." -Text ", sagte er.

Bildrechte
Bonaventure Dossou

Bildbeschreibung

Herr Dossou (L) und Herr Emezue (R) hoffen, ihr Projekt in Afrika ausweiten zu können

Herr Dossou und sein Mitschöpfer, Herr Emezue, haben große Ambitionen für FFR, wenn sie sich die Finanzierung sichern können.

Sie sehen Fon, eine Bantusprache, die von mehr als zwei Millionen Menschen in Benin sowie in Teilen von Nigeria und Togo gesprochen wird, als Hilfe bei der Ausweitung ihrer Arbeit auf anderen Märkten.

Fon gehört zur Sprachfamilie Niger-Kongo, was bedeutet, dass es eine gemeinsame Abstammungslinie mit Sprachen hat, die in Teilen des West-, Zentral-, Ost- und südlichen Afrikas gesprochen werden.

Im Moment liegt ihr Fokus jedoch darauf, FFR weiter zu trainieren, um die täglichen Gespräche besser übersetzen zu können.

"Vielleicht würden die (Sprach-) Nachrichten meiner Mutter in Fon in etwa einem Jahr in französischen Text übersetzt", sagte Dossou.