LUMI auttamassa uhanalaisten kielten säilymistä: konekääntäjä harvinaisille suomalais-ugrilaisille kielille
Tarton yliopiston tietotekniikan instituutin tutkijat ovat lisänneet LUMI-supertietokoneelta myönnettyjen resurssien avulla liivin, komin, vepsän ja 14 muun harvinaisen suomalais-ugrilaisen kielen yliopiston julkiseen konekäännöspalveluun Neurotõlgeen. Kääntäjä edesauttaa uhanalaisten suomalais-ugrilaisten kielten säilymistä ja tukee kielten puhujia.
Tällä hetkellä kääntäjä tukee yhteensä 23 suomalais-ugrilaista kieltä: yleisimmin tuettujen viron, suomen ja unkarin kielten lisäksi nyt myös liivin, võron, varsinaiskarjalan, livvinkarjalan, lyydin, vepsän, pohjoissaamen, eteläsaamen, inarinsaamen, koltansaamen, luulajansaamen, komin, komi-permjakin, udmurtin, länsimarin, itämarin, ersän, mokšan, mansin ja hantin kieliä.
Useimmat näistä kielistä on lisätty julkiseen kääntäjään ensimmäistä kertaa, sillä ne eivät kuulu Google Translateen tai muihin vastaaviin palveluihin.
”Aloitimme työskentelyn suomalais-ugrilaisten kielten parissa vuonna 2021, ja ensimmäinen tekemämme järjestelmä tuki võroa, pohjoissaamea ja eteläsaamea”, kertoo Maali Tars, tutkija Tarton yliopiston tietojenkäsittelytieteen laitokselta.
Tutkijaryhmä lisäsi liivin kielen kääntäjään samana vuonna. Liivin kieli on äärimmäisen uhanalainen kieli, jota puhuu äidinkielenään vain noin 20 henkilöä.
Tarton yliopiston tutkijat jatkavat nykyisen järjestelmän laadun parantamista ja aikovat lisätä siihen lisää suomalais-ugrilaisia kieliä ja murteita.
”Konekääntämisen kehittäminen vähäisten resurssien kielille on useita syitä. Esimerkiksi filologit ja muut asiasta kiinnostuneet tarvitsevat näiden kielten käännöksiä ymmärtääkseen tekstejä, kansanperinnettä jne. oppimatta kieltä. Kääntäminen näille kielille on keino säilyttää uhanalaisia kieliä ja tukea niiden puhujia”, sanoo Lisa Jankovskaja, Tarton yliopiston NLP-ryhmän tutkija.
Hän lisää, että käännösjärjestelmä on avoin kaikille käyttäjille, ja ohjelmisto ja luodut mallit ovat avoimesti saatavilla.
Yhteistyössä olivat mukana Latvian yliopiston liivin kielen instituutti, Võron instituutti, Itä-Suomen yliopisto ja sen karjalan kielen elvyttämisen ohjelma sekä Norjan arktinen yliopisto. Työn rahoitti Viron kansallinen kieliteknologiaohjelma.
Käännöskone Neurotõlge löytyy täältä.
Kirjoittaja: Henry Narits, Tarton yliopisto
Tämä artikkeli julkaistiin alun perin LUMIn verkkosivuilla.