Välttämättömät evästeet

Tämä sivusto käyttää toimintansa kannalta välttämättömiä evästeitä tarjotakseen käyttäjälle sisältöä ja tiettyjä toiminnallisuuksia (esim. kielivalinta). Et voi vaikuttaa näiden evästeiden käyttöön.

Verkkosivuston kävijätilastot

Keräämme sivuston käytöstä kävijätilastoja. Tiedot eivät ole henkilöitävissä ja ne tallennetaan ainoastaan CSC:n hallinnoimaan Matomo-kävijäanalytiikkatyökaluun. Hyväksymällä kävijätilastoinnin sallit Matomon hyödyntää erilaisia teknologioita, kuten analytiikkaevästeitä ja verkkokutsuja, kun se kerää tilastoja sivun käytöstä.

Muuta tekemiäsi evästevalintoja ja lue lisätietoa kävijätilastoinnista ja evästeitä 

CSC

Tällä hetkellä kääntäjä tukee yhteensä 23 suomalais-ugrilaista kieltä: yleisimmin tuettujen viron, suomen ja unkarin kielten lisäksi nyt myös liivin, võron, varsinaiskarjalan, livvinkarjalan, lyydin, vepsän, pohjoissaamen, eteläsaamen, inarinsaamen, koltansaamen, luulajansaamen, komin, komi-permjakin, udmurtin, länsimarin, itämarin, ersän, mokšan, mansin ja hantin kieliä.

Kuvassa Tarton yliopiston NLP-ryhmästä (vasemmalta oikealle) tutkija Lisa Yankovskaya, professori Mark Fišel ja tutkija Maari Tars. Kuva: Henry Narits.

Useimmat näistä kielistä on lisätty julkiseen kääntäjään ensimmäistä kertaa, sillä ne eivät kuulu Google Translateen tai muihin vastaaviin palveluihin.

”Aloitimme työskentelyn suomalais-ugrilaisten kielten parissa vuonna 2021, ja ensimmäinen tekemämme järjestelmä tuki võroa, pohjoissaamea ja eteläsaamea”, kertoo Maali Tars, tutkija Tarton yliopiston tietojenkäsittelytieteen laitokselta.

Tutkijaryhmä lisäsi liivin kielen kääntäjään samana vuonna. Liivin kieli on äärimmäisen uhanalainen kieli, jota puhuu äidinkielenään vain noin 20 henkilöä.

Tarton yliopiston tutkijat jatkavat nykyisen järjestelmän laadun parantamista ja aikovat lisätä siihen lisää suomalais-ugrilaisia kieliä ja murteita.

”Konekääntämisen kehittäminen vähäisten resurssien kielille on useita syitä. Esimerkiksi filologit ja muut asiasta kiinnostuneet tarvitsevat näiden kielten käännöksiä ymmärtääkseen tekstejä, kansanperinnettä jne. oppimatta kieltä. Kääntäminen näille kielille on keino säilyttää uhanalaisia kieliä ja tukea niiden puhujia”, sanoo Lisa Jankovskaja, Tarton yliopiston NLP-ryhmän tutkija.

Hän lisää, että käännösjärjestelmä on avoin kaikille käyttäjille, ja ohjelmisto ja luodut mallit ovat avoimesti saatavilla.

Yhteistyössä olivat mukana Latvian yliopiston liivin kielen instituutti, Võron instituutti, Itä-Suomen yliopisto ja sen karjalan kielen elvyttämisen ohjelma sekä Norjan arktinen yliopisto. Työn rahoitti Viron kansallinen kieliteknologiaohjelma.

Käännöskone Neurotõlge löytyy täältä.

Kirjoittaja: Henry Narits, Tarton yliopisto

Tämä artikkeli julkaistiin alun perin LUMIn verkkosivuilla.