Suomalaiset LUMI Extreme Scale -hankkeet edistävät muun muassa puhutun suomen kielen malleja ja kosmisten säikeiden tutkimusta

Suomalaiset LUMI Extreme Scale -hankkeet edistävät muun muassa puhutun suomen kielen malleja ja kosmisten säikeiden tutkimusta


 

LUMI-supertietokoneen toiset suomalaiset tutkimushankkeet, jotka hyödyntävät Euroopan nopeinta supertietokonetta LUMIa on valittu ja ovat aloittaneet työnsä LUMIn erittäin tehokasta grafiikkasuoritinkapasiteettia hyödyntäen. Hankkeissa kehitetään muun muassa puhutun suomen kielen malleja ja edistetään fysiikan tutkimusta.

Resurssit myönnettiin Suomen toisessa LUMI Extreme Scale Call -haussa, jossa jaetaan Suomen maakohtaisia LUMI-resursseja.

Hyväksytyt hankkeet ovat:

  • FinW2V2: Pre-trained Finnish Speech Model (Esikoulutettu puhutun suomen kielen malli), päätutkijat Mikko Kurimo ja Tamás Grósz, Aalto-yliopisto

Tässä projektissa luodaan esikoulutettu puhutun suomen kielen malli. Aiemmin suomalaiset automaattiset puheentunnistusjärjestelmät (automatic speech recognition systems, ASR) ovat käyttäneet pohjana monikielisiä esikoulutettuja malleja, mutta empiiristen tutkimusten mukaan yksikielisten mallien avulla päästään parempaan lopputulokseen esimerkiksi automaattisissa puheentunnistusjärjestelmissä. Malli tulee olemaan vapaasti saatavilla ja sillä tulee olemaan poikkitieteellistä arvoa. Tutkijat näkevät, että malli tulee parantamaan suomalaisen akateemisen tutkimuksen asemaa ja sen avulla pystytään esimerkiksi tekemään puhutun kielen tutkimusta haastatteluista ja kokousten nauhoituksista tarkempaan suomen kielen automaattiseen puheentunnistukseen perustuen.

  • GRaCoS: Gravitational radiation from Cosmic Strings (Kosmisten säikeiden gravitaatiosäteily), päätutkijat José Ricardo Campos Cruz de Carvalho Correia, Helsingin yliopisto ja Carols Martins, Porton yliopisto

Kosmiset säikeet ovat joidenkin teorioiden mukaan oletettu seuraus aikaisen maailmankaikkeuden muutoksista. Tässä projektissa pyritään etsimään vastausta simulaatioiden välillä olevaan epäsopuun. Kosmisten säikeiden havaitseminen ovat esimerkiksi ESA:n CORE-satelliitin ja gravitaatioaaltoja mittaavan LISA-avaruusluotaimen missioiden päätavoitteita. Projektin tuloksia voidaan hyödyntää niin kosmisten säikeiden perustutkimuksessa kuin tulevan havaintodatan analysoinnissa. 

  • MMATT: Large-scale multi-modal data analysis with attention models (Laajan skaalan multimodaalinen data-analyysi huomiomallien kanssa), päätutkija Jorma Laaksonen, Aalto-yliopisto

Tässä poikkitieteellisessä projektissa kehitetään huipputason visio-kielimalli multimodaalisen data-analyysin ja -prosessoinnin tarpeisiin. Tutkimuksen pohjana on aiempia multimodaalisia malleja, jotka yhdistävät visuaalista ja audiopohjaista dataa sekä tekstipohjaisia syötteitä ja löytävät korrelaatioita erilaisten multimodaalisten syötteiden välillä. Valmista mallia voidaan hyödyntää esimerkiksi automaattiseen visuaaliseen päättelyyn ja multimodaalisten syötteiden analysointiin. Sovellusalueita mallille löytyy niin media-analyysin ja elokuvatutkimuksen aloilta, mutta mallin avulla voidaan edistää myös tutkimusta esimerkiksi ympäristötutkimuksen ja metsätalouden aloilla.

  • SISSI: Studying Small-Scale dynamo action in the Sun (Auringon pienen mittakaavan dynamoefektit), päätutkijat Maarit Korpi-Lagg, Aalto-yliopisto ja Jörn Warnecke, Max Planck -instituutti

Auringossa on magneettikenttiä, jotka vaihtelevat itse auringon koosta aina havaintojen resoluutiokykyyn asti. Tässä projektissa tutkitaan, millä tasolla esimerkiksi turbulenssin kineettisen energian suhteen pienen mittakaavan dynamoefektien magneettiset vaihtelut saturoituvat auringon ja tähtien konvektioalueella. Aiemmassa LUMI-G-pilottiprojektissa tutkimusryhmä tutki tällaista mahdollisuutta turbulentissa konvektiossa, mutta seuraava ratkaisematon kysymys on, kuinka sellaiset dynamot voivat aiheuttaa voimakkaita magneettisia heilahteluja. Näillä on suora vaikutus esimerkiksi avaruussäähän.

Seuraava Suomen LUMI Extreme Scale Call -haku alkaa keväällä 2023.

Lisätietoja LUMIn resurssien hakemisesta (englanniksi): https://research.csc.fi/lumi-access ja www.lumi-supercomputer.eu/get-started