Tekoälytehtaat ja data-avaruudet tehostamaan tekoälyn kehitystä Euroopassa
Mitä ovat tekoälytehtaat? Miten data saadaan tekoälyn kehittäjien saataville? Miten suurteholaskenta ja data-avaruudet voivat edistää generatiivisen tekoälyn kehittämistä?
Suurteholaskenta ja tekoäly puhuttavat tällä hetkellä, sillä EuroHPC-yhteistyritys käynnisti kesällä 2024 haun tekoälytehtaille tehostaakseen eurooppalaista kilpailukykyä ja johtoasemaa tekoälyn kehityksessä. Tekoälytehtaat ovat supertietokoneiden infrastruktuureja, joiden tavoitteena on parantaa eurooppalaisen tiedeyhteisön pääsyä tekoälyoptimoituihin laskentakykyihin.
Kun tekoälytehtaista tulee aikanaan toimintakykyisiä, ne tulevat tarjoamaan tutkijoille, PK-yrityksille, startupeille ja muille käyttäjille pääsyn eurooppalaisiin arvoihin perustuvaan kykyjen kehittämiseen, työkaluihin ja käyttäjätuen palveluihin, joilla he voivat kouluttaa ja kehittää tekoälymalleja.
Tekoälymallien kouluttaminen ja kehittäminen vaatii suuria määriä dataa, minkä vuoksi pääsy dataan ja tehokkaisiin datankäsittelytyökaluihin täytyy olla taattuna kehittäjille ja muille käyttäjille. Voisivatko yhteiseurooppalaiset data-avaruudet auttaa tämän haasteen ratkaisemissa, ja minkälainen rooli data-avaruuksilla olisi tässä uudessa toimintaympäristössä?
Tekoälytehtaat, data-avaruudet ja generatiivinen tekoäly olivat keskeisiä aiheita Budapestissa järjestetyssä European Big Data Value Forum (EBDVF) -konferenssissa 2.–4. lokakuuta 2024.
CSC:n kehityspäällikkö Aleksi Kallio osallistui EBDVF-konferenssin paneelikeskusteluun AI factories: Addressing the data challenge. Samaan keskusteluun osallistui edustajia useista keskeisistä tekoälytehdas- ja data-avaruusteemoihin erikoistuneista organisaatioista: Euroopan komissio, Barcelona Supercomputing Center (Espanja), IT4Innovation / VSB (Tsekki), Cineca (Italia), Language Data Space, Data Spaces Support Center ja Data Spaces Business Alliance (BDVA, FIWARE, Gaia-X ja IDSA jäseniä).
Data-avaruudet ja tekoälytehtaat täydentävät toisiaan
Panelistit tunnistivat tekoälytehtaiden ja data-avaruuksien yhteistyön tuomat mittavat hyödyt eurooppalaisten innovaatioiden vauhdittamiselle. Data-avaruudet voivat tarjota tekoälytehtaille tukea datan yhteentoimivuusongelmissa sekä tarjota saumattoman pääsyn dataan ja asianmukaisiin datanhallinnan rakenteisiin.
Toisaalta tekoälytehtaat pystyvät tukemaan data-avaruuksia uusilla ja innovatiivisilla tekoälypohjaisilla työkaluilla ja tekoälymalleilla. EuroHPC:n supertietokoneet pystyvät tuomaan nämä kaksi maailmaa yhteen: ne pystyvät tarjoamaan tekoälytehtaiden ja data-avaruuksien integraatioon ja toimintaympäristöön tarvittavat laskentavalmiudet.
“Nykyajan tekoäly pyörii datan ympärillä. Data itsessään ei voi kuitenkaan luoda mitään uutta. Tarvitaan kyvykkäitä ihmisiä, joilla on käytössään tehokkaita työkaluja, nimenomaan tekoälyohjelmistoille tarkoitettuja supertietokoneita. Ihmiset, jotka pystyvät hahmottamaan mullistavia tekoälypohjaisia ratkaisuja ja joilta löytyy taidot niiden rakentamiseen, voivat hyödyntää tekoälytehtaita saadakseen pääsyn laskentakykyihin ja data-avaruuksien tietoihin”, Aleksi Kallio sanoo.
Yhteinen tiekartta eurooppalaisen toimintakyvyn rakentamiseksi
Vaikka panelistit tunnistivat data-avaruuksien ja tekoälytehtaiden yhteistyön hyödyt, he olivat yksimielisiä siitä, että yhdistäminen ei tule olemaan helppoa. Molemmat hankkeet ovat varhaisessa vaiheessa, minkä vuoksi yhteenliittämisen teknisten vaatimusten visualisointi ei ole yksiselitteistä. Näin alkuvaiheessa haasteeseen vastaamisen kannalta on keskeistä, että yhteisiä käytänteitä ja standardeja rakennetaan luottavaisen yhteistyön avulla.
EBDVF:n paneelikeskustelussa vähemmälle huomiolle jäi tarve kyvyille. Tekoälytehtaat tarvitsevat pääsyn erityisiin datan saatavuuden, hallinnan, prosessoinnin ja hallinnoinnin kykyihin, jotta ne voivat kouluttaa sidosryhmiä ja tukea loppukäyttäjiä. Tämä on toinen alue, jossa tiivis yhteistyö tekoälytehtaiden, supertietokoneiden ja data-avaruuksien välillä voi tuoda etuja.
”Tarvitsemme tulevaisuudessa yhteisen tiekartan tarvittavien kykyjen suunnitteluun ja kehittämiseen generatiiviseen tekoälyyn liittyen. Sen tulisi olla suunniteltu tekoälytehtaiden, EuroHPC:n ja data-avaruuksien tuella, jotta eurooppalainen osaamisreservi ei laahaisi perässä ja olisi valmis tukemaan innovaatioita. CSC on myös todella aktiivinen tällä alueella ja jatkaa työtänsä tähän suuntaan”, Aleksi Kallio sanoo.
Lisää pohdintaa ja tietoa generatiivisesta tekoälystä ja data-avaruuksista on pian saatavilla, kun Data Spaces Support Centerin (DSSC) koordinoima raportti julkaistaan vuoden 2024 loppupuolella. CSC on ollut mukana raportin laatimisessa.
Kirjoittajat
Elisa Halonen, Aleksi Kallio ja Sara Orhanen, CSC