Kilpailukykyä tutkimuksen ekosysteemeillä

Moderni tutkimusympäristö tutkimukselle ja TKI-toiminnalle on keskeinen kilpailukyvyn ja tuottavuuden väline. Maailmanluokan supertietokoneet mahdollistavat suurten tietoaineistojen tehokkaan käsittelyn ja tekoälyn sekä kvanttiteknologian hyödyntämisen avaten näin uusia ovia tutkimukselle.

CSC:n operoimat datanhallinnan ja laskennan ympäristöt ja niihin liittyvät asiantuntijapalvelut tekevät Suomesta kokoaan suuremman laskennallisen tieteen osaamiskeskittymän ja mahdollistavat huippuluokan tutkimuksen Suomessa ja Euroopassa.

Kansainväliset hankkeet ja infrastruktuurit, joissa CSC on mukana, ovat yksi väylä suomalaisen tutkimuksen ja korkeakoulujen kansainvälistymiseen.

Datanhallinnan ja laskennan kehitysohjelma (DL2021) päättyi vuonna 2021. Ohjelman aikana CSC:n palvelujen käyttäjien määrä on kasvanut yli 40 %. Tutkimuslaitoskäyttäjien määrä on viisinkertaistunut vuodesta 2017. Luonnontieteet on päätieteenaloista suurin CSC:n käyttäjistä, mutta myös tekniikan, lääke- ja terveystieteiden, humanististen tieteiden, maatalous- ja metsätieteiden ja yhteiskuntatieteiden alat ovat alkaneet hyödyntää palveluja laajemmin ohjelman aikana.

DL2021-ohjelmalla oli myös tärkeä rooli pilotoitaessa keinoja tarjota yrityksille CSC:n datanhallinnan ja laskennan palvelujen resursseja. Tässä tehtiin yhteistyötä Business Finlandin kanssa heidän AI Business -ohjelmansa puitteissa. Ohjelman kautta saadut kokemukset edesauttoivat niin teknologian kuin yhteistyön suhteen myös EuroHPC pre-exascale investoinnin (LUMI) saamista Suomeen.

CSC:n tutkimusinfrastruktuuripalveluiden käyttö kasvaa tasaisesti

Kansallinen Datanhallinnan ja laskennan kehittämishanke (DL2021) tukee yliopistojen, ammattikorkeakoulujen ja tutkimuslaitosten tutkimus- ja opetustoimintaa sekä kansallista innovaatiotoimintaa varmistaen samalla suomalaisen tutkimusyhteisön kansainvälisen kilpailukyvyn data- ja laskentakeskeisillä tutkimusaloilla. 

Vuoden 2021 CSC:n datanhallinta- ja laskentapalvelujen käyttäjäkyselyssä DL2021-ympäristöä käyttäneiden NPS oli 69,4, jossa oli havaittavissa hieman laskua edellisiin vuosiin verrattuna vaikkakin lukua voidaan edelleen pitää erittäin hyvänä. 

DL2021-ohjelman viimeiset investoinnit kohdistettiin Mahdin tekoälyosion Mahti-AI:n pystyttämiseen. Grafiikkaprosessorien (GPU) tarve on jatkanut vahvaa kasvua ja Mahti-AI -osion käyttöönoton myötä myös Mahdin käyttäjille voitiin tarjota kipeästi kaivattua GPU-resurssia. Mahti-AI avattiin käyttöön huhtikuun lopussa.

DL2021-ohjelma loppuseminaari pidettiin 13.12.2021 ja ohjelman tuloksista ja vaikuttavuudesta koostettu  CSC:n itsearviointi DL2021-ohjelman tavoitteiden toteutumisesta on luettavissa verkossa.

Kansallisen datanhallinnan ja laskennan kehittämisohjelman myötä tutkimuslaitokset ovat laajasti löytäneet CSC:n palvelut sekä niiden käyttäjinä että uusien avauksien asiakkaina. Datanhallinnan ja laskennan palveluissa tutkimuslaitosten ja yliopistojen käyttäjämäärät kasvoivat vuonna 2021 merkittävästi. CSC:n palveluiden osalta myös opetus- ja opiskelijakäyttö on ollut selkeässä kasvussa, samoin kansainvälinen tutkimuskäyttö.

Käyttäjien kokonaismäärä on vuonna 2021 jatkanut kasvuaan. Alla olevassa taulukossa on kuvattu aktiivisten käyttäjien määrä CSC:n tutkimuksen palvelukokonaisuudessa, mukaan lukien IDA-tutkimusdatan säilytyspalvelu. Aktiivinen käyttäjä tarkoittaa tässä käyttäjää, jolla on voimassa oleva tunnus. Suhteellisesti erityisesti tutkimuslaitosten tutkijat ovat löytäneet CSC:n palveluja entistä enemmän.

CSC:n laskenta- ja datanhallintapalveluiden käyttäjämäärien kehitys korkeakouluissa ja tutkimuslaitoksissa vuosina 2018-2021
  Yliopistot Tutkimuslaitokset Ammattikorkeakoulut
Aktiiviset käyttäjät 2018 3281 232 95
Aktiiviset käyttäjät 2019 3671 384 233
Aktiiviset käyttäjät 2020 3633 422 449
Aktiiviset käyttäjät 2021 4088 512 467
Kasvu 2021 aikana 12,5 % 21,3 % 4 %

Eniten aktiivisia tutkimusprojekteja oli CSC:n palvelinympäristöissä biotieteiden (459), tietojenkäsittelyn ja informaatiotieteiden (396) sekä fysiikan (230) tiedealoilla, jotka olivat myös suurimmat tieteenalat tietokoneresurssien käytöllä mitattuna. 

cPouta-pilviresurssien suurimpia käyttäjiä olivat avaruustiede ja tähtitiede (23 %) sekä tietojenkäsittely ja informaatiotiede (21 %), kun taas ePouta-palvelussa suurin käyttö kohdistui peruslääketieteiden (39 %) ja tietojenkäsittely- ja informaatiotieteiden (33 %) tutkimukseen.

Vuonna 2021 kymmenen runsaimmin resursseja käyttäneen tiedealan käytön kehitys 2018–2021 muihin tiedealoihin verrattuna.

 

Tieteenalakohtaiset osuudet projekteista ja käytetyistä resursseista 2021. Lääke- ja terveystieteet, tekniikka ja humanistiset tieteet sisältävät kaikki ko. pääluokan tieteenalat. Kohta muut sisältää muut kuin kuvassa erikseen näkyvät luonnotieteiden alat, yhteiskuntatieteen, maataloustieteen sekä sekä laskutusyksikkökäytön, jota ei ole kohdistettu millekään tieteenalalle (1 % kaikista resursseista ja 14 % projekteista). Projektien kokonaismäärä oli 2 604 ja resurssien kokonaismäärä 1 819 miljoonaa laskutusyksikköä. Laskutusyksikkö on CSC:n käyttämä yksikkö resurssien käytön seurannassa.

 

Pienet (15-35 aktiivista projektia vuonna 2021) tieteenalat, joiden aktiivisten projektien määrä on vähintään kaksinkertaistunut 2018–2021.

 

CSC:n kautta saatavat tutkimuksen ja opetuksen palvelut soveltuvat kaikille tieteenaloille ja korkeakouluopetuksen tueksi. Tukea tarjotaan tutkimusprosessin kaikissa vaiheissa. CSC:n resurssienjakoryhmä myöntää asiakkaiden hakemat laskenta- ja tallennusresurssit sekä kansallisiin että suomalaisten LUMI-palveluihin. CSC ei arvioi suoranaisesti hakemusten tieteellistä laatua, mutta edellyttää hakemuksissa esitettyjen menetelmien teknistä toimivuutta ja vaatii, että myönnetyt resurssit tuottavat tieteellisiä julkaisuja. Lisäksi edellytetään, että resursseja käytetään vastuuntuntoisesti joko tutkimuksen tai opetuksen tarpeisiin. Resurssienjakoryhmä seuraa kansallista tiedepolitiikkaa ja noudattaa Suomen tiedehallinnon määrittelemiä prioriteetteja. Laskentaresurssit kohdennetaan ensisijaisesti kansalliseen tutkimukseen. Myönnetyistä resursseista raportoidaan kerran vuodessa CSC:n hallitukselle ja opetus- ja kulttuuriministeriölle. Vuonna 2021 resurssienjakoryhmä käsitteli 2033 resurssihakemusta. Haettujen laskutusyksiköiden (BU) kokonaismäärä oli 1 742 259 522 BU ja myönnettyjen 1 574 959 522 BU. Suomen LUMI-osuudesta myönnetään suomalaisille käyttäjille resursseja, joista merkittävämpiä ovat vuoden pituiset Regular Access (Tier-1-tasoiset) -projektit. Ensimmäiset Regular Access -projektit LUMI-C-osioon myönnettiin jo vuoden 2021 joulukuussa.

Huomattavan suuria laskenta- tai tallennusresursseja vaativien ns. Grand Challenge -tutkimushankkeiden hakemukset sekä kansainvälisten PRACE-suurteholaskentaresurssien hakemukset arvioi Tieteellinen asiakaspaneeli, joka koostuu suomalaisten tutkimusryhmien vetäjistä eri tieteenaloilta. Tulevat Suomen LUMI-osuuden Extreme Scale Access (Tier-0-tasoiset) -projektit arvioi myöhemmin muodostettava pohjoismainen paneeli.

Laskenta- ja datanhallintaympäristön saavutettavuus oli vuoden 2021 aikana erinomaisella tasolla (Puhti 99,27 %, 2020: 99.17 % ja Mahti 98,02 %, 2020: 94,25 %).

CSC:n laskentapalvelimien mahdollistama laskentateho on kasvanut hyvin nopeassa tahdissa viime vuosina. Vuosi 2021 oli Mahdin ensimmäinen kokonainen vuosi tuotannossa ja sen tarjoama laskentakapasiteetti vastaa koko 2020 kaikkien laskentapalvelimien yhteenlaskettua suorituskykyä. Laskentatehon nopeasta kasvusta johtuen koneiden käyttöasteet ovat vaihdelleet normaalia enemmän ollen kuukausittain 57 ja 90 prosentin välillä, toisaalta laskentaa tehtiin kokonaisuudessaan 64 % enemmän kuin vuonna 2020.

Laskentatehon huipputeho ja toteutunut käyttö vuosina 2018-2021.

 

LUMI-supertietokoneen ensimmäinen vaihe asennettiin

Suomen johtama kymmenen Euroopan maan LUMI-konsortio vastaa yhden kolmesta EuroHPC JU:n yhteishankintana organisoiman maailmanluokan supertietokoneen isännöinnistä. LUMI-supertietokone on valmistuessaan Euroopan nopein supertietokone ja yksi maailman tunnetuimmista tieteellisen laskennan instrumenteista elinkaarensa ajan.

LUMI-datakeskuksen rakennusta ja järjestelmän asennustaLUMI-datakeskuksen rakennustyöt saatiin valmiiksi keväällä 2021 globaalista pandemiasta huolimatta. LUMI-laskentaympäristön asennustyöt alkoivat kesällä 2021, jolloin kansainvälinen asennustiimi CSC:n asiantuntijoilla vahvistettuna asensi CPU-prosessoreista koostuvan LUMI-C-osion. Heti tämän jälkeen alkoivat hyväksyntä- ja käyttöönottotestaukset, jotka menivät mallikkaasti. Katso video: LUMI-datakeskuksen rakennusta ja järjestelmän asennusta

Vuoden loppupuolella LUMI-C avautui pilottikäyttäjille. Pilotoinnin tavoitteena oli testata koneen CPU-osiota ja tallennusjärjestelmiä raskaiden työkuormien avulla. LUMI-konsortiomaista valitut 30 pilottiprojektia edustivat useita eri tieteenaloja. LUMIn asiakastuki, LUMI User Support Team teki pilottikäyttäjälle kattavan kyselyn ja käyttäjäkokemukset olivat myönteisiä. Myös erinäisiä LUMIin liittyviä prosesseja kehitettiin vuoden aikana.

LUMI-järjestelmän saapuminenViidennes LUMIn kapasiteetista on varattu yritysten käyttöön ja yrityskäytön valmistelu jatkui vuoden 2021 aikana. Tärkeänä osana oli palvelupolkujen määrittelytyö, jotta eri käyttö- ja rahoitusmallit saadaan toimiviksi. Pääpaino LUMIn yrityskäytössä on yritysten yhteistyöllä korkeakoulujen ja tutkimuslaitosten kanssa. Näin saadaan tuotua parhaiten temaattista tutkimusosaamista tukemaan yritysten TKI-toimintaa, joka yhdistyy massiiviseen laskentakapasiteettiin. Myös LUMIn suora yrityskäyttö on mahdollista, mikäli yrityksellä on tähän riittävät valmiudet. Tällöin käytöstä peritään markkinahinta. Työtä tehtiin myös Business Finlandin kanssa. Business Finlandin AI-ohjelman kautta toteutettiin Puhti AI -alustaa hyödyntäen muutama teköälyvetoinen laskentahanke, kuten Speechlyn puheentunnistusteknologian kehittämisprojekti. Hankkeista saadut tulokset olivat varsin lupaavia. Katso video: LUMI-järjestelmän saapuminen

LUMI-datakeskusLoppuvuodesta 2021 LUMI sai osakseen myös mainetta ja kunniaa kahden merkittävän kansainvälisen palkinnon myötä. Ensimmäinen palkinto, HPCwire-lehden vuotuisissa Readers’ and Editors’ Choice Awardseissa LUMI sai palkinnon parhaasta kestävän kehityksen innovaatiosta suurteholaskennan alalla (Best Sustainability Innovation in HPC, HPCwire Editors’ Choice Award). Toisen kansainvälisen palkinnon LUMI sai Lontoossa joulukuussa 2021 järjestetyssä globaalissa DCD Awards -gaalassa, missä LUMIlle myönnettiin innovaatiopalkinto datakeskuksen suunnittelusta (Data Center Design Innovation Award) yhdessä Granlundin ja Synopsis Arkkitehtien kanssa. Katso video: LUMI-datakeskus.

LUMIn GPU-prosessoreista koostuvan LUMI-G -osion asennus käynnistyy keväällä 2022. Asennustöitä seuraa järjestelmän toinen pilotointivaihe, jonka tavoitteena on luoda raskaita työkuormia grafiikkasuorittimille ja tallennusjärjestelmille sekä testata grafiikkasuoritinosion skaalautuvuutta. Lisäksi pilotointivaiheen tarkoituksena on saada palautetta pilottikäyttäjiltä. Tähän vaiheeseen on valittu pilottiprojekteja jokaisesta LUMI-konsortiomaasta. LUMI on kokonaisuudessaan käytettävissä syksyllä 2022. LUMI-G-osioon tähtäävien suomalaisten projektien Extreme Scale Access -haku avautui myös vuoden 2021 syyskuussa, ja nämä projektit käynnistyvät, kun LUMI-G-osio tulee tutkijoiden käyttöön.

Uusi Funet-verkko on valmis tulevaisuuden tarpeisiin

Nopea ja luotettava Suomen korkeakoulujen, tutkimuksen ja opetuksen tietoverkko Funet kattaa kaikki suomalaiset korkeakoulut hallinnonalasta riippumatta ja palvelee yli 390 000 loppukäyttäjää kaikkialla Suomessa.

Funet-verkon elinkaaripäivitys Funet 2020 valmistui alkuvuodesta 2021. Päivityshanke onnistui tavoitteiden mukaisesti. Uusi verkkoratkaisu tarjoaa käyttäjilleen entistä luotettavammat yhteydet. Päivityksen myötä verkko skaalautuu erinomaisesti tulevaisuuden koulutuksen ja tutkimuksen tiedonsiirtotarpeisiin.

Osoituksena Funet 2020-päivityshankkeen onnistumisesta ja päivitetyn verkon ensiluokkaisesta tiedonsiirtokyvystä, syksyllä 2021 Funet-verkossa siirrettiin tietoa 800 Gbit/s nopeudella yli 2000 km etäisyydelle. Saavutettu maailmanennätystulos osoittaa, että Funet-verkko skaalautuu erinomaisesti, mikä varmistaa tehokkaan tiedonsiirron valmiudet suomalaisille korkeakouluille ja tutkimukselle pitkälle tulevaisuuteen. Lisäksi verkon kyvykkyys vastata EuroHPC LUMIn ja muiden keskeisten tutkimusresurssien tuleviin tiedonsiirtotarpeisiin on erinomainen.

CSC:n tutkimus- ja hankeyhteistyö laajeni entisestään

CSC kehittää palvelutarjoamaansa suurelta osin kilpaillun rahoituksen avulla. 

CSC on mukana Suomen Akatemian vuosille 2022–2029 valitsemassa Suurnopeuksiset sähkömekaaniset energianmuunnosjärjestelmät -huippuyksikössä. CSC:llä kehitetty ELMER-ohjelmisto ja erityisosaaminen monifysikaalisten ilmiöiden mallintamiseen olivat keskeiset syyt CSC:n osallistumiselle huippuyksikön toimintaan. 

NVIDIA, Suomen tekoälykeskus (FCAI) ja CSC pyörittävät yhteistyössä NVAITC-teknologia ohjelmaa, jonka kautta edistetään suomalaisen AI-tutkimuksen edellytyksiä osaamisen ja laskentaresurssien avulla. Ohjelma tekee yhteistyötä 40 tutkimushankeen kanssa ja on antanut syvätukea 11 tutkimushankkeelle grafiikkaprosessorien (GPU) tehokkaammassa hyödyntämissä heidän tutkimusongelmien ratkaisemiseksi.

CSC on mukana kahdessa hyväksytyssä Suomen akatemian HPC-hankkeessa yliopistojen kanssa. ExaFF-hankkeessa kehitetään tehokasta koneoppimista hyödyntävää molekyylidynamiikan ohjelmistoa LUMIlle ja muille EuroHPC-koneille Aalto-yliopiston vetämässä konsortiossa. Helsingin yliopiston, Sodankylän geofysikaalisen observatorion ja CSC:n HISSA-hankkeessa tähdätään LUMIn ja DL2021-infrastruktuurin hyödyntämiseen ionosfäärin ilmiöiden tehokkaassa mallintamisessa ja havainnoinnissa.

CSC on mukana EU-rahoitteisessa fuusiotutkimuksen tekoälytuen keskuksessa (E-TASC Helsinki Advanced Computing Hub), joka tähtää erityisesti fuusioenergian laskennallisten edellytysten parantamiseen. Yhdessä VTT:n, Aalto yliopiston ja Åbo Akademin kanssa toteutettava projekti on suurin Suomessa fuusiotutkimuksen alalla.

Suurteholaskennan kansantajuistamiseen tähtäävä Elements of Supercomputing-verkkokurssi suunniteltiin ja toteutettiin yhteistyössä  Kajaanin ammattikorkeakoulun kanssa. Kurssi julkaistiin DL2021 päätösseminaarissa 13.12.2021. Kurssi on vapaasti kaikkien suoritettavissa ja sen suomenkielinen versio valmistui vuoden 2022 alussa. Vuoden 2022 tammikuun puoliväliin mennessä kurssille oli kirjautunut 128 henkilöä, joista 25 oli suorittanut sen loppuun. CSC:n laskentaresurssien käytön tehostamiseen ja aloittamisen helpottamiseen laadittiin uusi MOOC-materiaali, joka on myös avoimesti tarjolla kotimaisille ja kansainvälisille yhteistyökumppaneille.

Vuonna 2021 jatkoimme urheilu- ja hyvinvointialueen aktiviteettiemme rakentamista yhdessä asiakkaidemme ja yhteistyökumppaniemme kanssa. Uutena hankkeena osana Kajaanin seudun ekosysteemisopimusta käynnistimme Kainuun urheilu- ja hyvinvointidata-analytiikkaohjelman, jossa on tarkoituksena mahdollistaa urheilu- ja hyvinvointidatan kerääminen data-altaaseen ja hyödyntäminen useisiin eri käyttötapauksiin, esimerkiksi tutkimuksen käyttöön.

Takaisin ylös Siirry yhteiskuntavastuun sivulle