Datasta hyötyä hallitusti

Hyvään tieteelliseen käytäntöön kuuluu tutkimuksessa tuotetuista tietoaineistoista huolehtiminen ja niiden elinkaaren hallinta, mukaan lukien vastuullinen tiedon avoimuuden ja ristiinkäytön mahdollistaminen. CSC tukee myös arkaluonteisten aineistojen vastuullista hallintaa osana kansallisia tietoaineistoja. Yhteisten tietovarantojen hyödyntäminen toimii perustana tieteellisille läpimurroille, uusille innovaatioille ja sujuville viranomaispalveluille.

CSC:n osaamisen ytimessä on mahdollistaa datan saavutettavuus, suojaaminen, datavirrat ja datan elinkaaren hallinta eri vaiheissa aina suunnittelusta pitkäaikaissäilytykseen. CSC:n tavoitteena on rakentaa yhteentoimivista ja luotettavista dataympäristöistä kansainvälinen menestystekijä ja yhteiskunnan hyvinvoinnin perusta.

Vuonna 2020 CSC osallistui asiakkaiden datanhallinnan kyvykkyyksien vahvistamiseen, kehitti tutkimus- ja kulttuuriperintöaineistojen pitkäaikaissäilytyksen palveluita, julkaisi tiedejatutkimus.fi-portaalin sekä toimitti kehittyviä tietovaranto- ja data-analytiikkapalveluita eri asiakassegmenteille.

Datatukiverkosto ja tutkimusdatan osaamiskeskus käynnistettiin

Tutkimusdatanhallinnan osaamiskeskus ja datatukiverkosto käynnistettiin tukemaan asiakkaiden aineistonhallinnan tarpeita ja osaamista. Toiminnan tarkoituksena on tukea vastuullista tutkimusaineistojen hallintaa ja tukea tutkimuksen toistettavuutta ja laatua. Palvelu kehittää ja tuottaa datanhallinnan koulutusta, materiaaleja ja tukea datanhallinnan ammattilaisille ja tutkijoille sekä edistää vuorovaikutusta CSC:n ja organisaatioiden datatukipalveluiden välillä.

Aineistojen pitkäaikaissäilytyksen palvelut laajenivat

Digitaalinen pitkäaikaissäilytys (PAS) varmistaa digitaalisten aineistojen säilyvyyden ja saatavuuden tutkijoiden ja muiden tarvitsijoiden tarpeisiin useiden kymmenien tai jopa satojen vuosien ajan. Tämän saavuttamiseksi CSC on onnistunut kehittämään ja edelleen ylläpitämään kansallisesti merkittäviä digitaalisen pitkäaikaissäilyttämisen kyvykkyyksiä, joilla varmistetaan aineistojen eheyden, autenttisuuden ja tiedostomuotojen hallinta, laadun varmistus ja toiminnan jatkuvuudenhalllinta. 

Osana PAS-palveluiden tuottamista CSC myös tukee palveluita hyödyntäviä organisaatioita jakaen kyvykkyyksiin liittyvää osaamista; pyrkien yhdessä organisaatioiden kanssa edistämään ymmärrystä ja osaamista digitaalisten aineistojen hallinnasta ja säilyttämisestä. PAS-palveluiden tuottamisen mahdollistaa CSC:n ja OKM:n välinen sopimus.

Vuonna 2020 kulttuuriperintö- ja tutkimusaineistojen pitkäaikaisäilytyspalveluihin säilytykseen otettu aineistomäärä kasvoi merkittävästi. Vuoden lopussa aineistoja on hyväksytty säilytykseen jo yli 1 petatavua ja  aineistomäärä kasvaa vuodessa yli 80 prosenttia. Vuoden 2020 aikana säilyttämisen aloitti useampi uusi organisaatio, kuten kulttuuriperinnön osalta esimerkiksi Kansallisgalleria ja Museovirasto. Tutkimusaineistojen osalta säilyttämisen aloitti Geologian tutkimuskeskus GTK, joka on ensimmäinen tutkimuslaitos Fairdata PAS-palvelun hyödyntäjissä. 

Pitkäaikaissäilytyksen palveluiden käytön kehittyminen 2016-2020

Pitkäaikaissäilytyksen palveluiden käytön kehittyminen 2016-2020 PDF

 

CSC:n rakentama alusta Kansallisarkiston sähköisten arkistojen palvelulle (SAPA) otettiin tuotantokäyttöön valtiovarainministeriön ja OKM:n ohjauksen mukaisesti. Järjestelmä auditoitiin onnistuneesti ulkopuolisen auditoijan toimesta toukokuussa 2020. Kansallisarkisto on onnistuneesti liittänyt alustan omiin prosesseihinsa ja kerryttää sen avulla digitaalisia aineistojaan.

Fairdata-palvelut edistävät tutkimuksen ja tieteen avoimuutta

CSC tuottaa Fairdata-palveluita, joilla korkeakoulut ja tutkimuslaitokset voivat edistää tutkimukseen liittyvien aineistojen avoimuutta, saatavuutta ja säilyvyyttä. Palvelut mahdollistavat tutkimusaineistojen käsittelyn (raaka)datasta kuvailluiksi ja saatavilla oleviksi, laadukkaiksi aineistoiksi, joiden uudelleenkäyttö ja pitkäkestoinen säilyvyys voidaan taata. 

FairLue lisää Avoimuuden edistäjät -palkintodata-palvelujen hyödyntäminen on lisännyt tutkimuksen näkyvyyttä ja palvelut ovat saaneet tunnustusta avoimen tieteen edistämisestä. Palveluiden kehittäminen tutkimusyhteisön tarpeita kuunnellen johti vuoden 2020 Avoimuuden edistäjät -palkintoon, jonka Avoimen tieteen ja tutkimuksen kansallinen ohjausryhmä myönsi Metsähovin radio-observatoriolle ja CSC:lle jatkuvasti kasvavan aineiston saattamisesta avoimesti saataville. Lue lisää: Avoimuuden edistäjät -palkinto.

 

Kansainvälisiä datapalveluita vahvistettiin

CSC tuottaa datanhallinnan palveluita osana eurooppalaista EUDAT datainfrastruktuuria (EUDAT collaborative data infrastructure). Näiden palveluiden tuotteistusta selkeytettiin ja palveluiden kuvauksia päivitettiin CSC:n datanhallinnan uudistetuille www-sivuille.

EUDAT-palveluista tuotetaan avoimen peruspalvelun lisäksi organisaatiokohtaisia palveluita, joissa voidaan huomioida eri organisaatioiden nimenomaiset datanhallinnan tarpeet. EUDAT-palvelut ovat osa eurooppalaista avoimen tieteen pilveä (EOSC). CSC sai viime vuonna merkittävän rahoituksen EUDAT-palveluiden tuottamiseen EU:n EOSC-rahoitushauista. Rahoitettu projekti DICE käynnistyi vuoden 2021 tammikuussa.

CSC liittyi mukaan European COVID-19 Data Portal -palvelun tutkimusdatan hallintaan edistääkseen kansallisten tietojemme hyödyntämistä hankkeessa. Palvelu kerryttää ja jakaa tutkimustietoa koronaviruksesta ja sen vaikutus kansainvälisen tutkimusyhteisön apuna on jo konkretisoitunut. Portaalia koordinoivat EMBL, ELIXIR ja EOSC.

Arkaluonteisen datan palvelukokonaisuuden kehittäminen ja yhteistyö tuottivat uusia palveluja

CSC:n jatkoi vuoden 2020 aikana arkaluonteisen datan hallinnan osaamisen kehittämistä. CSC:n erityisosaaminen käyttäjien identiteetin- ja pääsynhallinnassa varmistaa jo nyt tietoturvalliset ja toimialariippumattomat palveluprosessit mm. eri koulutusasteille, Kansallisarkistolle sekä eurooppalaiselle bio- ja terveystieteiden tutkimusinfrastruktuurille ELIXIRille. CSC:n identiteetin- ja pääsynhallinnan osaamista hyödynnetään myös yhteiseurooppalaisessa GAIA-X-hankkeessa.

CSC:n uusia arkaluonteiselle datalle soveltuvia palveluita pilotoitiin korkeakoulujen sekä tutkimuslaitosten kanssa. Lisäksi näiden palveluiden avulla vauhditettiin kansallisia COVID-19-tutkimusprojekteja sekä varmistettiin Terveyden ja hyvinvoinnin laitoksen (THL) tilaamien COVID-19-positiivisten potilaiden virusgenomien sekvensointitulokset. CSC:n uudet arkaluonteisen datan hallintaan soveltuvat palvelut on tarkoitus julkaista vuoden 2021 aikana laajemmin tutkimuksen ja koulutuksen käyttöön.

Arkaluonteisen datan palvelukokonaisuuden kehittäminen jatkui myös yhteistyössä sosiaali- ja terveysministeriön (STM) kanssa.  CSC osallistuu STM:n Suomen osalta koordinoimaan eurooppalaiseen miljoonan genomin (1+MG) hankkeeseen sekä vastaa Euroopan tasolla yhdistetyn, turvallisen, rajat ylittävän teknisen infrastruktuurin rakentamisen koordinaatiosta. Hanke vahvistaa eurooppalaisia valmiuksia hallita arkaluonteisia tietoja sekä rakentaa kansallisia valmiuksia genomi- ja terveystiedon aineistojen käsittelyyn. STM:n vuonna 2020 julkaisema selvitys ehdotti toimenpiteenä ministeriön hallinnonalan virastojen, Kelan sekä CSC:n yhteistyön tiivistämistä muun muassa genomikeskuksen ja biopankkien datanhallinnan valmiuksien edistämiseksi. CSC valittiin myös sosiaali- ja terveysalan tietolupaviranomaisen Findatan ja Terveyden ja hyvinvoinnin laitoksen (THL) yhteistyökumppaniksi. Findatan tietojärjestelmäratkaisujen kehittäminen edistyi ja palveluiden tuotannosta sovittiin vuoden 2020 lopussa. Palveluiden kehittäminen jatkuu vuonna 2021.

EU-vetoiset hankkeet sensitiivisen terveys- ja biotieteen alueella etenivät.

Tietovarantoja ja palveluja kehittämällä saavutettiin kustannushyötyjä

CSC:n kehittämät tietovarannot ja CSC:n tiedonkeruu- ja tietovaranto-osaaminen jouduttavat suomalaisen  yhteiskunnan digitalisaatiokehitystä. OKM:n eri osastojen tarpeisiin alunperin rakennetut tietovarannot tunnistetaan yhä useammin olennaisiksi tietolähteiksi, joihin kiinnittymällä muut toimijat rakentavat digitaalisia palveluitaan ja toimintaprosessejaan (esimerkiksi kunnat ja kuntayhtymät, Opetushallitus, Ylioppilaiden terveydenhoitosäätiö, KELA, Tilastokeskus, Helsingin seudun liikenne).

CSC:n kehittämä Tiedejatutkimus.fi -portaali avattiin tuotantokäyttöön 9.6.2020. Se on opetus- ja kulttuuriministeriön tarjoama palvelu, joka kokoaa ja jakaa tietoa Suomessa tehtävästä tutkimuksesta. Palvelu parantaa tutkimusta koskevan tiedon ja asiantuntijoiden löytymistä sekä lisää suomalaisen tutkimuksen näkyvyyttä ja yhteiskunnallista vaikuttavuutta. Palvelun toiminta lähti vauhdilla eteenpäin, sillä jo 78 suomalaista tutkimusta tekevää tai tukevaa organisaatiota toimittaa tietoja palveluun. Saadun palautteen perusteella erityisesti tutkimusorganisaatioiden ja –rahoittajien tiedeuutisia kokoava osio on osoittautunut hyödylliseksi, kun esimerkiksi tiedotusvälineet voivat selata kaikkien organisaatioiden uutisia samassa paikassa. Tutkimustiedon hallintaa tukee myös CSC:n tuottama Justus-palvelu, joka tarjoaa kustannustehokkaan ratkaisun julkaisutietojen tallennukseen ja näyttämiseen kansallisissa palveluissa. Vuoden 2020 aikana Justuksen asiakaskunta kasvoi, ja sitä käyttävät nyt kaikkien 24 ammattikorkeakoulun lisäksi kahdeksan tutkimuslaitosta.

CSC liittyi Sitran koordinoimaan TEHDAS-hankkeeseen (Towards the European Health Data Space), joka auttaa Euroopan komissiota ja jäsenmaita kehittämään terveysdatan jakamiseen liittyviä konsepteja hallintamalliin, datan laatuun ja infrastruktuuriin liittyen.

CSC toteutti omistajaohjauksen tavoitteita asiakkaiden toiminnan tehostamisesta integroimalla korkeakouluopiskelijoiden tietovarantoja eri asiointitarpeisiin. Vuonna 2020 CSC integroi VIRTA-tietovarannon tiedot Ylioppilaiden terveydenhoitosäätiön käyttöön myös ammattikorkeakoulujen osalta. CSC on aloittanut 1.1.2021 lähtien VIRTA-tietojen luovutuksen YTHS:lle lain  695/2019 (Laki korkeakouluopiskelijoiden terveydenhuollosta) mukaisten opiskelijaterveydenhuollon palvelujen tuottamista varten myös 146 000 amk-opiskelijan osalta. Integraatiossa on mukana kaikkien korkeakoulujen opiskelijatiedot (aeimmin jo yliopisto-opiskelijat 155 000).

CSC integroi VIRTA-tietovarannon tiedot Ylioppilaiden terveydenhoitosäätiön käyttöön myös ammattikorkeakoulujen osalta.

Varhaiskasvatuksen tietovaranto Varda kehitettiin onnistuneesti viimeiseen tuotantovaiheeseen ja siirtyi Opetushallitukselle ylläpitoon. Käyttäjämäärät ovat kasvaneet uusien ominaisuuksien myötä. Uusi suuri projektitilaus, Varhaiskasvatuksen laadun kehittämisen arviointijärjestelmä Valssi, on osoitus erinomaisesta asiakasluottamuksesta. 

Opetushallinnon ohjaus- ja säätelypalvelu Oivaa kehitettiin uusiin tuotantovaiheisiin. Samalla sen asiakaspohja laajentui kolmeen opetus- ja kulttuuriministeriön osastoon.

Valtakunnallisessa Vipunen-opetushallinnon tietopalvelussa tietosisällön päivityssykliä kehitettiin nopeammaksi ja tietosisältöä laajennettiin.

Opetus- ja kulttuuriministeriötä ja Opetushallitusta tuettiin ammatillisen koulutuksen suoritepäätöslaskennan läpiviennissä. CSC toteutti onnistuneesti vaativan rahoituslaskennan ja tietojen jäädytyksen kokonaisuuden, jonka pohjalta ammatillisen koulutuksen järjestäjien rahoitus jaetaan.

CSC sai valmiiksi Valtiokonttorin ja VM:n tilaaman kuntatalouden tietopalvelun, järjestelmän, jolla kerätään kuntien taloustiedot taksonomian mukaisesti. CSC:n tehtävät laajenivat raportoinnin osalta myös valtiotalouden raporttien laatimiseen. Kuntatalouden tietopalvelun palveluportaalissa tutkihallintoa.fi voi tarkastella laajasti nyt sekä kuntien että valtion taloutta.

CSC:n data-analytiikkapalvelut laajenivat

CSC:n data-analytiikkapalvelut laajenivat valtionhallinnon sektorilla. CSC osallistui kansalliseen valtiovarainministeriön AuroraAI-tekoälyohjelmaan kolmen eri selvityksen myötä: yläkouluikäisten datapohjaisten tilannekuvien luominen, jatkuva opiskelu työelämän tukena ja kansainvälisen opiskelijan tulo Suomeen. CSC tuotti elämäntapahtumien digitalisointimahdollisuuksien arviointikehikon hankkeen käyttöön.

CSC analysoi Senaatti-kiinteistöjen rakennusten data-aineistoja tarkoituksena rakentaa ennustusmalli kiinteistöjen home-ongelman ehkäisemiseksi.

CSC teki Olympiakomitealle selvityksen kilpaurheilun data-alustan teknisistä toteuttamisvaihtoehdoista. Jatkona tälle CSC on laatinut laajemman data-alustan rakentamista koskevaa kuvausta yhdessä Jyväskylän yliopiston, KIHUn ja valmennuskeskusten kanssa. Tavoitteena on data-alustan avulla päästä Suomessa liikunnan ja kilpaurheilun datapohjaiseen valmentamiseen.

CSC teki Olympiakomitealle selvityksen kilpaurheilun data-alustan teknisistä toteuttamisvaihtoehdoista.

CSC:n data-analytiikkapalvelut laajenivat myös OKM:n hallinnonalalla. CSC hyödynsi tässä jo aiemmin kehitettyä ARVO-palvelua luodakseen tiedonkeruujärjestelmän. Sen räätälöidyn version avulla CSC teki ensimmäistä kertaa OKM:n liikuntaosastolle lasten ja nuorten fyysisen aktivisuuden Move!-mittausten datankeruun ja raportoinnin. Järjestelmä mahdollistaa kouluille tietojen syöttämisen, tallentamisen ja raportoinnin vuosittain. Tulokset ovat tarkasteltavissa liikuntaindikaattorit.fi portaalissa.

CSC:n rooli vahvistui EOSCin Suomen aktiviteettien koordinaattorina

CSC jatkoi Euroopan avoimen tieteen pilven (EOSC) kehitystyötä useiden kansainvälisten ja kansallisten kumppaneiden kanssa. 

CSC osallistui aktiivisesti EOSC Team Finland –yhteistyöhön ja EOSC Finnish Forumin perustamiseen yhteistyössä OKM:n, Suomen Akatemian ja Tieteellisten seurain valtuuskunnan kanssa.

CSC koordinoi EOSC Finnish Forumin toimintaa 1.1.2021 alkaen. CSC liittyi EOSC AISBL:iin jäsenenä (EOSC legal entity) ja jatkaa käytännön EOSC-kehitystyötä useissa hankkeissa.

Takaisin ylös Siirry yhteiskuntavastuun sivulle