Infrastructure (GDI) aloituspaketti – yksi askel kohti genomidatan yhteiskäyttöä Euroopassa
The European Genomic Data Juuri lanseerattu GDI-projektin aloituspaketti on pilottihanke, jolla vastataan tarpeeseen luoda avointen standardien mukainen yhdistetty, kestävä, yhteentoimiva ja turvallinen infrastruktuuri arkaluonteisia genomitietoja varten.
Eurooppalainen genomidatainfrastruktuuri (GDI) pyrkii toteuttamaan 1+MG-aloitteen kunnianhimoista tavoitetta. Datapalveluiden avulla halutaan mahdollistaa ihmisen genomitiedon ja vastaavien kliinisten tietojen turvallinen saatavuus Euroopassa. Äskettäin julkaistu GDI:n aloituspaketti (starter kit) on hankkeen keskeinen tuotos, joka tukee datan yhdistettyjä työnkulkuja. Siitä hyötyvät GDI:n kansallisten keskusten lisäksi tulevaisuudessa myös julkiset laitokset ja yritykset, jotka voivat käyttää aloituspaketin sisältämiä ohjelmistotekniikoita. Näin ne voivat lisätä palveluiden yhteentoimivuutta sisällyttämällä nämä ohjelmistot ja standardit omaan ympäristöönsä.
Tämä kehitys on ollut myös yksi keskeisistä tavoitteista Suomen kansallisessa 1+ miljoonaa genomia -aloitteessa, jota sosiaali- ja terveysministeriö koordinoi ja opetus- ja kulttuuriministeriö tukee. Tavoitteena on lisäksi lisätä kansallisten biopankkien datan yhteentoimivuutta ja mahdollistaa niiden liittyminen Euroopan maiden rajat ylittävään hajautettuun datainfrastruktuuriin. Tällä hetkellä genomitiedon siirto ja hyödyntäminen eivät toimi yli rajojen.
GDI-hankkeen tavoitteena on luoda julkisen luottamuksen arvoinen tietoverkko, jossa säilytetään yli miljoona ihmisen genomisekvenssiä tutkimusta ja kliinistä vertailua varten. Tämä luo mahdollisuuksia valtioiden ja eri sidosryhmien rajat ylittäville toimille, joita tarvitaan esimerkiksi yksilöllistetyn lääketieteen edistämiseksi. Valtuutetut tietojen käyttäjät, kuten kliinikot, tutkijat ja innovaattorit, pystyvät edistämään genomiikan ymmärtämistä aiempaa tarkemman ja nopeamman kliinisen päätöksenteon, diagnostiikan, hoitojen ja ennakoivan lääketieteen sekä kansanterveystoimenpiteiden parantamiseksi. Tämä hyödyttää Euroopan kansalaisia, terveydenhuoltojärjestelmiä ja taloutta.
Datainfrastruktuuri
Aloituspaketti sisältää avoimen lähdekoodin ohjelmistojen referenssitoteutuksia. Nämä muodostavat perustan infrastruktuuripalveluille, joita 20 GDI-keskusta kehittävät yhdessä. Aloituspaketti käyttää avoimen lähdekoodin ohjelmistoja, ja se toteuttaa sekä ISO-standardien että avoimen yhteisön standardien, kuten Global Alliance for Genomics and Health (GA4GH), vaatimukset. Aloituspaketti on kansallisia keskuksia tukeva pilottihanke. Se osoittaa, miten joukko sovelluksia ja komponentteja voidaan yhdistää määriteltyjen standardien avulla turvalliseksi ja hajautetuksi datainfrastruktuuriksi. Datainfrastruktuuri tarjoaa 5 päätoimintoa:
Dylan Spalding, vanhempi koordinaattori, CSC: ”Aloituspaketin tuotteiden kehittämistä ovat johtaneet tuoteomistajat neljästä eri maasta: Dominik F. Bučík ja Lukas Hejtmanek (Tšekki), Meeri Hakala (Suomi), Albert Hornos ja Jordi Rambla (Espanja) sekä Johan Viklund ja Dimitris Bampalikis (Ruotsi). Näitä tuotteita ei ole kehitetty erillään GDI aloituspaketista, vaan yhteistyössä muiden hankkeiden, kuten Federated EGA:n, kanssa. Tämä auttaa varmistamaan aloituspaketin teknisen yhteentoimivuuden muiden genomitiedon jakamisalustojen kanssa. Se esittelee GDI:ssä käytettäviksi ehdotetut standardit, jotka yhdistävät eri komponentit ja tuotteet toisiinsa. Standardien tavoitteena on tehdä datasta mahdollisimman pitkälle FAIR-periaatteiden mukaista.”
Tommi Nyrönen, Suomen ELIXIR-keskuksen ohjelmajohtaja: ”Suomi ja Ruotsi johtavat yhdessä eurooppalaisten genomidatainfrastruktuuripalvelujen teknistä kehitystä. Meidän pohjoismaisten toimijoiden visio on, että useita aloituspakettiin sisältyviä avoimen lähdekoodin ohjelmistotuotteita voidaan käyttää kansallisissa datakeskuksissa eri puolilla Eurooppaa. Nämä palvelut muodostavat sitten eurooppalaisen selkärangan, jonka avulla voidaan turvallisesti hallita ihmisnäytteistä saatua arkaluonteista tietoa yhteistyössä biopankkien kanssa. GDI-tuloksia voidaan siis ottaa käyttöön heti, kun meillä on sen mahdollistava lainsäädännöllinen kehys.”
Tutkimusprofessori Markus Perola, THL: Kansallisten terveydenhuoltojärjestelmien parantamiseen tähtäävän tutkimuksen näkökulma on kerätä tilastollisesti merkittäviä, korkealaatuisia ja monipuolisia tietokokonaisuuksia. Genomitiedon sisällyttäminen tähän pyrkimykseen on nykyään olennainen osa tätä työtä. Se tarjoaa molekyylitason tietoa siitä, miten kukin solu ja yksilö reagoivat ympäristönsä muutoksiin. GDI-hankkeessa Suomen kansallinen terveysviranomainen THL vastaa yhdenmukaistettujen tietokokonaisuuksien toimittamisesta annettujen standardien ja prosessien mukaisesti. Tietoinfrastruktuuripalveluilla pyritään varmistamaan, että tiedot on tallennettu turvallisesti ja että ne ovat saatavilla ihmisten terveystutkimusta varten asianmukaisen tiedonsaantirakenteen avulla.
Tämä lanseeraus on ensimmäinen versio aloituspaketista, jota kehitetään edelleen hankkeen aikana iteratiivisen lähestymistavan mukaisesti.
About GDI
The European Genomic Data Infrastructure (GDI) project is enabling access to genomic and related phenotypic and clinical data across Europe. It is doing this by establishing a federated, sustainable and secure infrastructure to access the data. It builds on the outputs of the Beyond 1 Million Genomes (B1MG) project and is realising the ambition of the 1+Million Genomes (1+MG) initiative.
GDI project receives funding from the European Union´s Digital Europe Programme under grant agreement number 101081813.