Biologista kuvadataa voi nyt analysoida CSC:n superlaskentaympäristössä web-selaimella
Biologisessa kuva-analyysissä tarvitaan laajaa tallennus- ja laskentakapasiteettia. Tutkijat voivat nyt siirtää laskentansa Googlen pilvipalvelusta CSC:n maksuttomaan ympäristöön uuden sovelluksen avulla. Vastaavalla tavalla on mahdollista vaihtaa yhdestä superlaskentaympäristöstä toiseen.
CSC – Tieteen tietotekniikan keskuksen sovellusasiantuntija Laxmana Yetukuri ja Turun Biokeskuksen erikoistutkija Michael Courtney ovat kustomoineet grafiikkaprosessoreilla varustettujen kannettavien tietokoneiden liittämisen CSC:n superlaskentaympäristöön, jotta niitä voidaan käyttää syväoppimisen mallien luomiseen biologisesta kuvantamisdatasta.
Kannettavat laitteet on kehitetty Turun Biokeskuksen ryhmässä. Tarjolla on myös avoimen lähdekoodin työkalupakki ImageJ/Fiji syväoppimisen mallien luomiseen mikroskopiassa. Sen käyttöä tutkitaan CSC:ssä, ELIXIR-infrastruktuurin Suomen noodissa.
Turun Biokeskuksessa on käytetty Googlen Colab Notebook -pilvipalvelua, jonka kautta voi analysoida ja visualisoida dataa. Laajan skaalan dataintensiivinen tutkimus kohtaa kuitenkin rajoitteita, kun käytetään Googlen maksuttomia palveluja. Tutkijat tarvitsevat huomattavasti peruskäyttäjää enemmän tallennus- ja laskentakapasiteettia datankäsittelyyn.
CSC:n superlaskentaympäristö tarjoaa akateemisille käyttäjille ylivertaisen maksuttoman tallennus- ja laskentakapasiteetin, ja nyt Google Colab-ympäristön voi vaihtaa CSC:n laskentapalveluun. Henkilökohtaisella tietokoneella pääsee helposti CSC:n laskentaympäristöön web-selaimen avulla. Tätä sujuvoittavat CSC:n supertietokoneiden hiljattain kehitetyt, käyttäjäystävälliset käyttöliittymät.
Helppojen ohjeiden avulla eteenpäin
Tutkijat voivat siirtää laskentansa Googlen Colabista CSC:n ympäristöön käyttämällä CSC:ssä kehitettyä konttitekniikkaa. Sovellusten kontittamisen (container wrapper) avulla tutkijat saavat määrittää vakioidun ympäristön, jossa he voivat ajaa tieteellisiä ohjelmistojaan. Ohjelman koodi kirjastoineen ja asetuksineen asetetaan konttiin. Kun ohjelmistot ja data on paketoitu kontissa omaan wrapper-työkaluun, seuraavat käyttäjät voivat aloittaa sovelluksen käytön ilman esiasennuksia. Samanlaista menettelytapaa voidaan soveltaa, jos halutaan vaihtaa yhdestä superlaskentaympäristöstä toiseen.
”Teemme tutkijoiden työn helpommaksi. Meillä on helpot ohjeet sovelluksen asentamiseen kustomoituihin tietokoneisiin. Kun projektin jäsen asentaa sovelluksen, muiden tutkijoiden ei tarvitse asentaa mitään ohjelmistoja käyttääkseen näitä kustomoituja koneita, vaan he voivat heti aloittaa työskentelyn. CSC:n laskentaympäristöön pääsee käyttöliittymän (www.puhti.csc.fi) avulla muutamalla klikkauksella”, Laxmana Yetukuri sanoo.
Biologinen kuva-analyysi tarvitsee laajempaa levytilaa
”Biologinen kuva-analyysi tarvitsee laajempaa levytilaa tallentamiseen. CSC:n ALLAS tarjoaa hyvän tallennusympäristön. Laskentaympäristöön pääsee, kun on saanut käyttäjätunnuksen CSC:ltä”, Yetukuri jatkaa.
Biologinen kuvantaminen ja kuvien data-analyysi hyödyntää algoritmeja, joiden avulla kuvista saadaan merkittävä määrä lisää informaatiota. Informaatiota voidaan käyttää hahmontunnistukseen ja kuvadatan luokitteluun, jolloin saadaan biologisesti merkittävää informaatiota.
Lue ELIXIR Suomen sivuilta koko artikkeli siitä, miten koneoppimisen malleja kehitetään aivohäiriöitä aiheuttavien SYNGAP1-geenivarianttien tunnistamiseen sekä tulevaisuudessa lääkeseulontaan.