LUMI tuo uusia mahdollisuuksia tekoälytutkimukseen

 

LUMI tuo uusia mahdollisuuksia tekoälytutkimukseen

LUMI-supertietokone aloittaa toimintansa CSC:n datakeskuksessa Kajaanissa vuoden 2021 alkupuolella ja se tulee olemaan yksi maailman tehokkaimpia tutkimuskäytössä olevia supertietokoneita. LUMIn valtava laskentateho perustuu pääosin suureen määrään grafiikkaprosessoreita eli GPU-prosessoreita. Ne soveltuvat erityisen hyvin erilaisten tekoälyn menetelmien, etenkin syväoppimisen käyttöön.

Tekoälymenetelmien vaatimukset tuntee hyvin tutkija Kimmo Kartasalo Tampereen yliopistosta. Hän on mukana Tampereen yliopiston Biokuvainformatiikan tutkimusryhmässä, jota johtaa apulaisprofessori Pekka Ruusuvuori. Ryhmä koulutti viimeisimmässä hankkeessaan tekoälyn eturauhassyövän diagnosoimiseen ja luokitteluun yhteistyössä Tukholman Karoliinisen instituutin kanssa. Tutkimuksen tulokset osoittivat, että tekoälyjärjestelmä kykeni miltei virheettömästi erottelemaan syöpää sisältävät koepalat hyvänlaatuisista koepaloista. Tutkimus julkaistiin arvostetussa The Lancet Oncology -julkaisussa.

Tekoäly patologin työn tueksi

Väitöskirjaansa viimeistelevä Kartasalo teki tutkimuksessa kuva-analyyttista kehitystyötä: algoritmien kehitystyötä ja testausta.

– Tutkimuksessa skannattiin mikroskooppilaseilla olevat koepalat digitaalipatologisilla skannereilla valtavan kokoisiksi digitaalisiksi kuviksi ja tekoäly analysoi kuvadatan.  Tutkimuksen aineistona käytettiin tuhansia diagnostisia koepaloja, Kartasalo kertoo.

Tällä hetkellä käytäntö terveydenhuollossa on, että patologi käsittelee lasit ja hänen arvionsa perusteella tehdään päätös tarvittavasta hoidosta. Patologeista on kuitenkin pulaa maailmanlaajuisesti ja eturauhassyövän tapauksessa diagnostiikkaa tarvitaan jatkuvasti lisää myös väestön vanhenemisen myötä. Tekoälyn avulla on mahdollista luoda patologeille työkalu, joka voi parantaa työtehoa ja edistää potilasturvallisuutta toimimalla varmuusmekanismina.

– Tutkimuksessa käytettiin syviin neuroverkkoihin perustuvaa tekoälymenetelmää. Neuroverkon opettaminen edellyttää sitä, että opetusalgoritmi käy läpi tuhansia digitaalisia kuvia pikseli pikseliltä. Opetusprosessin aikana neuroverkkomalli sovitetaan niin, että se on mahdollisimman tarkka. Tarkkuus arvioidaan kokeneiden patologien arvioihin verraten, Kartasalo selittää.

Grafiikkaprosessorit nopeuttavat laskentaurakkaa

Prosessi on laskennallisesti hyvin raskas, kun tuhansia ja tuhansia esimerkkejä käydään läpi pikseli pikseliltä. Tässä työssä GPU- eli grafiikkaprosessorit ovat tärkeässä asemassa.

– Opetusalgoritmit, jotka käyvät kuvia läpi neuroverkon opetusvaiheessa on optimoitu siten, että ne voivat hyödyntää grafiikkaprosessoreiden suurta rinnakkaisuutta. Käytännössä laskenta-aika GPU-prosessoreilla on kymmenesosa tai jopa vähemmän verrattuna tavanomaisiin CPU-prosessoreihin.

Tutkimusryhmä käytti laskennassa CSC:n supertietokoneita: CSC:n aiemmalla Taito-klusterilla laskenta-aika saatiin noin parin viikkoon. Lopullinen mallin opettaminen tehtiin CSC:n Puhti-supertietokoneella, jonka pilottikäyttäjiä tutkimusryhmä oli. Puhdissa on entistä enemmän aiempaa nopeampia GPU-prosessoreita, ja näin laskenta-aika tippui pariin kolmeen päivään. Tekoälymallin opettaminen tavallisella CPU:lla olisi vienyt pari-kolme vuotta.

– Jokainen voi varmaan ymmärtää mikä ero sillä on, jos tutkimustuloksia joutuu odottamaan kolme vuotta tai kolme päivää. Eihän tutkimustyötä voi tehdä, ellei prototyyppausta pysty tekemään järkevällä aikajanalla. Todellinen laskennan tarve oli moninkertainen. Lopullinen tekoälymallin opettaminen oli vain jäävuoren huippu monta vuotta kestäneestä tutkimusprojektista: vuosien aikana piti kokeilla erilaisia algoritmeja ja suunnitteluratkaisuja. Tavanomaisilla CPU-prosessoreilla tämä projekti olisi varmaankin jäänyt jälkipolvien viimeisteltäväksi.

Grafiikkaprosessorien lisäksi kova- eli kiintolevyjen nopeus on tärkeässä asemassa etenkin, kun on kyse suuresta data-aineistosta.

– Jos kovalevy on niin hidas, ettei se pysy modernin GPU:n perässä laskentatyössä, niin  kokonaisprosessi on tyypillisesti yhtä hidas kuin sen heikoin lenkki, joka tyypillisesti on kovalevy. Eli sen takia tarvitaan myös hyvin nopeita kovalevyjä ja Puhdilla ja LUMIlla tämäkin on sitten kunnossa, iloitsee Kartasalo.

Monimutkaisempia ongelmia ja uusia tutkimuskysymyksiä  

Kartasalo näkee LUMI-supertietokoneen ja sen valtavan laskentakapasiteetin myötä avautuvan lukuisia erilaisia mahdollisuuksia esimerkiksi tekoälyä hyödyntävän tutkimuksen parissa.

– Jos Puhti oli iso askel aiempaan verrattuna, niin LUMIhan on valtava loikka. Aiempaan verraten voidaan tehdä samankaltaisia asioita, mutta nopeammin. Jos esimerkiksi pääsemme kolmen päivän laskenta-ajasta kolmeen tuntiin, niin se tarkoittaa sitä, että pystytään testaaman uusia ideoita vielä nopeammalla syklillä. Jos aamupäivällä tulee idea, jota haluaa testata, niin lounaan jälkeen on jo tuloksia saatavilla. Tämä kiihdyttää luovaa prosessia.

– LUMI myös mahdollistaa uudenlaisia tutkimuskysymyksiä. Yksi suuntaus on se, että voidaan tarkastella näitä asioita enemmän tilastollisesta näkökulmasta. Suurin osa neuroverkkoalgoritmeista on stokastisia, eli tulokset vaihtelevat eri toistojen välillä. Jos laskentakapasiteettia on saatavilla enemmän ja voidaan tehdä enemmän toistoja, on mahdollista päästä kiinni tekoälyn tuottamien arvioiden epävarmuuksiin. Esimerkiksi lääkärille olisi mielenkiintoista tietää tekoälyn tuottaman diagnoosin lisäksi tieto siitä, kuinka varma tekoäly on päätöksestään. Tämän tyyppisiä asioita voidaan tehdä, kun laskentakapasiteettia saadaan lisää, Kartasalo jatkaa.

Erilaisten datalähteiden yhdistely mahdollistaa aiempaa monimutkaisempien ongelmien mallintamisen.

– Olemme työstäneet myös esimerkiksi rintasyöpään liittyviä kudosnäytteitä. Yhden kuvan takana on taustalla monimutkaisia molekyylitason ilmiöitä. Tekoälyn avulla molekyylitason dataa voidaan yhdistää kuvasta saatuun informaatioon ja tehdä päätelmiä näiden tietojen avulla.

– Lisäksi toivoisin, että lisääntynyt laskentakapasiteetti voisi tukea sitä, että tekoälyä otettaisiin käyttöön myös varsinaisen tekoälytutkimuksen ulkopuolella. Meille, jotka kehitämme tekoälysovelluksia, tekoäly on työkalu, mutta se on myös itsessään kiinnostava tutkimuskohde. Toivottavasti aika olisi kypsä sille, että tekoälyä voitaisiin käyttää muillakin tieteenaloilla, sanotaan nyt vaikka yhteiskuntatieteissä, Kartasalo jatkaa.

Lopuksi Kartasalo kannustaa muita tutkijoita laaja-alaiseen ajatteluun ja tutkimuskysymysten muodostamiseen LUMI-supertietokonetta silmällä pitäen jo nyt.

– Nyt on hyvä hetki viedä ideoita tutkimussuunnitelmiksi. Olisi hienoa, jos tutkimusta pystyttäisiin tekemään tieteenalarajojen yli: ruvettaisiin keksimään semmoisia tutkimuskysymyksiä, joihin olisi haluttu aiemmin vastata, mutta joihin ei ole pystytty vastaamaan. Meillä on pian kohtalaisen ainutlaatuinen tilaisuus hyödyntää tämmöistä supertietokonetta ja vastata kaikenlaisiin kysymyksiin, jotka ovat aiemmin olleet mahdottomia. Eli otetaan ilo irti!

Katso videolta, mitä Kimmo Kartasalo kertoo tutkimusryhmänsä tutkimuksesta ja tekoälyyn liittyvistä kysymyksistä:

 

Artikkeli:
"Artificial intelligence for diagnosis and grading of prostate cancer in biopsies: a population-based, diagnostic study"

Peter Ström, Kimmo Kartasalo, Henrik Olsson, Leslie Solorzano, Brett Delahunt, Daniel M Berney, David G Bostwick, Andrew J. Evans , David J Grignon, Peter A Humphrey, Kenneth A Iczkowski, James G Kench, Glen Kristiansen, Theodorus H van der Kwast, Katia RM Leite, Jesse K McKenney, Jon Oxley, Chin-Chen Pan, Hemamali Samaratunga, John R Srigley, Hiroyuki Takahashi, Toyonori Tsuzuki, Murali Varma, Ming Zhou, Johan Lindberg, Cecilia Lindskog, Pekka Ruusuvuori, Carolina Wählby, Henrik Grönberg, Mattias Rantalainen, Lars Egevad, Martin Eklund.
The Lancet Oncology, Jan. 8, 2020

Tutustu LUMIn verkkosivuihin osoitteessa www.lumi-supercomputer.eu

Lisää tästä aiheesta » Siirry sisältöihin ja uutisiin »

Anni Jakobsson