Tekoäly tunnistaa eturauhassyövän lähes virheettä

Tekoälyn kouluttamiseksi ja testaamiseksi tutkijat skannasivat digitaalisesti yli 8000 eturauhasen koepalaa. Kuva: Kimmo Kartasalo.

Tekoäly tunnistaa eturauhassyövän lähes virheettä

Tommi Kutilainen

Tampereen yliopiston ja Tukholman Karoliinisen instituutin tutkijat kouluttivat tekoälyn eturauhassyövän diagnosoimiseen ja luokitteluun. Tekoälyjärjestelmä kykeni miltei virheettömästi tunnistamaan syöpää sisältävät koepalat. CSC:n alkusyksyllä 2019 pilottikäyttöön avattu supertietokone Puhti-AI osallistui työn loppuvaiheen laskentaan. Tutkimus julkaistiin arvostetussa The Lancet Oncology -lehdessä.

Tekoälyn kouluttamiseksi ja testaamiseksi tutkijat skannasivat digitaalisesti yli 8000 eturauhasen koepalaa. Kymmenistä syvistä neuroverkoista koostuva tekoälyjärjestelmä opetettiin erottelemaan hyvänlaatuiset sekä syöpää sisältävät eturauhaskoepalat toisistaan. Syöpäkudos luokiteltiin edelleen niin sanotun Gleason-pisteytyksen mukaisesti syövän aggressiivisuutta kuvaaviin luokkiin.

Tekoälyn opetukseen käytettiin noin kuutta miljoonaa kuvaa, jotka poimittiin digitaalisesti skannatuista koepaloista. Kuvadataa oli noin 30 teratavua ja lopullinen opetusaineisto koostui yli 2 biljoonasta pikselistä.

"Puhdin käyttöönotto sujui pilotointivaiheessa lähes hämmentävän sujuvasti ja lisäys suorituskykyyn oli välitön"

 

 

 

– Neuroverkkomallien sovitus tehdään yleisesti grafiikkasuorittimilla, koska näin saavutetaan parhaimmillaan monikymmenkertainen nopeus CPU-laskentaan verrattuna. Karkeasti arvioiden tavanomaisella yksittäisellä CPU:lla mallimme opetus olisi vienyt vähintäänkin kuukausia, ehkä jopa vuosia. Taito-GPU:ta ja Tampereen Narvi-klusteria hyödyntäen opetus onnistui 1–2 viikossa. Työn loppumetreillä malli oli vielä sovitettava kertaalleen uudestaan, mutta tässä vaiheessa pystyimme onneksi hyödyntämään Puhtia, jolla kokonaislaskenta-aika putosi 2–3 päivään, Pekka Ruusuvuori kertoo. Ruusuvuori vastasi Tampereen yliopiston osuudesta tutkimushankkeessa.

– Puhdin käyttöönotto sujui pilotointivaiheessa lähes hämmentävän sujuvasti ja lisäys suorituskykyyn oli välitön, sanoo Tampereen yliopiston väitöskirjatutkija Kimmo Kartasalo, joka vastasi tutkimuksen käytännön toteutuksesta yhdessä ruotsalaisten väitöskirjatutkijoiden kanssa.

GPU-suorittimet ja nopeat levyt keskeisessä asemassa

Grafiikkasuorittimien lisäksi laskennassa olennaiseksi osoittautui nopea levykapasiteetti. Aineiston laajuuden vuoksi sen lukeminen kokonaisuudessaan keskusmuistiin ei ole mahdollista eikä tehokasta, joten kuvadataa on kyettävä puskuroimaan lennosta keskusmuistiin sitä mukaa kun grafiikkasuoritin prosessoi sitä.

– Tämän prosessin optimointi oli työn kannalta olennaista ja tulemme jatkamaan sitä seuraavissa projekteissamme, Ruusuvuori kertoo.

CSC:n laskentakapasiteetin merkitys tutkimukselle oli kriittinen, eikä työ olisi ollut toteutettavissa näin laajalla aineistolla ilman modernia GPU-kapasiteettia.

–  Osa rooliamme tässä yhteistyössä olikin mahdollistaa laajamittainen laskenta. Lopullisen mallin opettamisen lisäksi laskentaresurssien merkitys oli keskeinen jo työn alkuvaiheissa, koska tällöin pystyimme prototyyppaamaan Taito-GPU:lla ja Tampereen klusterilla mm. erilaisia neuroverkkoarkkitehtuureja sekä eri parametriyhdistelmiä rinnakkain. Tällöin havaitsimme nopealla tahdilla, mihin suuntaan kehitystyötä kannattaa viedä. Puhdilla tällainen prototyyppaus tulee olemaan jatkossa vielä huomattavasti nopeampaa, mikä tulee tehostamaan tutkimustyötämme, Ruusuvuori jatkaa.

Lähes täydellinen tunnistustarkkuus

Tulokset osoittivat, että tekoälyjärjestelmä kykeni miltei virheettömästi erottelemaan syöpää sisältävät koepalat hyvänlaatuisista koepaloista. Tekoäly onnistui myös arvioimaan suurella tarkkuudella syöpäkudoksen pituuden kussakin koepalassa, joka on diagnostisesti olennainen lisätieto.

Kun tarkasteltiin tekoälyn suorituskykyä eturauhassyövän vakavuuden arvioinnissa niin sanottua Gleason-luokitusta käyttäen, järjestelmän havaittiin niin ikään tuottavan asiantuntijoiden kanssa vertailukelpoisia tuloksia.

– Tarkoitus ei ole kuitenkaan syrjäyttää ihmisasiantuntijoita, vaan tarjota patologeille työkalu, joka voi toisaalta parantaa työtehoa, mutta samanaikaisesti myös edistää potilasturvallisuutta toimimalla varmuusmekanismina, sanoo tutkimusta johtanut dosentti Martin Eklund Karoliinisesta instituutista.

Lupaavista tuloksista huolimatta lisätyötä vaaditaan vielä, ennen kuin tekoälypohjainen diagnostiikka on arkipäivää kliinisessä käytössä. Keskeinen edellytys tekoälyn laajalle hyödyntämiselle on varmuus siitä, että järjestelmä toimii luotettavasti myös kliinisessä arjessa, jossa koepalojen ulkonäkö vaihtelee muun muassa eri laboratorioiden ja eri skannerilaitteiden välillä.

– On varmistettava, että hyvä suorituskyky yleistyy eri lähteistä kerättävään dataan ja että tekoäly pystyy toimimaan luotettavasti myös kohdatessaan datassa jotain odottamatonta. Todenmukaisessa, mutta kontrolloidussa koeasetelmassa on mahdollista saavuttaa erittäin korkea diagnostinen tarkkuus, ja seuraava askel on keskittyä niihin virhelähteisiin, joita tekoälyn on kyettävä sietämään laajassa kliinisessä käytössä, Pekka Ruusuvuori sanoo.

 

Artikkeli:

"Artificial intelligence for diagnosis and grading of prostate cancer in biopsies: a population-based, diagnostic study"

Peter Ström, Kimmo Kartasalo, Henrik Olsson, Leslie Solorzano, Brett Delahunt, Daniel M Berney, David G Bostwick, Andrew J. Evans , David J Grignon, Peter A Humphrey, Kenneth A Iczkowski, James G Kench, Glen Kristiansen, Theodorus H van der Kwast, Katia RM Leite, Jesse K McKenney, Jon Oxley, Chin-Chen Pan, Hemamali Samaratunga, John R Srigley, Hiroyuki Takahashi, Toyonori Tsuzuki, Murali Varma, Ming Zhou, Johan Lindberg, Cecilia Lindskog, Pekka Ruusuvuori, Carolina Wählby, Henrik Grönberg, Mattias Rantalainen, Lars Egevad, Martin Eklund.
The Lancet Oncology, Jan. 8, 2020