Neuroverkkoalgoritmit sopivat hyvin hahmontunnistukseen ja sellaisiin sovelluksiin, joissa virheet eivät ole kriittisiä. Ne eivät kuitenkaan pysty tuottamaan selitystä toiminnalleen, eikä niitä voida validoida ilman laajoja kokeellisia tutkimuksia. Lääketieteellisessä päätöksenteossa virheillä voi olla vakavia seurauksia ja on tärkeää, että päättelyketjut ovat todennettavissa jälkeenpäin. Symbolinen tekoäly pystyy tuottamaan ymmärrettävät selitykset ratkaisuista. Viime vuosien merkittävät edistysaskeleet symbolisen tekoälyn tutkimuksessa tekevät sen erityisen soveltuvaksi lääketieteellisiin ohjeistoihin perustuvaan päättelyyn. Tämä avaa uusia mahdollisuuksia helpottaa terveydenhuollon ammattilaisten työtä.
Neuroverkkoihin perustuva tekoäly1 on ollut viimeisten kymmenen vuoden kuumimpia teknologioita. Tietokoneiden laskentakapasiteetin kasvun ansiosta se on löytänyt monia käytännön sovelluksia. Kuvien ja puheen tunnistus ovat hyviä esimerkkejä tästä, samoin vastasyntyneiden vauvojen verenmyrkytyksen varhainen tunnistaminen laboratoriotulosten automaattisen tulkinnan perusteella. Tekoälystä onkin käytännössä tullut monikerroksisen neuroverkkolaskennan synonyymi.
Suuren innostuksen kääntöpuolena on ollut se, että tämän teknologian soveltuvuuteen ja sen rajoitteisiin ei ole kiinnitetty tarpeeksi huomiota.
Lääketieteellisessä päätöksenteossa neuroverkkoalgoritmien näkyvin ongelma on se, että ne eivät kykene selittämään ratkaisujaan.
Ehkä merkittävämpi ongelma on näiden algoritmien hauraus: niissä on ennakoimattomia epäjatkuvuuskohtia, joissa hyvin pieni muutos syötetyssä datassa aiheuttaa suuren muutoksen päättelyssä 2. Ihmiselle lähes huomaamaton muutos kissan kuvassa voi aiheuttaa sen, että algoritmi luokittelee sen tuoliksi. Itseohjautuvien autojen kohdalla tällaisesta on seurannut jopa kuolemaan johtaneita onnettomuuksia, kun järjestelmä ei ole yllättäen tunnistanut toista ajoneuvoa tai ihmistä.
Vaikka neuroverkkoalgoritmeja kutsutaan “syväoppimiseksi”, on niiden oppiminen todellisuudessa hyvin pinnallista, sillä ne eivät kykene muodostamaan käsitteitä, eivätkä niiden välisiä suhteita 3. Ne pystyvät ainoastaan hyödyntämään tilastollisia yhteyksiä niille syötetyssä opetusaineistossa. Kehittyneimmätkään toteutukset 4 eivät kykene ymmärtämään käsitteitä, eivätkä sitä mitä “ei” tarkoittaa käsitteiden yhteydessä 5. Monissa sovelluksissa ne tarvitsevat valtavan määrän ihmisen luokittelemaa opetusmateriaalia, mikä tekee niiden käyttöönotosta hidasta ja kallista.
Tekoälytutkimuksen historiassa eri lähestymistavat ovat vuorollaan ottaneet merkittäviä edistysaskeleita, niiden suosion muuttuessa vastaavasti. Oppivan neuroverkkolaskennan idea esitettiin jo vuonna 1943 ja se on samankaltainen yleistettyihin lineaarisiin malleihin perustuvan tilastotieteellisen päättelyn kanssa. Silloisten algoritmien ongelmat johtivat neuroverkkolaskennan hylkäämiseen 1960-luvun lopulla, jolloin symbolinen tekoäly tuli valtasuunnaksi.
Sääntöpohjaiset, symboliseen tekoälyyn perustuvat asiantuntijajärjestelmät saavuttivat kaupallista menestystä 1980-luvulla, mutta tietokoneiden laskentatehon riittämättömyys ja järjestelmien kykenemättömyys nonmonotoniseen logiikkaan johtivat umpikujaan yleisen älykkyyden rakentamisessa. Sääntöpohjaiset asiantuntijajärjestelmät muuttuivat kuitenkin normaaliksi tavaksi toteuttaa tuotekonfiguraatiojärjestelmiä tai automatisoida erilaisten hakemusten käsittelyä. Myös erilaiset tietokonepohjaiset ongelmanratkaisun apurit, kuten verkkoyhteysongelma-apurit, hyödyntävät sääntöpohjaisia asiantuntijajärjestelmiä.
Neuroverkkoalgoritmien kehittyminen johti 1990-luvulla jälleen paradigman muutokseen, jonka seurauksena symbolinen tekoäly jäi varjoon. Tietoverkkojen nopeuden ja käytettävissä olevan tallennustilan nopea kasvu yhdistyneenä näihin uusiin algoritmeihin houkutteli ajattelemaan, että käsitteet ja ymmärrys voidaan ohittaa, kunhan käytettävissä on riittävästi dataa. On toki monin verroin halvempaa antaa tietokoneen rakentaa neuroverkkomallia datamassoista, kuin käyttää ihmisen asiantuntemusta ja ymmärrystä.
Neuroverkkomalleista on kuitenkin paljastunut merkittäviä ongelmia. Osa näistä on hyvin perustavia, eikä niihin toistaiseksi ole löydetty ratkaisuja 6. Erityisesti päättelyn läpinäkymättömyys ja algoritmien yllättävät virheet tekevät niiden soveltamisen lääketieteelliseen päätöksentekoon vaikeaksi ja riskialttiiksi.
Symbolisen tekoälyn tutkimus on ottanut merkittäviä edistysaskelia viimeisimmän vuosikymmenen aikana.
Non-monotonisen päättelyn kehittyminen on tehnyt mahdolliseksi mallintaa paremmin asiantuntijan päättelyä. Siinä uusi tieto saattaa johtaa aiemman päättelyn hylkäämiseen, jonkin tiedon puuttuminen voidaan korvata oletuksella ja jonkin tiedon puuttuminen on eri asia kuin se, että se tiedettäisiin epätodeksi.
Näiden edistysaskelten ansiosta asiantuntijajärjestelmä pystyy tarjoamaan luotettavia ratkaisuja laajojenkin kliinisten ohjeistusten perusteella – ja jopa silloin, kun osa tiedosta puuttuu. Ja mikä tärkeintä, se kykenee kommunikoimaan käyttäjälleen miksi se on päätynyt suositukseensa ja mitä oletuksia se on tehnyt, jotta käyttäjä voi hankkia tarvittavat lisätiedot oletusten varmistamiseksi.
Monissa lääketieteellisissä ohjeistoissa (esim. Käypä hoito -suositukset), on useita kymmeniä muuttujia ja satoja sääntöjä. Noin 60 sääntöä on todettu rajaksi, jonka jälkeen ohjeistuksen täsmällinen noudattaminen on hyvin vaikeaa jopa kokeneille lääkäreille 7. Poikkeamat ohjeistuksista voivat vaikuttaa epäedullisesti potilaan ennusteeseen, kuten esimerkiksi syövän hoidossa 8.
Ohjeiston siirtäminen lääkäriä avustavaan asiantuntijajärjestelmään on luonnollinen kehitysaskel. Suositusten 90%:nen yhtenevyys asiantuntijajärjestelmän ja kokeneen erikoislääkärin välillä on saavutettavissa 9. Niissä tapauksissa, joissa suositukset eroavat, johtuvat erot osin siitä, että kliinikolla on käytettävissään suositusten ulkopuolista tietoa, osin henkilökohtaisista mieltymyksistä ja osin siitä, että ihmiset ovat erehtyväisiä. Tässä viimeisessä tapauksessa asiantuntijajärjestelmän hyöty on erityisen selkeä.
Symbolisen tekoälyn hyödyt neuroverkkoihin verrattuna ovat selvät. Päättely voidaan osoittaa ohjeistoa vastaavaksi, koska säännöt vastaavat muodoltaan ohjeistusta. Järjestelmä tuottaa luotettavat selitykset antamiinsa suosituksiin. Järjestelmä voi antaa suositukset myös vajavaisen tiedon perusteella ja kertoa lääkärille mitä lisätietoa pitää hankkia.
Terveydenhuollon resurssikriisissä tarvitaan uusia ratkaisuja, jotka vapauttavat korkeasti koulutetun henkilöstön aikaa potilaiden auttamiseen. Symboliseen tekoälyyn perustuvien asiantuntijajärjestelmien avulla voidaan säästää merkittävä työpanos ja samalla parantaa hoidon laatua.
Kiitos Christian Hellstenille arvokkaista kommenteista ja keskusteluista.
Mikko Tiihonen, erikoislääkäri, tuotekehitysjohtaja
1) https://fi.wikipedia.org/wiki/Neuroverkot
2) Heaven, D., https://www.nature.com/articles/d41586-019-03013-5
3) https://www.theatlantic.com/technology/archive/2018/01/the-shallowness-of-google-translate/551570/
4) https://en.wikipedia.org/wiki/BERT_(language_model)
5) Ettinger 2020. Trans. Assoc. Comput. 8: 34–48.
6) Bengio et al. 2021. Commun. ACM 64(7), 58-65.
7) Group 2006. JACS 202(5): 826-836.
8) Bade et al. 2019. Chest 155(3): 456-457.
9) Chen et al. 2018. IEEE J. Transl. Eng. Health. Med. 6: 2800810.