Blogi: Tule maalle, näe mullin malli!

15. huhtikuuta 2021

Viime aikoina uutisoinnissa on ollut monella tapaa poikkeuksellisia aiheita. Epätavallista on ollut myös puhe malleista. Yleinen keskustelu malleista on niin uutta ja hämmentävää, ettei edes sopivaa sanaa löydy: mallinnos, mallinnus vai mallitus?

"Ehkä ne kuitenkin voisivat olla vähän realistisempia", kommentoi joku koronamallien ennustuksia. Mutta mikä sitten tekee mallista realistisen? Jotta tähän voisi vastata, pitänee ymmärtää, mikä malli on, ja mitkä sen rajat ovat. Se ei ole hyperkopio maailmasta, vaan yksinkertaistettu kuvaus. Toivomus realistisemmasta mallista sisältää piilotetun ajatuksen, että toivoja tietää paremmin, kuinka asiat ovat. Jälkeenpäin katsoen voi verrata, toteutuivatko ennusteet, ja jälkiviisaushan on viisauden lajeista paras. Monimutkaisissa systeemeissä aiempi kehitys ei silti välttämättä vastaa tulevaa kehitystä, ja mallin pätevyysalue voi jäädä kapeaksi.

Mikrobiologisessa elintarviketurvallisuudessa sovelletaan myös malleja; esimerkiksi bakteerien kasvu- ja inaktivaatiomalleja. Bakteerien kasvua elintarvikkeessa on voitu mallintaa kenties vain rajatulla pH-alueella ja tietyissä lämpötiloissa, eikä saatuja tuloksia voi suoraviivaisesti jatkaa kovin toisenlaisiin pH-arvoihin ja lämpötiloihin. Aivan toisenlaisessa asiayhteydessä avaruussukkulan rakettien tiivisterenkaiden kestävyyttä voitiin mallintaa enimmäkseen positiivisissa lämpötiloissa todellisissa laukaisuolosuhteissa, eikä arvio pätenyt pakkasessa 28. tammikuuta 1986. Malli itsessään voi olla realistinen, mutta siihen käytetty data on rajoittunutta. Ja vaikka dataa kertyisi yhä enemmän, sitä ei välttämättä kerry oikeista asioista. On tilanteita, joissa mikään määrä dataa ei tuottaisi lisäarvoa! Tätä kutsutaan rakenteelliseksi identifioituvuusongelmaksi.  Toisinaan epävarmuus kutistuu, kunhan dataa kerätään enemmän.

Hyvällä koesuunnittelulla voidaan saada informatiivisempaa dataa, mutta kokeet maksavat. Usein dataa kerätään yhteiskunnassa aivan muuhun tarkoitukseen kuin riskinarviointimalleja varten, eikä se silloin välttämättä sovellu niihin kovin suoraviivaisesti. Kaikkia tilanteita ei mallikaan voi huomioida. Vaikka bakteerikasvumalli olisi laadittu lukemattomiin erilaisiin jääkaappiolosuhteisiin, se ei välttämättä pidä paikkansa, jos joku keksii säilyttää ruokaansa vielä aivan toisella tavalla. Onko malli silloin ollut väärässä? Malli ei voi tietää kaikkea, mitä ihminen saattaa keksiä tehdä, ja ihminen on ratkaiseva tekijä useimmissa ihmisen terveyttä koskevissa asioissa. Malli voi ennustaa, että ”jos toimit näin, tulos olisi todennäköisesti tämä”, mutta jos toimit toisin.... good luck!

Arvion epävarmuuttakin voidaan arvioida

Mikä sitten on mahdollista? Monesti on vain tehtävä paras arvio sillä, mitä on. Mutta arvion epävarmuutta voidaan usein myös arvioida, paitsi kuvailevasti myös laskennallisesti. Epävarmuuksien laskeminen ja integroiminen osaksi malleja on kehittyvää tutkimusta ja tarpeellista kvantitatiivisessa riskinarvioinnissa. Tämä on jo nykypäivää. Tällöin ennusteväli ei ole vain kuviteltu skenaario parhaasta ja pahimmasta vaihtoehdosta, vaan koko spektri, jossa toiset tulokset ovat todennäköisempiä kuin toiset. Miten todennäköisiä, sen määrää käytettävissä oleva uusi evidenssi yhdessä sen kanssa, mitä asiasta jo ennalta tiedetään. Ja kun evidenssi päivittyy, tarvitaan oppivia malleja, jotka päivittyvät evidenssin mukana. Moderni malli ei ole jähmettynyt kokoelma irrallisia oletettuja parametriarvoja, vaan todennäköisyyslaskentaan perustuva kokonaisuus, jonka ennuste määräytyy jatkuvasti muuttuvasta tiedosta. Päätökset vaativat tuekseen tutkittua tietoa, jota on päivitettävä yhä nopeammin. Mallien täytyisi olla myös avoimia ja toistettavissa. Tähän tarpeeseen kehitetään erilaisia portaaleja mallien julkaisemista varten. Tällainen elintarviketurvallisuuden riskinarviointeja varten suunnattu mallikirjasto on RAKIP.

Usean tietolähteen hyödyntämisessä puhutaan jo evidenssin synteesistä. Kokonainen tuotantoketju liittyy niin eläimiin, ympäristöön kuin ihmisiinkin, ja niistä kaikista kertyy tietoa, jota pitää analysoida ja mallintaa, kun riskejä arvioidaan kvantitatiivisesti. Kaikkea tätä ei polkaista pystyyn hetkessä. Siksi valmiutta ja menetelmiä pitää kehittää ennalta pitkäjänteisesti silloinkin, kun asia ei vielä ole akuutti. Euroopan elintarvikeriskinarvioinnin laitosten piirissä onkin herätty siihen, ettei riskinarvioinnista ja sen menetelmistä kokonaisuutena ole olemassa systemaattista koulutusta missään yliopistossa. Tähän on suunnitteilla jäsenmaiden välisenä yhteistyönä parannusta mutta se vie aikansa. Sitä odotellessa voi lukea menetelmistä lisää uudesta kirjasta.

Jukka Ranta.

Jukka Ranta FT, Dos.
tutkimusprofessori
riskinarvioinnin yksikkö
Twitter: @jukka_ranta

P.S. Blogin otsikko on vohkittu entiseltä ohjelmoinnin opettajaltani.

Kaksi graafista kuvaajaa.

Kuva kampylobakteerin aiheuttaman taudin annos-vastemallin parametrien estimoinnista.

Tämä blogikirjoitus on osa Tutkitun tiedon teemavuotta 2021.