FinnGen: Geenitietoa pilvessä

Suomen molekyylilääketieteen instituutti FIMM on Helsingin yliopistoon kuuluva kansainvälinen tutkimusyksikkö. Instituutti tutkii sairauksien molekyylitason mekanismeja genetiikan ja systeemibiologian menetelmin. FIMM yhdistää korkeatasoisen tutkimuksen, teknologian sekä potilas- ja biopankkiaineistot.

Codenton projekti osallistui FIMMin koordinoimaan FinnGen-hankkeeseen, jossa yhdistetään suomalaisten genomitietoa ja digitaalista terveydenhoidon dataa suurissa mittakaavoissa, ja pyritään löytämään näin uusia sairauksien ehkäisy- ja diagnosointitapoja sekä hoitokeinoja.

Kyseessä on mittava projekti, ja FinnGen onkin nostamassa suomalaista tutkimusta biolääketieteen eturintamaan. Hanke on aloitettu vuonna 2017 ja sen on määrä jatkua vähintään kuusi vuotta.

 

Datan käsittely vaatii kapasiteettia

Genomitiedon yhdistäminen digitaaliseen terveystietoon on valtavan kokoinen hanke. Se vaatii suorituskykyisiä järjestelmiä, jotta dataa voidaan käsitellä ja analysoida ja siten löytää uutta tietoa ja ratkaisuja.

“Meillä on Factoryksi kutsuttu prosessiympäristö, jossa genomidata jalostetaan. Tähän liittyy noin kymmenkunta erilaista työvaihetta, kun data ajetaan pipelinen läpi”, FIMMin Head of Data Management Jarmo Harju kertoo.

“Tällä hetkellä esiprosessointiympäristö toimii meidän omassa it-infrassa. Tämä ei kuitenkaan vastaa kapasiteetiltaan sitä, mitä nykyisten datamäärien käsittelyssä ja analysoinnissa tarvitaan. Oma kapasiteettimme on rajallista ja käytännön työssä servereille ilmaantuu ruuhkaa, mikä hidastaa työn etenemistä ja kasvattaa virheiden mahdollisuuksia”, hän toteaa.

“Asiakkaan käyttämät työkalut ja ohjelmat olivat riippuvaisia monista muista ohjelmistoista. Jotta analyyseja voitiin tehdä ja kehittää edelleen, piti kaikki nämä ohjelmistot asentaa erikseen omalle koneelle tai palvelimelle,” kertoo projektissa mukana ollut Codenton ohjelmistokehittäjä Lauri Kajan.

 

Pilvi nopeuttaa tuotantoprosessia

Ratkaisu datan käsittelyn ja analysoinnin haasteisiin löydettiin pilvialustasta. “Pilvessä kapasiteetti on taattu ja sitä löytyy tarvittaessa lisää, joten se nopeuttaa ja varmistaa tuotantoprosessin etenemisen takkuamatta. Myös tietoturva on parempi pilvialustalla kuin omassa it-infrassa,” Harju kertoo ratkaisuun päätymisestä.

“Analyysien ajamisen joustava skaalaaminen oli asiakkaan keskeinen tavoite. Ohjelmistot muunnettiin käyttämään konttitekniikkaa, jossa ohjelmistot asennetaan siirrettäviin “säiliöihin”, jotka ovat asennettavissa eri ympäristöihin helposti,” Lauri Kajan kertoo projektin käytännön puolesta.

 

Codento viitoitti tien

Codenton kanssa hankkeen ohjelmistoympäristön kehittämisessä päästiin proof of concept -vaiheeseen, jossa siirrettiin prosessointiympäristön muutamia yksittäisiä moduleita pilvialustalle. Mallinnuksen jälkeen FIMMin on helppo jatkaa siirtymistä pilveen.

“Projektin merkittävin tulos on se, että saimme todistettua, että datan jalostaminen toimii pilvialustallakin. Jotain avoimia ja ratkaisemattomia kysymyksiä on vieläkin, mutta projekti varmensi mallin toimivuuden. Seuraavaksi lähdemme siirtämään koko Factorya pilveen”; Jarmo Harju tiivistää.

“Asiakasta opastettiin järjestelmän jatkokehityksen kanssa, joten he pääsevät jatkamaan järjestelmän kehitystä itsenäisesti,” Kajan jatkaa.

 

“Ensimmäiseksi mieleen tulee ketteryys”

“Codentolaiset ovat rentoa, avointa ja ketterää porukkaa. Projekti käynnistettiin reippaasti, ja selvästi tämänkaltaiseen työhön oli prosessi olemassa. Heti projektin alussa oli jo työpaja-konseptia ja palaute-workshop mietittynä, mikä ei ole aina ihan tavallista,” Harju kehuu.

“Ketteryys on ensimmäinen mieleen tuleva asia Codentosta. Codenton konsultit pystyivät paneutumaan hyvin nopeasti projektin aikana uusiin asioihin. Samalla mentiin eteenpäin ja opittiin paljon uutta, puolin ja toisin”, Harju kiteyttää.

“Mielenkiintoisinta projektissa oli tutustua täysin uuteen tieteenalaan ja havainto siitä, että vaikka ei täysin ymmärrä kontekstia, omalla tietotaidollaan pystyy auttamaan asiakasta. Toimin projektissa juniori-roolissa, joten projektissa käytetyt tekniikat olivat minullekin aika uusia, asiakkaan käyttämistä ohjelmistoista puhumattakaan. Oli hienoa päästä oppimaan projektin aikana uutta. FIMMin kanssa oli mukava työskennellä, heidän porukka oli mukavaa ja ymmärtävää”, Lauri Kajan kertoo.