“Kyllä konekin oppii kun sille rautalangasta vääntää!” Vastasin näin jollekulle, kuka ihmetteli koko sanaa ja aihepiiriä. Kuvaa myös sitä, että kyse ei ole mistään
magiasta, vaan se on datan vääntämistä ja kääntämistä.
Matti Leskinen
Research Software Engineer, ATR Soft
Edelliseltä vuosikymmeneltä alkaen tekoälyn tutkimus on kokenut uuden nousukauden ja monista tekoälyn käytännön sovellutuksista on tullut osa jokapäiväistä elämäämme. Parhaimmillaan tietokonejärjestelmät pystyvät hämmentävän ihmisenkaltaisiin toimintoihin: kuvista tunnistetaan automaattisesti ihmisiä ja esineitä, virtuaaliavustajat tunnistavat puhetta ja ymmärtävät ohjeita, itseohjautuvat autot alkavat olla todellisuutta.
Kuinka tästä vuosikymmeniä tutkitusta tieteenalasta, tieteisviihteen omalta osaltaan värittämästä aiheesta, on jälleen tullut kuuma puheenaihe ja tekoälystä varsinainen muotisana?
Oletko kiinnostunut tekoälyn perusteista?
“…esihenkilö tarkistaa asiantuntijan tuntikirjaukset viikoittain ja hyväksyy tai hylkää kirjaukset. Me emme halunneet tällaista byrokraattista ja tehotonta prosessia rakentaa.”
Teemu Tasanto
CEO of ATR Soft
Muutama vuosi sitten otimme moderneja AI-välineitä haltuun sisäisellä kehityshankkeella. Ratkaistavaksi tarpeeksi valikoitui tuntikirjaustemme tarkistusprosessi. Perinteisestihän asiantuntijoiden tuntikirjauksia tarkastelemiseen on rakennettu prosessi, jossa esimerkiksi esihenkilö tarkistaa asiantuntijan tuntikirjaukset viikoittain ja hyväksyy tai hylkää kirjaukset. Me emme halunneet tällaista byrokraattista ja tehotonta prosessia rakentaa vaan pohdimme, että voisiko tekoälystä olla avuksi asiassa.
Lähdimme liikkeelle olemassa olevasta datasta. Kävimme pikaisesti tuntikirjaukset viimeiseltä kymmeneltä vuodelta lävitse ja jaoimme kirjaukset hyväksyttäviin ja huomautettaviin kirjauksiin.
Valitsimme datasta tarkasteltavat ominaisuudet eli ne piirteet, joista voi päätellä kategorian (esim. tuntikirjauksen selite, projekti, tehtävä, jne). Data muunnettiin tietoturvasyistä sellaiseen muotoon, ettei ulkopuolinen pysty päättelemään siitä henkilötietoja tai muuta sensitiivistä informaatiota. Muuntaminen tapahtui mm. käyttämällä id-tunnisteita tekstin sijaan ja muuttamalla tekstit soundex-muotoon. Olemassa olevasta datasta irrotimme osan datasta koneoppimisen opetusjoukoksi ja loput testidataksi. Alustaksi valitsimme Azuren Machine Learning -välineen. Sieltä valitsimme sopivat algoritmit datan käsittelyyn, opetimme systeemin opetusdatalla ja testasimme sen testidatalla. Muutaman iteraatiokierroksen totesimme testitulokset riittävän hyväksi ja lähdimme ottamaan ratkaisua hyötykäyttöön.
Loppuprojekti olikin meille ihan perustyötä, integraation toteuttamista tuntikirjausjärjestelmän ja Azuren välille, käyttöliittymän kehittämistä tuntikirjausjärjestelmään ja business logiikan toteuttamista kokonaisuuteen. Lopputuloksena muodostui oma teköälymme AIMO, joka väsymättä tarkistaa meidän kaikkien kirjauksia ja lähettää ystävällisiä viestejä, jos kirjauksissa on jotain huomautettavaa.
Sisäisten haltuunottamisprojektien jälkeen olemme hyödyntäneet tekoälyn ja koneoppimisen välineitä useiden asiakastarpeiden ratkaisemisessa.
Python
Pandas
Numpy
Scikit-learn. TensorFlow
PyTorch
Fast.ai
HF. transformers
FastText
Jupyter
Azure ML
Tärkeä informaatio voi usein hukkua asiakirjojen paljouteen. Suurta määrää dokumentteja on mahdotonta käydä ihmisen toimesta läpi. Opetimme FinBERT-kielenymmärrysmallin tunnistamaan huolto- ja tarkastusraporteista toimenpide-ehdotuksia, sekä toteutimme käyttöliittymän niiden löytämiseen, selaamiseen ja korostamiseen dokumenteissa.
Valtava määrä ainestoa on edelleen vain paperilla tai skannatussa muodossa. Pakettiratkaisut digitointiin eivät aina tuota riittävän hyvää tulosta erilaisten dokumenttipohjien ja käsin kirjoitetun tekstin lukemiseen. Olemme kehittäneet täsmämenetelmiä skannatuista taulukkomuotoisista dokumenteista käsin kirjoitetun tekstin lukemiseen.
Teollisten prosessien mittausdata on toiminnan kehittämiselle arvokasta. Aikasarja-analyysin ja koneoppimisen keinoin on mahdollista tehdä tarkempia tulkintoja ja ennustuksia kuin datan visualisointeja katsomalla. Olemme kehittäneet malleja ja menetelmiä virhetilanteiden tunnistamiseen ja luokitteluun puolijohdekomponenttien valmistusprosessista.
Huonosti toimiva haku turhauttaa. Älykäs haku netistä on ollut niin kauan arkipäivää, että samaa toivoisi kaikilta järjestelmistä. Olemme uudistaneet vanhaan julkishallinnon järjestelmään tekstihakutoimintoja, joihon lisätään myös semanttisen haun ominaisuuksia, eli parempaa ymmärrystä haun tarkoituksesta ja merkityksestä sanojen sekä lauseiden taustalla.
Koneoppimista voidaan hyödyntää myös ohjelmistokehityksessä. Opiskelijamme ovat tutkineet, kuinka projektienhallintatyökalujen ja työajanseurannan datan perusteella voisi arvioida kehitystehtävien työmäärää ja kehitysprojektin valmiusastetta.
AI- ja ML-välineet jatkavat kehittymistään kiihtyvällä tahdilla, joten jatkuva oppiminen niiden suhteen on todella tärkeää. Kehitettävien teknologioiden riskiä minimoimme asiakkaillemme mm. todistamalla saavutettavan hyödyn ihan projektin alussa.
Syvennä tietoa artikkeleistamme
Miksi viimeistään nyt on oikea aika lähteä hyödyntämään tekoälyä liiketoiminnassa, vaikka siitä on puhuttu jo pari vuosikymmentä?
Alan kehitys on johtanut tilanteeseen, jossa on mahdollista päästä todella hyviin tuloksiin teknologian ollessa koko ajan helpommin lähestyttävää ja tehokkaampaa. Kustannukset ja riskit ovat paljon pienempiä, kun voi hyödyntää valmiita ohjelmakirjastoja ja kehittyneitä työkaluja. Jokaiseen sovelluskohteeseen ei tarvitse enää itse kehittää ja toteuttaa uusia algoritmeja alusta alkaen tiedeyhteisön kanssa.
Kynnys on jo matala. Riittävä varmuus koneoppimisratkaisun toimivuudesta ja siitä saatavasta hyödystä on mahdollista saada oikealla datalla hyvinkin pienellä vaivalla, ennen kun tarvitsee lähteä investoimaan enemmän.
Autamme asiakkaitamme selvittämään, mihin kaikkeen dataa voikaan hyödyntää.
Lähetät viestin toimarillemme Teemulle, joka tietää asiakkuuksista eniten.