Teksti on dataa, jota tekoäly voi hyödyntää

Ajankohtaiset Artikkelin lukuaika 3 min

Tekstidata ja tekoäly sopivat erittäin hyvin yhteen. Koneoppimisen avulla voidaan useista tekstiä käsittelevistä järjestelmistä tehdä fiksumpia ja loppukäyttäjää paremmin palvelevia.

Data Scientist Trainee

Koneoppimisesta ja tekoälystä puhutaan ja kirjoitetaan paljon. Datan merkitys korostuu yleensä aina koneoppimisesta puhuttaessa, eikä ihme: kärjistäen voisi sanoa, että mikä tahansa tekoäly tai koneoppimismalli on vain niin hyvä, kuin sen opetukseen käytetty data.

Miellämme datan turhan usein vain numeroiksi, vaikka mikä tahansa tieto voi olla dataa. Koneoppimisen keinoin käsitellään jo nyt valtavia määriä esimerkiksi tekstiä: tekoäly määrittelee, onko saapuva sähköposti roskapostia vai ei, ja hakukone kysyy, tarkoititko jotain muuta.

Kymmenen vuotta sitten esimerkiksi konekääntämiselle lähinnä naureskeltiin, mutta nyt erittäin tehokkaat kielimallit pystyvät kääntämään useita tekstejä niin hyvin, ettei niitä edes huomaa tekoälyn tekemiksi.

Tekstidata ja tekoäly sopivat erittäin hyvin yhteen. Koneoppimisen avulla voidaan useista tekstiä käsittelevistä järjestelmistä tehdä fiksumpia ja loppukäyttäjää paremmin palvelevia.

Ratkaisuja tiedonhallinnan haasteisiin

Tärkeisiin liiketoimintajärjestelmiin voi esimerkiksi lisätä tekstihakutoimintoja ja semanttisen haun ominaisuuksia, jolloin haku ymmärtää paremmin käyttäjän haun tarkoituksen ja pystyy antamaan kattavampia ja osuvampia hakutuloksia.

Jos tärkeä tieto, kuten toimenpide-ehdotukset, hukkuvat massaan, voi kielenymmärrysmallin opettaa tunnistamaan raporteista toimenpide-ehdotuksia, ja kehittää käyttöliittymän niiden löytämiseen, selaamiseen ja korostamiseen dokumenteissa. Tämä onnistuu myös suomeksi, kiitos Turun yliopiston opettaman FinBERT-kielenymmärrysmallin!

Kielimallin voi opettaa myös tunnistamaan sähköpostiin tulevista palautteista ne, joihin tulee reagoida välittömästi, tai ohjata viestit, tiketit tai kirjoitetut vikailmoitukset sisällön perusteella oikeille tiimeille.

Kielimallit voivat tiivistää pitkiä raportteja, poimien automaattisesti oleellisen.

Raporttien luomista voi myös automatisoida tekstiä generoivien mallien avulla. Ongelman kohdatessa kielimallilta voisi pyytää tiivistelmän tuhansista aihetta käsittelevistä virheilmoituksista ja korjausraporteista, ja tekoäly voisi kertoa, mitä kannattaa – tai ei kannata – tilanteessa tehdä.

Tekoäly voi myös analysoida näitä raportteja ja huomata yhteneväisyyksiä tai syy-seuraussuhteita, joita ajan saatossa ei ole muuten huomattu.

ATR:n oma tekoäly AIMO on apunamme tuntikirjauksien tarkistamisessa. Kun pidämme huolen siitä, että työntekijöidemme tekemät tunnit on kirjattu oikein, pystymme parantamaan resursointia ja arvioimaan eri tehtävien vaatimia tuntimääriä paremmin.

Jos koneoppimisen mahdollisuudet kiinnostavat omassa organisaatiossasi, voit perehtyä aiheeseen tarkemmin verkkosivujemme tekoälyosiossa. Voit myös varata sparraussession toimarimme Teemun kalenterista. Hän teki ensimmäisen tekoälyprojektinsa jo 2000-luvun vaihteessa.

Blogin kirjoittaja, Iidaliisa Pardalin, lukee Turun yliopistolla digitaalista kielentutkimusta ja suorittaa parhaillaan opintoihin kuuluvaa harjoittelua ATR:llä Data Scientist -traineenä. Vapaa-ajallaan Iidaliisa kutoo sukkia ja harjoittelee selviytymistaitoja The Long Dark -pelin post-apokalyptisessä maailmassa.