Teksti on dataa, jota tekoäly voi hyödyntää

3 min

Tekstidata ja tekoäly sopivat erittäin hyvin yhteen. Koneoppimisen avulla voidaan useista tekstiä käsittelevistä järjestelmistä tehdä fiksumpia ja loppukäyttäjää paremmin palvelevia.

Koneoppimisesta ja tekoälystä puhutaan ja kirjoitetaan paljon. Datan merkitys korostuu yleensä aina koneoppimisesta puhuttaessa, eikä ihme: kärjistäen voisi sanoa, että mikä tahansa tekoäly tai koneoppimismalli on vain niin hyvä, kuin sen opetukseen käytetty data.

Miellämme datan turhan usein vain numeroiksi, vaikka mikä tahansa tieto voi olla dataa. Koneoppimisen keinoin käsitellään jo nyt valtavia määriä esimerkiksi tekstiä: tekoäly määrittelee, onko saapuva sähköposti roskapostia vai ei, ja hakukone kysyy, tarkoititko jotain muuta.

Kymmenen vuotta sitten esimerkiksi konekääntämiselle lähinnä naureskeltiin, mutta nyt erittäin tehokkaat kielimallit pystyvät kääntämään useita tekstejä niin hyvin, ettei niitä edes huomaa tekoälyn tekemiksi.

Tekstidata ja tekoäly sopivat erittäin hyvin yhteen. Koneoppimisen avulla voidaan useista tekstiä käsittelevistä järjestelmistä tehdä fiksumpia ja loppukäyttäjää paremmin palvelevia.

Ratkaisuja tiedonhallinnan haasteisiin

Tärkeisiin liiketoimintajärjestelmiin voi esimerkiksi lisätä tekstihakutoimintoja ja semanttisen haun ominaisuuksia, jolloin haku ymmärtää paremmin käyttäjän haun tarkoituksen ja pystyy antamaan kattavampia ja osuvampia hakutuloksia.

Jos tärkeä tieto, kuten toimenpide-ehdotukset, hukkuvat massaan, voi kielenymmärrysmallin opettaa tunnistamaan raporteista toimenpide-ehdotuksia, ja kehittää käyttöliittymän niiden löytämiseen, selaamiseen ja korostamiseen dokumenteissa. Tämä onnistuu myös suomeksi, kiitos Turun yliopiston opettaman FinBERT-kielenymmärrysmallin!

Kielimallin voi opettaa myös tunnistamaan sähköpostiin tulevista palautteista ne, joihin tulee reagoida välittömästi, tai ohjata viestit, tiketit tai kirjoitetut vikailmoitukset sisällön perusteella oikeille tiimeille.

Kielimallit voivat tiivistää pitkiä raportteja, poimien automaattisesti oleellisen.

Raporttien luomista voi myös automatisoida tekstiä generoivien mallien avulla. Ongelman kohdatessa kielimallilta voisi pyytää tiivistelmän tuhansista aihetta käsittelevistä virheilmoituksista ja korjausraporteista, ja tekoäly voisi kertoa, mitä kannattaa – tai ei kannata – tilanteessa tehdä.

Tekoäly voi myös analysoida näitä raportteja ja huomata yhteneväisyyksiä tai syy-seuraussuhteita, joita ajan saatossa ei ole muuten huomattu.

ATR:n oma tekoäly AIMO on apunamme tuntikirjauksien tarkistamisessa. Kun pidämme huolen siitä, että työntekijöidemme tekemät tunnit on kirjattu oikein, pystymme parantamaan resursointia ja arvioimaan eri tehtävien vaatimia tuntimääriä paremmin.

Jos koneoppimisen mahdollisuudet kiinnostavat omassa organisaatiossasi, voit perehtyä aiheeseen tarkemmin verkkosivujemme tekoälyosiossa. Voit myös varata sparraussession toimarimme Teemun kalenterista. Hän teki ensimmäisen tekoälyprojektinsa jo 2000-luvun vaihteessa.

Blogin kirjoittaja, Iidaliisa Pardalin, luki Turun yliopistolla digitaalista kielentutkimusta ja suoritti opintoihin kuuluvaa harjoittelua ATR:llä Data Scientist -traineenä. Nykyisin Iidaliisa on vakituinen atr-softeri. Vapaa-ajallaan Iidaliisa kutoo sukkia ja harjoittelee selviytymistaitoja The Long Dark -pelin post-apokalyptisessä maailmassa.

data kielimalli koneoppiminen

Iidaliisa Pardalin

AI Specialist / Project Manager

18.11.2022

Muita uutisia

ATR Soft uuden työntekijän silmin

Juhani Siro / 1.12.2023

Atr-softerit

Kesätyö integraatio- ja tuntikirjausjärjestelmän kehittäjänä

Joonas Salminen / 10.11.2023

Atr-softerit

Vanhanaikaista vai ketterää?

Sami Haikonen / 30.8.2023

Yhteistyö