Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by Author "Nordström, Jonas"

Sort by: Order: Results:

  • Nordström, Jonas (2022)
    Lähtökohdat Maailmalla on osoitettu, että koneoppiminen on oiva työkalu tiedonhakuun suurista aineistoista. Se voi vähentää inhimillistä työtaakkaa ja mahdollistaa suuren aineiston analysoinnin. Yhdistettynä luonnollisen kielen prosessoinnin (NLP) tekniikoihin voidaan hyödyntää strukturoimaton data potilasasiakirjoista. Halusimme tutkimuksessamme osoittaa koneoppimisen toimivuuden suomalaisessa aineistossa. Menetelmät Haimme leikkauspotilaiden tupakointilauseita potilasasiakirjoista tietyillä hakusanoilla HUS tietoaltaasta. Pieni otos lauseista luokiteltiin tupakointistatuksen mukaan koneoppimismallin opetukseen ja testaamiseen. Opetusdatan ja koneoppimisalgoritmin avulla rakennettiin luokittelija, joka luokitteli loput lauseet eri ryhmiin tupakointistatuksen mukaisesti. Tulokset Luokittelijan tarkkuudeksi saatiin 85.8 %. Etenkin tupakoimattomia pystyttiin mallin avulla poimimaan lauseista kiitettävällä tarkkuudella. Myös tupakoitsijoiden ja entisten tupakoitsijoiden F-arvot olivat hyvällä tasolla. Ryhmistä matalin F-arvo oli ei tiedossa oleva tupakointistatus -ryhmällä. Päätelmät Tulokset osoittavat, että koneoppimismalli soveltuu tiedonhakuun suuresta tekstiaineistosta. Sitä tullaan jatkossa käyttämään tutkimustyökaluna.