Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by Author "Appelberg, Kristian"

Sort by: Order: Results:

  • Appelberg, Kristian (2022)
    Konekääntäminen on viime vuosina saanut yhä enemmän jalansijaa niin yhteiskunnassa yleisesti kuin ammattikääntäjienkin työssä. Tämä johtuu suurelta osin merkittävistä parannuksista konekäännösten laadussa, jonka on sanottu jo vastaavan ihmiskääntäjien tuottamaa laatua. Pintapuolisesti sujuvissa konekäännöksissä on kuitenkin usein vielä paljon parannettavaa. Nykyisellään tehokkaimmat syväoppiviin neuroverkkoihin perustuvat konekääntimet pitää räätälöidä, eli kouluttaa erikoiskielen lähtöteksteillä ja käännöksillä, jotta ne oppivat käyttämään vakiintuneita vastineita ja ilmaisutapoja. Tutkielma käsittelee OPUS-CAT-neuroverkkokääntimen räätälöintiä Suomen Pankin vuosien 2019 ja 2020 vuosikertomuksilla ja niiden käännöksillä sekä vertaillaan Suomen Pankin vuosikertomuksen 2021 ruotsinnosta räätälöidyllä konekääntimellä tuotettuun ruotsinnokseen. Tutkimuksen tavoitteena on selvittää, miten räätälöinti vaikuttaa konekäännökseen, kuinka konekäännin suoriutuu niistä vuosikertomuksen osista, joita ei löydy käännösmuistista, ja kuinka työlästä konekääntimen koulutus on. Tutkielman teorialuvussa käydään läpi käännösmuistien käyttöä, konekääntämisen historiaa ja viime vuosien kehitystä, konekäännösten laadunarviointia sekä neuroverkkokääntimen räätälöintiä yleisesti. Aineisto- ja menetelmäluvussa esitellään Suomen Pankin vuosikertomusta, vuosikertomusta tekstityyppinä sekä OPUS-CATin räätälöinnin työvaiheita. Lisäksi luvussa esitellään tutkielmassa käytettyä konekäännösten automaattista arviointimittaria (BLEU), manuaalisen arvioinnin pohjaksi muodostettua virheluokittelua sekä valittujen arviointitapojen soveltamista. Analyysin pohjalta voi todeta, että rajallisellakin aineistolla räätälöinti parantaa OPUS-CATilla tuotettujen konekäännösten ja Suomen Pankin kielipalveluiden tuottaman käännöksen vastaavuutta merkittävästi. Toisaalta analyysi osoittaa myös, että koulutusaineiston rajallisuus tulee vastaan jo yhdestä vuosikertomuksesta kerätyn kaksikielisen aineiston jälkeen, sillä konekäännösmallin jatkoräätälöinti toisesta vuosikertomuksesta kerätyllä aineistoilla ei enää paranna vastaavuutta suuresti. Työprosessin kuvauksesta käy myös ilmi, että OPUS-CAT-neuroverkkokääntimen räätälöinti on helppoa eikä vaadi suurta teknistä perehtyneisyyttä. Tutkielman johtopäätöksissä todetaan, että räätälöinnin optimoimiseksi aineiston keräys tulisi mahdollisuuksien mukaan ulottaa myös muihin keskuspankin julkaisuihin. Koska OPUS-CATin räätälöinnin voi kuitenkin tehdä suoraan käännösmuistiohjelmasta tuodulla tmx-tiedostolla, pelkällä edeltävän vuoden vuosikertomuksen käännökselläkin saa nopeasti ja helposti hyviä tuloksia.