Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by Subject "korpuslingvistiikka"

Sort by: Order: Results:

  • Laukkanen, Olavi (2019)
    Tutkielma käsittelee persoonapronominien käyttöä Yhdysvaltojen presidenttien kansakunnan tilaa käsittelevissä puheissa (State of the Union Address) poliittisen diskurssianalyysin näkökulmasta ja korpuslingvistiikan kvantitatiivisia menetelmiä hyödyntäen. Työssä selvitetään millaisia funktioita persoonapronomineilla on ja onko niiden käytössä eroja presidenttien välillä tutkimalla niiden frekvenssejä eli esiintymistiheyksiä sekä niiden kollokaatteja eli samassa kontekstissa esiintyviä sanoja. Aineistoni koostuu vuosina 1980-2018 pidetyistä kansakunnan tilaa käsittelevistä puheista, joiden esittäjinä olivat presidentit Ronald Reagan, George H.W. Bush, Bill Clinton, George W. Bush, Barack Obama ja Donald Trump. Kokoamani korpus on kooltaan 219 365 sanaa ja se on annotoitu käyttäen ohjelmaa, joka merkitsee tekstiin sanaluokat (part-of-speech tagger). Korpusanalyysiä varten käytettiin AntConc-tietokoneohjelmaa, joka mahdollistaa frekvenssi- ja kollokaatiohaut. Tutkielma osoittaa, että persoonapronominien käytössä suurimmat erot ovat usein presidentin eri puheiden välillä eivätkä eri presidenttien välillä. Sisäisen vaihtelevuuden laajuus viittaa siihen, ettei eri presidenteillä ole selkeitä tai johdonmukaisia pronominityylejä. Monikon ensimmäisen persoonan pronomineja käytetään puheissa selkeästi eniten verrattuna muihin persoonapronomineihin, mikä saattaa kertoa niiden funktiosta yhteisen amerikkalaisen identiteetin vahvistamisessa ja presidentin halusta esiintyä osana laajempaa yhteisöä. Kollokaatioanalyysi osoittaa, että eri persoonapronomineja käytetään erilaisissa konteksteissa ja erilaisiin tarkoituksiin. Esimerkiksi yksikön ensimmäisen persoonan pronominit esiintyvät usein kommunikaatioverbien ja mentaalisten verbien kanssa, kun taas monikon ensimmäisen persoonan pronominit esiintyvät konteksteissa, joissa käytetään kansallista tai sodankäyntiin liittyvää retoriikkaa. Toisen persoonan pronominit toimivat lauserakenteessa hyvin usein objekteina eivätkä subjekteina, mikä osoittaa niiden olevan keino puhutella yleisöä ja luoda interaktiivinen suhde kuuntelijoihin. Monikon kolmannen persoonan pronomineja käytetään tutkimuksen mukaan lähinnä viittaamaan tavallisiin amerikkalaisiin ja heidän arkielämäänsä.
  • Laukkanen, Olavi (2019)
    Tutkielma käsittelee persoonapronominien käyttöä Yhdysvaltojen presidenttien kansakunnan tilaa käsittelevissä puheissa (State of the Union Address) poliittisen diskurssianalyysin näkökulmasta ja korpuslingvistiikan kvantitatiivisia menetelmiä hyödyntäen. Työssä selvitetään millaisia funktioita persoonapronomineilla on ja onko niiden käytössä eroja presidenttien välillä tutkimalla niiden frekvenssejä eli esiintymistiheyksiä sekä niiden kollokaatteja eli samassa kontekstissa esiintyviä sanoja. Aineistoni koostuu vuosina 1980-2018 pidetyistä kansakunnan tilaa käsittelevistä puheista, joiden esittäjinä olivat presidentit Ronald Reagan, George H.W. Bush, Bill Clinton, George W. Bush, Barack Obama ja Donald Trump. Kokoamani korpus on kooltaan 219 365 sanaa ja se on annotoitu käyttäen ohjelmaa, joka merkitsee tekstiin sanaluokat (part-of-speech tagger). Korpusanalyysiä varten käytettiin AntConc-tietokoneohjelmaa, joka mahdollistaa frekvenssi- ja kollokaatiohaut. Tutkielma osoittaa, että persoonapronominien käytössä suurimmat erot ovat usein presidentin eri puheiden välillä eivätkä eri presidenttien välillä. Sisäisen vaihtelevuuden laajuus viittaa siihen, ettei eri presidenteillä ole selkeitä tai johdonmukaisia pronominityylejä. Monikon ensimmäisen persoonan pronomineja käytetään puheissa selkeästi eniten verrattuna muihin persoonapronomineihin, mikä saattaa kertoa niiden funktiosta yhteisen amerikkalaisen identiteetin vahvistamisessa ja presidentin halusta esiintyä osana laajempaa yhteisöä. Kollokaatioanalyysi osoittaa, että eri persoonapronomineja käytetään erilaisissa konteksteissa ja erilaisiin tarkoituksiin. Esimerkiksi yksikön ensimmäisen persoonan pronominit esiintyvät usein kommunikaatioverbien ja mentaalisten verbien kanssa, kun taas monikon ensimmäisen persoonan pronominit esiintyvät konteksteissa, joissa käytetään kansallista tai sodankäyntiin liittyvää retoriikkaa. Toisen persoonan pronominit toimivat lauserakenteessa hyvin usein objekteina eivätkä subjekteina, mikä osoittaa niiden olevan keino puhutella yleisöä ja luoda interaktiivinen suhde kuuntelijoihin. Monikon kolmannen persoonan pronomineja käytetään tutkimuksen mukaan lähinnä viittaamaan tavallisiin amerikkalaisiin ja heidän arkielämäänsä.
  • Mäkäräinen, Kimberli (2016)
    Pohjoissaamen-, suomen- ja englanninkielisen termistön kokoaminen vertailukorpuksen kautta on alun perin lähtenyt omasta opiskelusta saamen tutkimuksessa, kun huomasin pohjoissaamenkielisen kielitieteen termistön puuttuvan osittain sekä monikielisen termistön puuttuvan kokonaan. Tämä puute hankaloitti kielitieteellisten tekstien käännöstä pohjoissaamesta suomeen tai englantiin ja toisin päin. Näiden asioiden selvittämisestä syntyi minun kandidaattitutkielmani The Creation of a Glossary of Morphology Terms in Northern Sámi, Finnish, and English, jota laajensin sitten tässä pro gradu -tutkielmaksi. Tähän pro gradu -tutkielmaan on lisätty koltansaame neljänneksi kieleksi, koska tammikuusta 2015 alkaen on ollut mahdollista opiskella koltansaameksi koltansaamen kielen perusopintojen opintokokonaisuutta ja syksystä 2016 alkaen on mahdollista opiskella samalla kielellä myös aineopintoja. Perusopintojen opintokokonaisuuteen kuuluvista kursseista neljä käsittelee kielitiedettä ja yksi kääntämistä. Kieli- ja käännöstieteen termistöä tarvitaan paitsi näiden kurssien opetukseen ja opiskeluun myös sen takia, että näiden kurssien nykyopiskelijat ovat jatkossa he, jotka levittävät näitä termejä seuraaville sukupolville oman opetuksen tai käännösten kautta. Opetukseen liittyvän tavoitteen lisäksi toisena tavoitteena tässä tutkielmassa on tarjota koltansaamenkielisille kääntäjille työkaluja kääntää vieraskielisiä kielitieteen julkaisuja ja opetusmateriaalia, varsinkin niitä, joissa käsitellään koltansaamea ja sen rikasta morfologiaa. Kielikohtaiset käsiteanalyysit muoto-opin käsitteille osoittivat, että kielten käsitejärjestelmät ovat hyvin samanlaisia mutta eivät identtisiä. Tämän lisäksi analyysien perusteella oli mahdollista todeta, että pohjoissaamen- ja koltansaamenkielisistä teksteistä puuttui enemmän termejä tekstin käsitteille kuin suomen- ja englanninkielisistä teksteistä. Termittömille käsitteille ehdotetut termit noudattavat koltansaamen lautakunnan terminmuodostusstrategioita ja normituksia. Moni näistä neologismeista löytyi korpusten kokoamisen jälkeen laadituista tai julkaistuista teksteistä. Tulokset myös osoittivat, että kunkin kielen termistössä esiintyy variaatiota ja että sitä oli eniten pohjoissaamen termistössä. Variaation yleisyys voi johtua esimerkiksi siitä, että pohjoissaamea käytetään kolmessa eri maassa, joiden enemmistökielet kuuluvat kahteen eri kielikuntaan, tai siitä, että pohjoissaamen muoto-opin termit ovat nuorempia kuin suomen tai englannin kielen. Nämä asiat voivat myös olla pohjoissaamen näennäisen epäjohdonmukaisesti tehtyjen yhdyssanojen taustalla. Kuitenkaan koltansaamesta ei löytynyt niin paljon variaatiota kuin pohjoissaamesta, joten oletettavasti yleisyys johtuu siitä, että pohjoissaamea käytetään varsin laajasti kolmessa eri maassa, eikä niinkään termien iästä. Tämän tutkielman käsitejärjestelmät kattavat vain pienen osan muoto-opin käsitteistä, joten termistöä on laajennettava, jotta siitä olisi eniten apua. Sen jälkeen termit olisi harmonisoitava ja yhtenäistettävä koltansaamenkielisten terminologien ja lingvistien työryhmän yhteisvoimin. Sen lisäksi tämän tutkielman tuloksia voi käyttää hyväksi mm. inarinsaamen kielitieteen termistön luomisessa.
  • Haavisto, Aino (2019)
    Japanin kielen kirjoitusjärjestelmä on eräs maailman monimutkaisimmista, ja sen oppiminen on haastavaa kaikille japania vieraana kielenä opiskeleville. Japania kirjoitetaan yhdistelemällä kahta foneettista merkistöä (hiragana ja katakana) ja morfografista kanjimerkistöä, jossa merkit kuvaavat morfeemeja eivätkä ainoastaan äänteitä. Erityisesti näiden kiinalaisperäisten kanjimerkkien, joita on Japanissa yleisesti käytössä 2136, opiskelu on työlästä. Tässä tutkielmassa on kehitetty japani vieraana kielenä -opiskelijoille uusi, mahdollisimman tehokas ja helpoksi omaksuttava kanjimerkkien opiskelujärjestys ja vertailtu sitä aiempiin opiskelujärjestyksiin. Tutkielmassa on sovellettu Loachin ja Wangin (2016) kiinan kirjoitusmerkkien opiskelujärjestystä optimoivaa laskennallista algoritmia japanin kielelle. Algoritmi järjestää merkit painottaen niiden yleisyyttä ja muodon yksinkertaisuutta, jotta alusta alkaen kielenoppija oppii hyödyllisiä merkkejä. Tämä ensimmäinen vaihe toteutettiin olemassa olevaa korpusta ja merkkitietokantaa käyttämällä. Toisessa vaiheessa algoritmi tekee järjestyksestä vielä hierarkkisen eli nostaa kunkin merkin komponentit opiskeltavaksi ennen komponenteista koostuvaa yhdistelmämerkkiä. Myös tämä vaihe toteutettiin hyödyntäen valmista, joskin työtä varten muokattua tietokantaa. Tutkimuksessa selvisi algoritmin luomaa järjestystä tarkastellessa, että Loachin ja Wangin algoritmin tuottamaa järjestystä on pidettävä vasta raakaversiona opiskelujärjestyksestä. Erityisesti kanjeihin liittyvien temaattisten kategorioiden huomiotta jättäminen tekee järjestyksestä joiltain osin vaikeasti hahmotettavan. Tämä vuoksi tutkielmassa pohditaan erilaisia mahdollisuuksia kehittää algoritmin tulosta edelleen ja esitellään noin 250 ensimmäiselle merkille algoritmiin perustuva, mutta käsin muokattu järjestys. Luotu järjestys noudattaa edelleen periaatteita yleisten merkkien opettamisesta hierarkkisessa järjestyksessä, mutta hyödyntää lisäksi temaattisia kategorioita merkkien järjestämisessä. Opiskelujärjestyksen luomisen lisäksi työssä tutkittiin tätä järjestystä hyödyntävän oppimateriaalin luomista puoliautomaattisesti korpuksia ja sanakirjatietokantoja hyödyntämällä. Merkeistä luotiin internetiin lista, johon on lisätty kunkin merkin kohdalle mm. yleisiä sanoja sisältäviä esimerkkilauseita. Lisäksi luotiin kertaukseen soveltuva virtuaalinen korttipakka. Tässä työssä tuotettu materiaali muodostaa käyttökelpoisen pohjan, mutta automaattisesti luotua oppimateriaalia on vielä kehitettävä ennen kuin siitä saa käytännössä hyödynnettävää materiaalia. Sekä itse opiskelujärjestystä että oppimateriaalia voidaan parantaa sekä ihmisen tekemällä työllä että muokkaamalla käytettyjä tietokoneohjelmia.
  • Haavisto, Aino (2019)
    Japanin kielen kirjoitusjärjestelmä on eräs maailman monimutkaisimmista, ja sen oppiminen on haastavaa kaikille japania vieraana kielenä opiskeleville. Japania kirjoitetaan yhdistelemällä kahta foneettista merkistöä (hiragana ja katakana) ja morfografista kanjimerkistöä, jossa merkit kuvaavat morfeemeja eivätkä ainoastaan äänteitä. Erityisesti näiden kiinalaisperäisten kanjimerkkien, joita on Japanissa yleisesti käytössä 2136, opiskelu on työlästä. Tässä tutkielmassa on kehitetty japani vieraana kielenä -opiskelijoille uusi, mahdollisimman tehokas ja helpoksi omaksuttava kanjimerkkien opiskelujärjestys ja vertailtu sitä aiempiin opiskelujärjestyksiin. Tutkielmassa on sovellettu Loachin ja Wangin (2016) kiinan kirjoitusmerkkien opiskelujärjestystä optimoivaa laskennallista algoritmia japanin kielelle. Algoritmi järjestää merkit painottaen niiden yleisyyttä ja muodon yksinkertaisuutta, jotta alusta alkaen kielenoppija oppii hyödyllisiä merkkejä. Tämä ensimmäinen vaihe toteutettiin olemassa olevaa korpusta ja merkkitietokantaa käyttämällä. Toisessa vaiheessa algoritmi tekee järjestyksestä vielä hierarkkisen eli nostaa kunkin merkin komponentit opiskeltavaksi ennen komponenteista koostuvaa yhdistelmämerkkiä. Myös tämä vaihe toteutettiin hyödyntäen valmista, joskin työtä varten muokattua tietokantaa. Tutkimuksessa selvisi algoritmin luomaa järjestystä tarkastellessa, että Loachin ja Wangin algoritmin tuottamaa järjestystä on pidettävä vasta raakaversiona opiskelujärjestyksestä. Erityisesti kanjeihin liittyvien temaattisten kategorioiden huomiotta jättäminen tekee järjestyksestä joiltain osin vaikeasti hahmotettavan. Tämä vuoksi tutkielmassa pohditaan erilaisia mahdollisuuksia kehittää algoritmin tulosta edelleen ja esitellään noin 250 ensimmäiselle merkille algoritmiin perustuva, mutta käsin muokattu järjestys. Luotu järjestys noudattaa edelleen periaatteita yleisten merkkien opettamisesta hierarkkisessa järjestyksessä, mutta hyödyntää lisäksi temaattisia kategorioita merkkien järjestämisessä. Opiskelujärjestyksen luomisen lisäksi työssä tutkittiin tätä järjestystä hyödyntävän oppimateriaalin luomista puoliautomaattisesti korpuksia ja sanakirjatietokantoja hyödyntämällä. Merkeistä luotiin internetiin lista, johon on lisätty kunkin merkin kohdalle mm. yleisiä sanoja sisältäviä esimerkkilauseita. Lisäksi luotiin kertaukseen soveltuva virtuaalinen korttipakka. Tässä työssä tuotettu materiaali muodostaa käyttökelpoisen pohjan, mutta automaattisesti luotua oppimateriaalia on vielä kehitettävä ennen kuin siitä saa käytännössä hyödynnettävää materiaalia. Sekä itse opiskelujärjestystä että oppimateriaalia voidaan parantaa sekä ihmisen tekemällä työllä että muokkaamalla käytettyjä tietokoneohjelmia.
  • Hinkkanen, Iida (2016)
    Tämä Pro Gradu -tutkielma käsittelee brittiläisillä lastenhoitoa koskevilla verkkosivustoilla esiintyviä sukupuolittuneita vanhemmuusdiskursseja. Tutkimuskysymyksinä on, millaisia vanhemmuusdiskursseja verkkosivuilla esiintyy, tukevatko verkkosivustojen tasa-arvodiskurssit perinteisiä sukupuolirooleja ja onko eri verkkosivustojen välillä eroavaisuuksia yllämainittuja seikkoja koskien. Verkkosivustot babies.co.uk ja babycentre.co.uk valittiin tutkimuskohteiksi niiden suosion ja ilmaisen sisällön takia. Sivustojen artikkeleista kerättiin kaksi pientä korpusta. Verkkosivuston babies.co.uk artikkeleista kerätty korpus sisältää 168 artikkelia ja on kooltaan 144 284 sanaa. Verkkosivuston babycentre.co.uk artikkeleista kerätty korpus sisältää 140 artikkelia ja on kooltaan 122 949 sanaa. Korpuksista etsittiin tiettyjä avainsanoja ja sanapareja, ja niiden lukumäärien ja kontekstien perusteella tutkittiin, millaisia vanhemmuus- ja tasa-arvodiskursseja verkkosivustoilla esiintyy. Tutkimuksen pohjana käytettiin Jane Sunderlandin vanhemmuusdiskursseja ja Michelle M. Lazarin tasa-arvodiskursseja. Vanhemmuusdiskursseja tutkittiin sanaparin 'your partner' kontekstien avulla. Löydetyt vanhemmuusdiskurssit jaoteltiin sukupuolten välistä tasa-arvoa tukeviin ja perinteisiä sukupuolirooleja ylläpitäviin diskursseihin. Sivuston babies.co.uk artikkeleista kootun korpuksen vanhemmuusdiskursseista tasa-arvoa tukevia diskursseja on 12,5 % ja sukupuolirooleja ylläpitäviä 87,5 %. Vastaavat luvut sivuston babycentre.co.uk artikkeleista kootun korpuksen diskursseille ovat 38,1 % ja 61,9 %. Tasa-arvodiskursseja tutkittiin laskemalla lukumäärät äitisanoille (mother, mum, mummy ja niiden monikot), isäsanoille (father, dad, daddy ja niiden monikot) sekä sukupuolineutraaleille vanhemmuussanoille (parent, parents). Sivuston babies.co.uk artikkeleista kootussa korpuksessa äitisanoja on 211, isäsanoja 62 ja sukupuolineutraaleja vanhemmuussanoja 353. Vastaavat luvut babycentre.co.uk:n artikkeleista kerätylle korpukselle ovat 373 äitisanaa, 163 isäsanaa ja 271 sukupuolineutraalia vanhemmuussanaa. Isäsanat jaoteltiin kontekstiensa perusteella tasa-arvoa tukeviin ja perinteisiä sukupuolirooleja ylläpitäviin. Babies.co.uk-korpuksessa näistä sanoista tasa-arvoa tukevassa kontekstissa esiintyy 55,5 % ja sukupuolirooleja tukevassa kontekstissa 44,4 %. Babycentre.co.uk-korpuksessa isäsanojen konteksteista 63,4 % on tasa-arvoa tukevia ja 36,6 % sukupuolirooleja ylläpitäviä. Tutkimustulokset osoittavat, että verkkosivustolla babies.co.uk esiintyvät vanhemmuusdiskurssit ovat suurimmaksi osaksi perinteisiä sukupuolirooleja ylläpitäviä diskursseja. Myös sivuston babycentre.co.uk vanhemmuusdiskursseista yli puolet tukevat perinteisiä sukupuolirooleja. Kummallakin verkkosivustolla äiti mainitaan useammin kuin isä, ja sivustolla babies.co.uk lähes puolet ja sivustolla babycentre.co.uk yksi kolmasosa isäsanoista on perinteisiä sukupuolirooleja ylläpitävässä kontekstissa. Loppupäätelmänä voidaan todeta, että lastenhoitoa käsittelevien verkkosivustojen sisällöntuottajien olisi syytä kiinnittää huomiota siihen, millaisia vanhemmuusdiskursseja he tuottavat. Koska kieli muokkaa todellisuutta, sivustoilla käytetyt ilmaisut eivät ole yhdentekeviä, jos tavoitteena on sukupuolten välinen tasa-arvo niin lastenhoidossa kuin työelämässäkin.
  • Mattila, Elviira (2018)
    Tutkielmani tarkoituksena on tarkastella hollannista amerikanenglantiin lainattuja sanoja. Tutkin, miten hollantilaisten lainasanojen yleisyys ja niiden merkitykset ovat muuttuneet 1810-luvun ja 2000-luvun välillä. Hollanninkielisistä lainasanoista suurin ryhmä on ruokaan liittyvät lainasanat ja toiseksi suurin ryhmä eläin- ja kasvikunnan sanat, joten tutkin näihin kahteen kategoriaan kuuluvia lainasanoja. Hollanninkielisiä sanoja lainattiin amerikanenglantiin sen jälkeen, kun hollantilaiset siirtolaiset saapuivat Pohjois-Amerikkaan 1600-luvulla. Keräsin tutkimani lainasanat Nicoline van der Sijsin kirjasta Cookies, Coleslaw and Stoops: The Influence of Dutch on the North American Languages (2009). Tutkin sanojen yleisyyttä ja merkitysten muutoksia käyttämällä materiaalinani Mark Daviesin kehittämää historiallisen amerikanenglannin korpusta (Corpus of Historical American English; COHA). Käytin myös muita lähteitä tarkistaakseni sanojen merkityksiä ja historiaa. Tutkielmani mukaan yleisimmät hollanninkieliset ruokaan liittyvät lainasanat englannissa ovat brandy, cookie, dope, pancake, waffle, pit ja span. Brandy-sanaa on käytetty englannin kielessä melko tasaisesti vuodesta 1810 lähtien. Cookie on yleistynyt eniten ja 2000-luvulla sen suhteellinen frekvenssi oli 29,59 miljoonaa sanaa kohden, joka on kaikista hollanninkielisistä ruokaan liittyvistä lainasanoista suurin. Lainasanoilla pit ja span esiintyy paljon eri merkityksiä Daviesin korpuksessa, mutta sanat esiintyvät myös hollanninkielisessä merkityksessä huomattavissa määrin. Myös sanat coleslaw, cruller, pot cheese, head cheese, Easter flower, groundhog, weakfish, sea bass, abele ja Antwerp esiintyvät korpuksessa, mutta ne eivät ole läheskään yhtä yleisiä. Merkityksen muutoksia kokivat sanat cookie, pancake ja dope, jotka ovat säilyttäneet alkuperäisen merkityksensä, mutta saaneet lisäksi uusia merkityksiä.
  • Raiski, Ilari (2021)
    Tämä sosiolingvistinen tutkielma pyrkii selvittämään Lontoossa kehittyneen kielivarieteetin, Multicultural London Englishin (MLE), käyttöä kirjoitetussa muodossa. Tutkielman tavoitteena on selvittää, käytetäänkö tämän niin kutsutun multietnolektin piirteitä myös kirjallisessa ilmaisussa. Multietnolektit sekoittavat monia eri kieliä ja yksinkertaistavat valtakieltä. Multietnolekteja on syntynyt moniin Euroopan monietnisiin kaupunkeihin vuosituhannen vaihteessa, ja ne ovat olleet sosiolingvistiikan tutkijoiden mielenkiinnon kohteita jo pitkään. Tämä tutkielma keskittyy kolmeen MLE:n piirteeseen: slangisanojen käyttöön, fonologisten piirteiden toteutumiseen kirjoitetussa muodossa sekä man-sanan käyttöön pronominina. Aineistona tutkimuksessa käytettiin grime-artistien twiittejä. Twitter-aineistot ovat tulleet viime vuosina yhä suositummiksi kielentutkijoiden parissa. Tähän tutkimukseen se valikoitui, koska epästandardeja varieteetetteja esiintyy sosiaalisessa mediassa verrattain paljon. Aineisto kerättiin 20 grime-artistin twiiteistä, ja kokonaisuudessaan aineistoon kuuluu noin 60 000 twiittiä ja noin 600 000 tuhatta sanaa. Aineistoa käsiteltiin käyttäen SketchEngine-nimistä korpustyökalua. Löydöksiä verrattiin MLE korpukseen, joka koostuu puhutusta MLE-aineistosta. Suurin osa analyysista oli määrällistä, mutta kielenpiirteitä käsiteltiin esimerkkien avulla myös laadullisesti. Aineistosta etsittiin avainsanoja, sanojen yleisyyttä sekä niiden kollokaatiota (sanoja, jotka esiintyvät yhdessä). Tutkimustulokset osoittavat, että monet MLE:n piirteet ovat siirtyneet puhutusta kielestä myös kirjallisen ilmaisun piiriin. MLE:n fonologisia piirteitä sisältäviä ilmaisuja löytyi aineistosta jonkin verran. Ilmaisut, kuten dem, dat, da ja ting, olivat yleisiä suurimmalla osalla artisteista, mutta monissa tapauksissa fonologisten ilmaisujen käyttö rajoittui muutamaan ihmiseen. MLE:n slangisanoja käytettiin aineistossa hyvin runsaasti, joten voidaan todeta, että niiden käyttö on vakiintunutta myös kirjallisessa muodossa. Myös man-pronominin käyttö oli hyvin yleistä tutkimusaineistossa. Sekä slangisanojen että man-pronominin käyttö oli yleisempää Twitter-ainestossa kuin puhutun kielen korpuksessa. Vertailu puhutun kielen korpuksen kanssa oli kuitenkin haastavaa, sillä se oli vanhempi kuin Twitter-korpus ja koostui nuorempien ihmisten haastatteluista. Tästä syystä jatkotutkimusta vaaditaan, jotta puhutun ja kirjallisen muodon välisiä eroja voidaan tutkia tarkemmin MLE-puhujien keskuudessa.
  • Raiski, Ilari (2021)
    Tämä sosiolingvistinen tutkielma pyrkii selvittämään Lontoossa kehittyneen kielivarieteetin, Multicultural London Englishin (MLE), käyttöä kirjoitetussa muodossa. Tutkielman tavoitteena on selvittää, käytetäänkö tämän niin kutsutun multietnolektin piirteitä myös kirjallisessa ilmaisussa. Multietnolektit sekoittavat monia eri kieliä ja yksinkertaistavat valtakieltä. Multietnolekteja on syntynyt moniin Euroopan monietnisiin kaupunkeihin vuosituhannen vaihteessa, ja ne ovat olleet sosiolingvistiikan tutkijoiden mielenkiinnon kohteita jo pitkään. Tämä tutkielma keskittyy kolmeen MLE:n piirteeseen: slangisanojen käyttöön, fonologisten piirteiden toteutumiseen kirjoitetussa muodossa sekä man-sanan käyttöön pronominina. Aineistona tutkimuksessa käytettiin grime-artistien twiittejä. Twitter-aineistot ovat tulleet viime vuosina yhä suositummiksi kielentutkijoiden parissa. Tähän tutkimukseen se valikoitui, koska epästandardeja varieteetetteja esiintyy sosiaalisessa mediassa verrattain paljon. Aineisto kerättiin 20 grime-artistin twiiteistä, ja kokonaisuudessaan aineistoon kuuluu noin 60 000 twiittiä ja noin 600 000 tuhatta sanaa. Aineistoa käsiteltiin käyttäen SketchEngine-nimistä korpustyökalua. Löydöksiä verrattiin MLE korpukseen, joka koostuu puhutusta MLE-aineistosta. Suurin osa analyysista oli määrällistä, mutta kielenpiirteitä käsiteltiin esimerkkien avulla myös laadullisesti. Aineistosta etsittiin avainsanoja, sanojen yleisyyttä sekä niiden kollokaatiota (sanoja, jotka esiintyvät yhdessä). Tutkimustulokset osoittavat, että monet MLE:n piirteet ovat siirtyneet puhutusta kielestä myös kirjallisen ilmaisun piiriin. MLE:n fonologisia piirteitä sisältäviä ilmaisuja löytyi aineistosta jonkin verran. Ilmaisut, kuten dem, dat, da ja ting, olivat yleisiä suurimmalla osalla artisteista, mutta monissa tapauksissa fonologisten ilmaisujen käyttö rajoittui muutamaan ihmiseen. MLE:n slangisanoja käytettiin aineistossa hyvin runsaasti, joten voidaan todeta, että niiden käyttö on vakiintunutta myös kirjallisessa muodossa. Myös man-pronominin käyttö oli hyvin yleistä tutkimusaineistossa. Sekä slangisanojen että man-pronominin käyttö oli yleisempää Twitter-ainestossa kuin puhutun kielen korpuksessa. Vertailu puhutun kielen korpuksen kanssa oli kuitenkin haastavaa, sillä se oli vanhempi kuin Twitter-korpus ja koostui nuorempien ihmisten haastatteluista. Tästä syystä jatkotutkimusta vaaditaan, jotta puhutun ja kirjallisen muodon välisiä eroja voidaan tutkia tarkemmin MLE-puhujien keskuudessa.
  • Karell, Elis (2023)
    Ilmastonmuutoksen hillitsemiseksi fossiilisen energian tuotantoa ja käyttöä on vähennettävä merkittävästi. Fossiiliteollisuus on 1900-luvun lopusta asti vastustanut hillintää viestinnässään, alun perin kieltämällä ilmastonmuutos ja korostamalla hillinnän haittavaikutuksia. 2000-luvun alusta asti fossiiliteollisuus on alkanut myöntää hillinnän tärkeyden, mutta samalla oikeuttanut riittämättömän toiminnan ja fossiilisen energian käytön jatkamisen. Tällaista viestintää voidaan kutsua ilmastoviivytykseksi. Tämän tutkielman tavoite on tutkia miten ilmastoviivytyksen diskurssit ilmenevät Fortumin ja Nesteen vastuullisuusraporteissa ja millä tavalla raporteissa esiintyvät diskurssit ylläpitävät tai haastavat fossiilihegemoniaa. Fortumin ja Nesteen kasvihuonepäästöt ovat suomalaisten yhtiöiden korkeimmat ja molempien liiketoiminta perustuu pääosin fossiilisen energian tuotantoon. Kysymyksenasettelun lähtökohtana on ilmeinen konflikti yhtiöiden kestävyyttä painottavan viestinnän ja korkeapäästöisen ydintoiminnan välillä. Tutkielman aineistona toimivat yhtiöiden kaikki tähänastiset GRI-standardin mukaiset vastuullisuusraportit, eli Fortumin vastuullisuusraportit vuosilta 2010–2022 ja Nesteen vastuullisuusraportit vuosilta 2009–2022. Tutkielman menetelmänä toimii Fairclough’n diskurssiteoriaan perustuva korpusavusteinen diskurssianalyysi, joka hyödyntää frekvenssi-, kollokaatio- ja konkordanssianalyysia. Kyseinen teoreettinen ja menetelmällinen lähestymistapa mahdollistaa suuren aineiston analyysin ja ilmastonmuutoksen hillinnän hahmottamisen valtakonfliktina. Analyysi osoittaa, että ilmastonmuutoksen saama tila ja huomio raporteissa on kasvanut selkeästi. Raporteissa esiintyvät diskurssit ovat pääosin silti hyvin vakaita koko tutkitun ajanjakson ajalta. Yhtiöiden väliset erot ovat lähinnä painotuksissa ja vähemmän vahvoissa diskursseissa. Molempien yhtiöiden raporttien vahvimmissa diskursseissa on selkeitä piirteitä vastuun siirtämisen ja riittämättömien ratkaisujen yläluokkiin kuuluvista ilmastoviivytyksen diskursseista. Vastuu ilmastonmuutoksen hillinnästä asetetaan diskursseissa pääosin kuluttajille ja hillitsemiseksi esitetään pääosin teknologisia ja markkinapohjaisia ratkaisuja. Lisäksi ilmastonmuutoksen vaikutuksia koskevat diskurssit esittävät ilmastonmuutoksen abstraktina ilmiönä, jonka vaikutuksista miljardeihin ihmisiin jätetään puhumatta. Analyysi osoittaa myös, että molempien yhtiöiden raporteissa esiintyy fossiilisen energian korvaamisen vastadiskurssi. Diskurssi painottuu tutkitun ajanjakson myöhemmälle puoliskolle. Korvaamisen vastadiskurssi kietoutuu yhteen aineiston vahvimpien diskurssien kanssa tavalla, joka voidaan nähdä hegemonisen uudelleenneuvottelun tuloksena. Korvaamisen vastadiskurssikaan ei siis tuota subjekteja raporttien vahvimmista diskursseista poikkeavalla tavalla. Raporteissa ilmenevät diskursiiviset käytännöt eivät haasta vaan uusintavat nykyistä sosiaalista järjestystä ja fossiilihegemoniaa.
  • Karell, Elis (2023)
    Ilmastonmuutoksen hillitsemiseksi fossiilisen energian tuotantoa ja käyttöä on vähennettävä merkittävästi. Fossiiliteollisuus on 1900-luvun lopusta asti vastustanut hillintää viestinnässään, alun perin kieltämällä ilmastonmuutos ja korostamalla hillinnän haittavaikutuksia. 2000-luvun alusta asti fossiiliteollisuus on alkanut myöntää hillinnän tärkeyden, mutta samalla oikeuttanut riittämättömän toiminnan ja fossiilisen energian käytön jatkamisen. Tällaista viestintää voidaan kutsua ilmastoviivytykseksi. Tämän tutkielman tavoite on tutkia miten ilmastoviivytyksen diskurssit ilmenevät Fortumin ja Nesteen vastuullisuusraporteissa ja millä tavalla raporteissa esiintyvät diskurssit ylläpitävät tai haastavat fossiilihegemoniaa. Fortumin ja Nesteen kasvihuonepäästöt ovat suomalaisten yhtiöiden korkeimmat ja molempien liiketoiminta perustuu pääosin fossiilisen energian tuotantoon. Kysymyksenasettelun lähtökohtana on ilmeinen konflikti yhtiöiden kestävyyttä painottavan viestinnän ja korkeapäästöisen ydintoiminnan välillä. Tutkielman aineistona toimivat yhtiöiden kaikki tähänastiset GRI-standardin mukaiset vastuullisuusraportit, eli Fortumin vastuullisuusraportit vuosilta 2010–2022 ja Nesteen vastuullisuusraportit vuosilta 2009–2022. Tutkielman menetelmänä toimii Fairclough’n diskurssiteoriaan perustuva korpusavusteinen diskurssianalyysi, joka hyödyntää frekvenssi-, kollokaatio- ja konkordanssianalyysia. Kyseinen teoreettinen ja menetelmällinen lähestymistapa mahdollistaa suuren aineiston analyysin ja ilmastonmuutoksen hillinnän hahmottamisen valtakonfliktina. Analyysi osoittaa, että ilmastonmuutoksen saama tila ja huomio raporteissa on kasvanut selkeästi. Raporteissa esiintyvät diskurssit ovat pääosin silti hyvin vakaita koko tutkitun ajanjakson ajalta. Yhtiöiden väliset erot ovat lähinnä painotuksissa ja vähemmän vahvoissa diskursseissa. Molempien yhtiöiden raporttien vahvimmissa diskursseissa on selkeitä piirteitä vastuun siirtämisen ja riittämättömien ratkaisujen yläluokkiin kuuluvista ilmastoviivytyksen diskursseista. Vastuu ilmastonmuutoksen hillinnästä asetetaan diskursseissa pääosin kuluttajille ja hillitsemiseksi esitetään pääosin teknologisia ja markkinapohjaisia ratkaisuja. Lisäksi ilmastonmuutoksen vaikutuksia koskevat diskurssit esittävät ilmastonmuutoksen abstraktina ilmiönä, jonka vaikutuksista miljardeihin ihmisiin jätetään puhumatta. Analyysi osoittaa myös, että molempien yhtiöiden raporteissa esiintyy fossiilisen energian korvaamisen vastadiskurssi. Diskurssi painottuu tutkitun ajanjakson myöhemmälle puoliskolle. Korvaamisen vastadiskurssi kietoutuu yhteen aineiston vahvimpien diskurssien kanssa tavalla, joka voidaan nähdä hegemonisen uudelleenneuvottelun tuloksena. Korvaamisen vastadiskurssikaan ei siis tuota subjekteja raporttien vahvimmista diskursseista poikkeavalla tavalla. Raporteissa ilmenevät diskursiiviset käytännöt eivät haasta vaan uusintavat nykyistä sosiaalista järjestystä ja fossiilihegemoniaa.
  • Siekkinen, Jenni (2019)
    Tutkielman aiheena ovat ruotsin kieltosanat inte, icke, ej ja ingalunda. Tutkielmassa tarkastellaan näiden sanojen käyttöä korpusten avulla sekä määrällisesti että laadullisesti. Tutkimuksen määrällisen osion tarkoituksena on selvittää, onko sanojen välillä lukumäärällisesti merkittäviä eroja. Laadullisessa osiossa tarkastellaan sanojen syntaktisia rooleja. Lisäksi tutkielmassa selvitetään, minkälaisia eroja sanojen käytössä on suomenruotsalaisten ja ruotsinruotsalaisten tekstien sekä eri tekstilajien välillä. Tutkimuksen aineistona toimivat Göteborgin yliopiston Språkbanken-kielentutkimusyksikön korpukset, jotka ovat käytettävissä Korp-korpustyökalun kautta. Tutkimukseen sisältyy yhdeksän korpuskokoelmaa, joista neljä sisältää suomenruotsalaisia tekstejä ja viisi ruotsinruotsalaisia tekstejä. Aineisto pitää sisällään materiaalia vuosilta 1960–2017, ja pääosa aineistosta on 1990- ja 2000-luvuilta. Lisäksi sekä suomenruotsalaiset että ruotsinruotsalaiset korpukset kattavat seuraavat tekstilajit: kaunokirjallisuus, viranomaistekstit, sanomalehtitekstit sekä internet-tekstit. Tutkimustulokset osoittavat, että inte on yleisin kieltosana koko aineistossa. Kieltosanojen icke, ej ja ingalunda käyttö on puolestaan huomattavasti vähäisempää. Laadullinen analyysi osoittaa muun muassa, että kieltosanat inte ja ingalunda esiintyvät lähes yksinomaan kieltolauseissa. Kieltosanaa icke käytetään ensisijaisesti kieltoprefiksinä. Ej esiintyy sekä kieltolauseissa että ilmauksessa eller ej. Tulokset osoittavat lisäksi, että muodollisia ja vanhahtavia kieltosanoja icke ja ej suositaan viranomaisteksteissä ja tietyssä määrin myös kaunokirjallisuudessa. Suomenruotsalaisten ja ruotsinruotsalaisten tekstien väliset erot ovat pieniä. Tutkimustulosten perusteella on todennäköistä, että inte tulee olemaan yleisin kieltosana kaikissa yhteyksissä myös tulevaisuudessa. Vaikka kieltosanojen icke, ej ja ingalunda käyttö on vähäistä, on silti oletettavaa, että myös näiden sanojen käyttö tulee jatkumaan ainakin tietyissä yhteyksissä.
  • Vilenius, Tuisku (2021)
    Tämän maisterintutkielman tavoitteena oli tuottaa tietoa suomalaisten saamelaiskuvasta selvittämällä, miten suomalaiset kuvailevat saamelaisia ja saamelaisuutta internetkeskusteluissa. Tutkin, mitkä ovat yleisimmät saamelaisiin ja saamelaisuuteen liittyviin teemoihin viittatessa käytetyt adjektiivit, miten ne ovat muuttuneet ajan mittaan, sekä mitkä diskurssit vaikuttavat keskustelijoiden valitsemien adjektiivien taustalla. Tutkimuksen korpusaineistona ovat Suomi24-keskustelupalstan keskustelut vuosina 2001-2017. Aineistossa olevat saamelaisiin viittaavat adjektiivit on analysoitu kriittisen diskurssianalyysin ja alkuperäiskansatutkimuksen näkökulmasta. Analyysin näkökulma on sekä kvalitatiivinen että kvantitatiivinen. Tutkimuksen tuloksena saatuja adjektiiveja on verrattu aiemmasta tutkimuskirjallisuudesta tunnistamiini stereotyyppeihin saamelaisista ja muista alkuperäiskansoista, sekä aiempaan saamelaisdiskursseja käsitelleeseen tutkimukseen. Tutkimuksen kattamalla ajanjaksolla saamelaiskeskustelujen määrä Suomi24:ssä on kasvanut merkittävästi. Tämä osoittaa, että suomalaisten kiinnostus saamelaisia kohtaan on lisääntynyt. Saamelaiskeskustelun sisältö ei kuitenkaan ole muuttunut merkittävästi, vaan samat adjektiivit ovat säilyneet saamelaisten kuvauksissa yleisimpinä koko tutkimuksen kattaman ajan. Saamelaisista keskustellaan pääasiallisesti palstoilla, jotka on tarkoitettu saamelaisalueen paikkakunnille tai nimenomaisesti saamelaiskeskustelulle, mikä kertoo saamelaisuuden näkymättömyydestä yhteiskunnassa. Tutkimuksen perusteella saamelaisia määritellään kahden keskeisen diskurssin kautta: aitous- ja muinaisuusdiskurssin. Toisaalta saamelaiskeskustelu keskittyy saamelaismääritelmän ympärille muodostuneeseen aitousdiskurssiin, jossa keskustelijoiden tavoitteena on määrittää, kuka tai millainen on aito saamelainen. Toisaalta saamelaisia pidetään muinaisena kansana, joka elää perinteidenkunnioittamisen kautta, mutta jolle ei ole paikkaa nykyajassa. Saamelaisten nykyisen monimuotoisuuden kieltäminen toiseuttaa saamelaisia yhteiskunnassa ja kertoo, että suomalaisilla on vain vähän käsitystä saamelaisten tämän hetkisestä elämästä Suomessa.
  • Vilenius, Tuisku (2021)
    Tämän maisterintutkielman tavoitteena oli tuottaa tietoa suomalaisten saamelaiskuvasta selvittämällä, miten suomalaiset kuvailevat saamelaisia ja saamelaisuutta internetkeskusteluissa. Tutkin, mitkä ovat yleisimmät saamelaisiin ja saamelaisuuteen liittyviin teemoihin viittatessa käytetyt adjektiivit, miten ne ovat muuttuneet ajan mittaan, sekä mitkä diskurssit vaikuttavat keskustelijoiden valitsemien adjektiivien taustalla. Tutkimuksen korpusaineistona ovat Suomi24-keskustelupalstan keskustelut vuosina 2001-2017. Aineistossa olevat saamelaisiin viittaavat adjektiivit on analysoitu kriittisen diskurssianalyysin ja alkuperäiskansatutkimuksen näkökulmasta. Analyysin näkökulma on sekä kvalitatiivinen että kvantitatiivinen. Tutkimuksen tuloksena saatuja adjektiiveja on verrattu aiemmasta tutkimuskirjallisuudesta tunnistamiini stereotyyppeihin saamelaisista ja muista alkuperäiskansoista, sekä aiempaan saamelaisdiskursseja käsitelleeseen tutkimukseen. Tutkimuksen kattamalla ajanjaksolla saamelaiskeskustelujen määrä Suomi24:ssä on kasvanut merkittävästi. Tämä osoittaa, että suomalaisten kiinnostus saamelaisia kohtaan on lisääntynyt. Saamelaiskeskustelun sisältö ei kuitenkaan ole muuttunut merkittävästi, vaan samat adjektiivit ovat säilyneet saamelaisten kuvauksissa yleisimpinä koko tutkimuksen kattaman ajan. Saamelaisista keskustellaan pääasiallisesti palstoilla, jotka on tarkoitettu saamelaisalueen paikkakunnille tai nimenomaisesti saamelaiskeskustelulle, mikä kertoo saamelaisuuden näkymättömyydestä yhteiskunnassa. Tutkimuksen perusteella saamelaisia määritellään kahden keskeisen diskurssin kautta: aitous- ja muinaisuusdiskurssin. Toisaalta saamelaiskeskustelu keskittyy saamelaismääritelmän ympärille muodostuneeseen aitousdiskurssiin, jossa keskustelijoiden tavoitteena on määrittää, kuka tai millainen on aito saamelainen. Toisaalta saamelaisia pidetään muinaisena kansana, joka elää perinteidenkunnioittamisen kautta, mutta jolle ei ole paikkaa nykyajassa. Saamelaisten nykyisen monimuotoisuuden kieltäminen toiseuttaa saamelaisia yhteiskunnassa ja kertoo, että suomalaisilla on vain vähän käsitystä saamelaisten tämän hetkisestä elämästä Suomessa.
  • Obukhova, Anna (2019)
    Tutkielmassa tarkastellaan, kuinka Krimin liittäminen Venäjän Federaatioon esitettiin vuoden 2014 keväällä venäläisissä lehdissä ”Izvestija” ja ”Novaja gazeta”. ”Izvestija” on yhteiskunnallispoliittinen sanomalehti, joka kuuluu valtamediaan, kun taas ”Novaja gazeta” on edellistä vastaava sanomalehti, joka toimii opposition äänenkannattajana. Tutkielman tavoitteena on paljastaa representaatiot ja diskurssit, jotka nämä venäläislehdet omien poliittisten suuntauksiensa mukaisesti rakensivat Krimin tapahtumien ympärille. Tässä työssä käytetään teoreettisia käsitteitä diskurssi, representaatio ja kriittinen diskurssianalyysi. Tutkimuksen päämenetelmä on yhdistelmä korpuslingvistisestä kollokaatioanalyysista ja kriittisestä diskurssianalyysistä. Tässä työssä tutkitaan Krim-lemmaan liittyviä kollokaatioita. Näiden kollokaatioiden ympäristöstä etsitään myös retorisia keinoja. Retorinen analyysi on rinnakkaismenetelmä tässä tutkimuksessa. Tutkimusaineisto koostuu kahdesta eri artikkelikorpuksesta, Izvestija- ja Novaja Gazeta -korpuksista. Tutkimusaineisto rajoittuu ajallisesti 21.2.2014 ja 28.3.2014 väliin ”Krimin kevään” tapahtumien mukaan. Tutkimustulokset osoittavat ”Izvestijalle” kuusi tyypillistä diskurssia, kun taas ”Novaja gazetalle” kaksi. ”Izvestijalle” tyypilliset diskurssit ovat Venäjän toimia ja Krimin liittämistä tukevia. ”Izvestija” -aineistosta löytyi seuraavat diskurssit: historialliskulttuurinen yhteys Venäjän ja Krimin välillä, etnisten venäläisten suojeleminen Krimillä, Venäjän intressien turvaaminen, oma-aloitteiset toimet Krimin puolelta sekä Venäjä-myönteiset mielipiteet Krimillä, Krimin liittymisen tuki Venäjän väestöltä ja Krimin positiivinen kehitys osana Venäjää. ”Novaja gazetalle” tyypilliset diskurssit kritisoivat Venäjän toimintaa ja Krimin liittämistä Venäjään. ”Novaja gazetan” diskurssit keskittyvät sekä laittomaan liittämiseen että sen kielteisiin seurauksiin. Jotkin yllämainituista diskursseista kuitenkin esiintyvät molemmissa lehdissä. Tällaisten diskurssien sisällä kummankin lehden argumentit vastustavat toisiaan tai keskittyvät eri kohteisiin tukeakseen lehden omaa agendaa. Analyysin tulokset myös osoittavat, että ”Izvestijan” diskurssien enemmistö on poliittisia myyttejä, joiden tarkoitus on vahvistaa venäläistä dominoivaa poliittista ideologiaa. Toisaalta taas ”Novaja gazetan” liittämisenvastaiset argumentit osittain sivuavat läntisten samanhenkisten lehtien argumentointia. Kaiken kaikkiaan, ”Izvestijan” ja ”Novaja gazetan” diskurssien suhteen voidaan sanoa olevan taistelu dominoivan ja dominoitavan diskurssin välillä. Kummankin lehden representaatiot eroavat toisistaan radikaalisti suhteessa Krimin liittämisen arviointiin. Tutkimus myös osoittaa joitakin retorisia keinoja, joita lehdet käyttävät vakuuttaakseen lukijoitaan, esimerkiksi metafora, retorinen kysymys, konsensuksella tai asiantuntijan lausunnolla vahvistaminen ja puhujakategorioilla oikeuttaminen.
  • Koort, Kim (2020)
    Tutkielma tarkastelee musiikkikappaleiden sanoituksissa esiintyviä sukupuolten välisiä eroja, jotka liittyvät toimijuuden ja representaation ilmentymiin kielessä. Tutkielma pohjautuu sitä varten laadittuun korpukseen, jonka koostamiseen sovelletaan kieliteknologisia menetelmiä. Korpuksen avulla tutkielma selvittää musiikkikappaleiden tyylilajin sekä artistin sukupuolen merkitystä toimijuuteen ja representaatioon liittyvien erojen muodostumiseen. Tutkielma sijoittuu täten korpuslingvistiseen viitekehykseen. Tutkielman aineisto koostuu tutkielmaa varten kerätystä korpuksesta, joka jakaantuu kahteen alakorpukseen. Näistä ensimmäinen sisältää kolmen musiikin tyylilajin (pop, R&B/hip hop ja country) sanoituksia. Toisen alakorpuksen lajittelu on tehty artistin sukupuolen perusteella (mies/nainen). Korpus sisältää noin 4 300:n musiikkikappaleen sanoitukset ja sen koko on noin 1,8 miljoonaa sanaa. Tutkielma soveltaa aineiston analyysiin sekä kvantitatiivisia että kvalitatiivisia menetelmiä. Pääasiallinen tutkimusmenetelmä on korpuslingvistinen analyysi, jonka tuloksia tulkitaan laadullisesta näkökulmasta. Tutkielma ei havainnut eroja toimijuudessa sukupuolten välillä. Representaation osalta tulokset osoittavat sanoituksissa naisiin kohdistuvan ulkonäköperusteisen luonnehdinnan olevan yleisempää verrattuna miehiin. Lisäksi sanoituksissa viitataan naisiin keskimäärin myönteisemmin kuin miehiin. Toimijuuden ja representaation suhteellisen osuuden tarkastelun kautta voidaan todeta naisten olevan miehiä enemmän esillä sanoituksissa. Musiikkikappaleiden tyylilajin ja artistin sukupuolen merkitys tuloksiin on vähäinen. Tutkielma osoittaa, että kieliteknologia tarjoaa uusia mahdollisuuksia luoda korpuksia, jotka on räätälöity tiettyjen tutkimuskysymysten tarkastelua varten.
  • Koort, Kim (2020)
    Tutkielma tarkastelee musiikkikappaleiden sanoituksissa esiintyviä sukupuolten välisiä eroja, jotka liittyvät toimijuuden ja representaation ilmentymiin kielessä. Tutkielma pohjautuu sitä varten laadittuun korpukseen, jonka koostamiseen sovelletaan kieliteknologisia menetelmiä. Korpuksen avulla tutkielma selvittää musiikkikappaleiden tyylilajin sekä artistin sukupuolen merkitystä toimijuuteen ja representaatioon liittyvien erojen muodostumiseen. Tutkielma sijoittuu täten korpuslingvistiseen viitekehykseen. Tutkielman aineisto koostuu tutkielmaa varten kerätystä korpuksesta, joka jakaantuu kahteen alakorpukseen. Näistä ensimmäinen sisältää kolmen musiikin tyylilajin (pop, R&B/hip hop ja country) sanoituksia. Toisen alakorpuksen lajittelu on tehty artistin sukupuolen perusteella (mies/nainen). Korpus sisältää noin 4 300:n musiikkikappaleen sanoitukset ja sen koko on noin 1,8 miljoonaa sanaa. Tutkielma soveltaa aineiston analyysiin sekä kvantitatiivisia että kvalitatiivisia menetelmiä. Pääasiallinen tutkimusmenetelmä on korpuslingvistinen analyysi, jonka tuloksia tulkitaan laadullisesta näkökulmasta. Tutkielma ei havainnut eroja toimijuudessa sukupuolten välillä. Representaation osalta tulokset osoittavat sanoituksissa naisiin kohdistuvan ulkonäköperusteisen luonnehdinnan olevan yleisempää verrattuna miehiin. Lisäksi sanoituksissa viitataan naisiin keskimäärin myönteisemmin kuin miehiin. Toimijuuden ja representaation suhteellisen osuuden tarkastelun kautta voidaan todeta naisten olevan miehiä enemmän esillä sanoituksissa. Musiikkikappaleiden tyylilajin ja artistin sukupuolen merkitys tuloksiin on vähäinen. Tutkielma osoittaa, että kieliteknologia tarjoaa uusia mahdollisuuksia luoda korpuksia, jotka on räätälöity tiettyjen tutkimuskysymysten tarkastelua varten.
  • Kyllästinen, Eva-Maria (2017)
    Tämä pro gradu -tutkielma tarkastelee suvereniteetti-käsitteen käyttöä ja käsitteellistämistä Britannian kaksikamarisessa parlamentissa 1950-, 1970- ja 1990-luvuilla. Suvereniteetti on kansallisen ja kansainvälisen oikeuden tärkeimpiä käsitteitä. Käsitteellä on yleisesti tarkoitettu poliittisen yhteisön korkeimman vallankäyttäjän ominaisuutta. Suvereniteettiin liitetään myös itsemäärääminen ja itsenäisyys. Politiikan tutkijoiden ja lainharjoittajien parissa ei kuitenkaan vallitse konsensusta sen merkityksestä ja on esitetty käsitteen hylkäämistä sen paradoksaalisuuden vuoksi. Tutkielman tavoitteena on selvittää, mitä dimensioita Britannian parlamentaarikkojen suvereniteettidiskurssit ovat heijastaneet Euroopan integraation ja globalisaation edetessä. Britannia on hyvä tutkimuskohde, koska se on suhtautunut ylikansalliseen päätöksentekoon varauksellisesti. Tutkielman teoreettisessa viitekehyksessä nostetaan esille suvereniteetin monet määritelmät, Britannian parlamentin suvereenisuuden periaate, Euroopan poliittisen järjestelmän ja valtiosuvereenisuuden muotoutuminen sekä konstruktionistinen lähestymistapa suvereniteetin käsitteeseen. Tarkasteltavat vuosikymmenet on valittu niiden poliittisen ja historiallisen merkityksen vuoksi. 1950-luvulla Brittiläinen imperiumi alkoi purkautua ja Schumanin julistuksen myötä elettiin Euroopan yhteisön ensihetket. Vuonna 1973 Britannia liittyi Euroopan yhteisön jäseneksi ja postmodernilla 1990-luvulla globalisaation voidaan nähdä entisestään kiihtyneen. Tutkielmassa suvereniteettia lähestytään sekä määrällisesti että laadullisesti analysoimalla Hansard-korpukseen tallennettuja Britannian parlamentissa käytyjä puheita. Tutkimusaineistona on 900 kolmelta eri vuosikymmeneltä sattumanvaraisesti valittua suvereniteetti-käsitteen sisältävää konkordanssiriviä ja suvereniteetin 30 kollokaatiota. Aineiston analysoimiseksi käsitteelle on luotu seitsemän eri dimensiota, jotka ovat kotimainen dimensio, juridinen dimensio, supranationaalinen dimensio, parlamentaarinen dimensio, kontraktuaalinen dimensio, teoreettinen dimensio ja dekonstruktiivinen dimensio. Kotimainen dimensio viittaa valtion sisäiseen suvereniteettiin, juridinen dimensio ulkoiseen suvereniteettiin, supranationaalinen dimensio toimivallan siirtymiseen ylikansallisille elimille, parlamentaarinen dimensio suvereenia lainsäädäntövaltaa käyttäviin instituutioihin, kontraktuaalinen dimensio kansanvaltaan, teoreettinen dimensio suvereniteetin ontologiaan ja dekonstruktiivinen dimensio suvereniteetin olemattomuuteen tai pahuuteen. Konkordanssirivit on analysoitu dimensioihin ja analyysiosiossa on esitetty laskelmat dimensioiden frekvensseistä ja vertailtu käsitteen kollokaatioprofiileja konkordanssianalyysin tuloksiin. Tutkielman tulokset osoittavat hypoteesin mukaisesti, että juridinen dimensio on ollut korkeimmillaan 1950-luvulla ja parlamentaarinen dimensio 1970-luvulla. 1990-luvulla ei ole nähtävissä hypoteesissa esitettyä dekonstruktiivisen dimension frekvenssin merkittävää kasvua. Sen sijaan 1990-luvulla on lisääntynyt kontraktuaalinen dimensio, mikä indikoi tarvetta painottaa demokraattista valtuutusta vallankäytölle. Kollokaatti national, “kansallinen”, esiintyy kaikkina vuosikymmeninä kahden frekventeimmän kollokaatin ryhmässä. Tämä viittaa siihen, että suvereenisuus liitetään kansallisvaltioiden ensisijaisuutta koskeviin normatiivisiin periaatteisiin. Tutkielman loppupäätelmissä esitetään, että suvereniteetin dimensioiden olemassaolo määräytyy niiden konstruoitumisesta poliittisissa diskursseissa. Suvereniteetin eri dimensioiden tutkiminen on tärkeää, koska suvereniteetti-konstruktio on yhteydessä siihen, kuinka käsitettä harjoitetaan poliittis-oikeudellisissa toimintaympäristöissä. Aikana, jolloin kansallista päätäntävaltaa on delegoitu ylikansallisille elimille, absoluuttisen ja jakamattoman suvereenisuuden klassiseen käsitykseen kohdistuu erityisiä haasteita.
  • Kyllästinen, Eva-Maria (2017)
    Tämä pro gradu -tutkielma tarkastelee suvereniteetti-käsitteen käyttöä ja käsitteellistämistä Britannian kaksikamarisessa parlamentissa 1950-, 1970- ja 1990-luvuilla. Suvereniteetti on kansallisen ja kansainvälisen oikeuden tärkeimpiä käsitteitä. Käsitteellä on yleisesti tarkoitettu poliittisen yhteisön korkeimman vallankäyttäjän ominaisuutta. Suvereniteettiin liitetään myös itsemäärääminen ja itsenäisyys. Politiikan tutkijoiden ja lainharjoittajien parissa ei kuitenkaan vallitse konsensusta sen merkityksestä ja on esitetty käsitteen hylkäämistä sen paradoksaalisuuden vuoksi. Tutkielman tavoitteena on selvittää, mitä dimensioita Britannian parlamentaarikkojen suvereniteettidiskurssit ovat heijastaneet Euroopan integraation ja globalisaation edetessä. Britannia on hyvä tutkimuskohde, koska se on suhtautunut ylikansalliseen päätöksentekoon varauksellisesti. Tutkielman teoreettisessa viitekehyksessä nostetaan esille suvereniteetin monet määritelmät, Britannian parlamentin suvereenisuuden periaate, Euroopan poliittisen järjestelmän ja valtiosuvereenisuuden muotoutuminen sekä konstruktionistinen lähestymistapa suvereniteetin käsitteeseen. Tarkasteltavat vuosikymmenet on valittu niiden poliittisen ja historiallisen merkityksen vuoksi. 1950-luvulla Brittiläinen imperiumi alkoi purkautua ja Schumanin julistuksen myötä elettiin Euroopan yhteisön ensihetket. Vuonna 1973 Britannia liittyi Euroopan yhteisön jäseneksi ja postmodernilla 1990-luvulla globalisaation voidaan nähdä entisestään kiihtyneen. Tutkielmassa suvereniteettia lähestytään sekä määrällisesti että laadullisesti analysoimalla Hansard-korpukseen tallennettuja Britannian parlamentissa käytyjä puheita. Tutkimusaineistona on 900 kolmelta eri vuosikymmeneltä sattumanvaraisesti valittua suvereniteetti-käsitteen sisältävää konkordanssiriviä ja suvereniteetin 30 kollokaatiota. Aineiston analysoimiseksi käsitteelle on luotu seitsemän eri dimensiota, jotka ovat kotimainen dimensio, juridinen dimensio, supranationaalinen dimensio, parlamentaarinen dimensio, kontraktuaalinen dimensio, teoreettinen dimensio ja dekonstruktiivinen dimensio. Kotimainen dimensio viittaa valtion sisäiseen suvereniteettiin, juridinen dimensio ulkoiseen suvereniteettiin, supranationaalinen dimensio toimivallan siirtymiseen ylikansallisille elimille, parlamentaarinen dimensio suvereenia lainsäädäntövaltaa käyttäviin instituutioihin, kontraktuaalinen dimensio kansanvaltaan, teoreettinen dimensio suvereniteetin ontologiaan ja dekonstruktiivinen dimensio suvereniteetin olemattomuuteen tai pahuuteen. Konkordanssirivit on analysoitu dimensioihin ja analyysiosiossa on esitetty laskelmat dimensioiden frekvensseistä ja vertailtu käsitteen kollokaatioprofiileja konkordanssianalyysin tuloksiin. Tutkielman tulokset osoittavat hypoteesin mukaisesti, että juridinen dimensio on ollut korkeimmillaan 1950-luvulla ja parlamentaarinen dimensio 1970-luvulla. 1990-luvulla ei ole nähtävissä hypoteesissa esitettyä dekonstruktiivisen dimension frekvenssin merkittävää kasvua. Sen sijaan 1990-luvulla on lisääntynyt kontraktuaalinen dimensio, mikä indikoi tarvetta painottaa demokraattista valtuutusta vallankäytölle. Kollokaatti national, “kansallinen”, esiintyy kaikkina vuosikymmeninä kahden frekventeimmän kollokaatin ryhmässä. Tämä viittaa siihen, että suvereenisuus liitetään kansallisvaltioiden ensisijaisuutta koskeviin normatiivisiin periaatteisiin. Tutkielman loppupäätelmissä esitetään, että suvereniteetin dimensioiden olemassaolo määräytyy niiden konstruoitumisesta poliittisissa diskursseissa. Suvereniteetin eri dimensioiden tutkiminen on tärkeää, koska suvereniteetti-konstruktio on yhteydessä siihen, kuinka käsitettä harjoitetaan poliittis-oikeudellisissa toimintaympäristöissä. Aikana, jolloin kansallista päätäntävaltaa on delegoitu ylikansallisille elimille, absoluuttisen ja jakamattoman suvereenisuuden klassiseen käsitykseen kohdistuu erityisiä haasteita.
  • Niemi, Janne (2020)
    Tämän tutkielman aiheena on Marcus Terentius Varron (116-27 eaa) Res Rusticae -teoksen dialogimuotoisen tekstin henkilöhahmojen kieli. Keskeisenä tutkimuskysymyksenä on selvittää, onko teoksessa esiintyvien puhujien välillä havaittavissa kielellisiä eroja. Analyysin pohjana on teoksen kaikki kolme kirjaa kattava digitaalinen tekstikorpus. Aineisto on jäsennetty ja annotoitoitu puupankiksi, joka sisältää tiedot tekstin saneiden muoto-opillisista ominaisuuksista ja dependenssikieliopin mukaisista syntaktisista suhteista. Annotoinnissa on hyödynnetty tietokoneavusteista, automaattista jäsennystä, jonka käyttökelpoisuutta käsillä olevan tutkimuskysymyksen analyysissä työssä myös arvioidaan. Res Rusticaeta on pitkään tutkittu lähinnä maatalousaiheisena ammattikirjallisuutena, mutta uudemmassa tutkimuksessa on alettu kiinnostua teoksen dialogimuodosta, syvällisemmistä merkityksistä ja yhtäläisyyksiä filosofisen dialogin traditioon sekä satiiriin. Tekstissä esiintyvien eri henkilöhahmojen puheen sisällön ja etenkään kielellisten piirteiden eroihin ei kuitenkaan ole aiemmin kiinnitetty erityisempää huomiota. Puupankkiaineisto tekee mahdolliseksi määrällisen analyysin useista erilaisista kielellisistä piirteistä. Tässä työssä tarkastellaan erityisesti funktiosanojen frekvensseissä, ut-rakenteiden ominaisuuksissa ja alistuskonjunktioiden anastrofissa havaituja eroja dialogin puhujien välillä. Funktiosanojen esiintymisfrekvenssejä tutkimalla voidaan saada vihjeitä esimerkiksi eri puhujien mahdollisesti käyttämistä sivulausetyypeistä. Ut-rakenteiden tarkempi tutkiminen puupankkiaineiston avulla on esimerkkinä yksityiskohtaisemmasta lauserakenteiden tarkastelusta. Anastrofi on aiemmassa tutkimuksessa esiin nostettu Varron kielelle tyypillinen. Puhujien välillä havaitut erot kielellisissä piirteissä näyttävät niin vahvoilta, että niiden tutkiminen perusteellisemmin vaikuttaa mielekkäältä. Erilaisten leksikaalisten ja syntaktisten piirteiden takana voi kuitenkin olla moninaisia syitä ja kielellisiä ilmiöitä, joten useimmissa tapauksissa menetelmien tässä tutkielmassa tuottamat havainnot toimivat lähinnä hyvinä vihjeinä perusteellisemman tutkimuksen kohteiksi. Joka tapauksessa käytetyt digitaaliset menetelmät ja erityisesti puupankkien analysointi osoittautuvat tutkimuskysymyksen kannalta hyödyllisiksi ja käyttökelpoisiksi. Lisäksi tämänkaltainen aineiston yleiskuvan tarkastelu parhaimmillaan tuottaa uusia havaintoja sellaisista erityspiirteistä, joihin ei välttämättä muuten tulisi kiinnittäneeksi huomiota.