Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by Subject "evaluation"

Sort by: Order: Results:

  • Nyholm, Sabine (2020)
    Universella meningsrepresentationer och flerspråkig språkmodellering är heta ämnen inom språkteknologi, specifikt området som berör förståelse för naturligt språk (natural language understanding). En meningsinbäddning (sentence embedding) är en numerisk skildring av en följd ord som motsvaras av en hel fras eller mening, speficikt som ett resultat av en omkodare (encoder) inom maskininlärning. Dessa representationer behövs för automatiska uppgifter inom språkteknologi som kräver förståelse för betydelsen av en hel mening, till skillnad från kombinationer av enskilda ords betydelser. Till sådana uppgifter kan räknas till exempel inferens (huruvida ett par satser är logiskt anknutna, natural language inference) samt åsiktsanalys (sentiment analysis). Med universalitet avses kodad betydelse som är tillräckligt allmän för att gynna andra relaterade uppgifter, som till exempel klassificering. Det efterfrågas tydligare samförstånd kring strategier som används för att bedöma kvaliteten på dessa inbäddningar, antingen genom att direkt undersöka deras lingvistiska egenskaper eller genom att använda dem som oberoende variabler (features) i relaterade modeller. På grund av att det är kostsamt att skapa resurser av hög kvalitet och upprätthålla sofistikerade system på alla språk som används i världen finns det även ett stort intresse för uppskalering av moderna system till språk med knappa resurser. Tanken med detta är så kallad överföring (transfer) av kunskap inte bara mellan olika uppgifter, utan även mellan olika språk. Trots att behovet av tvärspråkiga överföringsmetoder erkänns i forskningssamhället är utvärderingsverktyg och riktmärken fortfarande i ett tidigt skede. SentEval är ett existerande verktyg för utvärdering av meningsinbäddningar med speciell betoning på deras universalitet. Syftet med detta avhandlingsprojekt är ett försök att utvidga detta verktyg att stödja samtidig bedömning på nya uppgifter som omfattar flera olika språk. Bedömningssättet bygger på strategin att låta kodade meningar fungera som variabler i så kallade downstream-uppgifter och observera huruvida resultaten förbättras. En modern mångspråkig modell baserad på så kallad transformers-arkitektur utvärderas på en etablerad inferensuppgift såväl som en ny känsloanalyssuppgift (emotion detection), av vilka båda omfattar data på en mängd olika språk. Även om det praktiska genomförandet i stor utsträckning förblev experimentellt rapporteras vissa tentativa resultat i denna avhandling.
  • Dara, Dahat (2021)
    COVID-19-pandemian myötä vuotta 2020 on varjostanut epävarmuus ja pelko, mikä on havaittavissa sekä perinteisessä että sosiaalisessa mediassa käytävässä keskustelussa. Sosiaalisen median käytössä korostuu eri kanavien rooli sekä tiedon lähteenä että käyttäjien omien näkemysten ilmaisemisen välineenä. Lisäksi sosiaalisessa mediassa korostuu käyttäjien välinen vuorovaikutus. Sosiaalisen median käyttäminen terveyteen liittyvän tiedon lähteenä voi kuitenkin olla ongelmallista, erityisesti jos tieto erkaantuu tieteellisesti todistetusta faktasta. Sosiaalisessa mediassa esiintyvän diskurssin tarkasteleminen voi kuitenkin laajentaa ymmärrystämme käyttäjien suhtautumisesta ja asenteista uhkaavien infektiosairauksien vaaroihin sekä leviämisen estämiseen liittyviin toimenpiteisiin. Tämän tutkimuksen osalta COVID-19-pandemiaa lähestytään kasvomaskien käyttöön liittyvän diskurssin tarkastelulla suhtautumisen näkökulmasta. Analyysissa sovelletaan Martinin ja Whiten suhtautumisen teoriaa (Appraisal theory), jonka avulla voidaan havainnoida puhujien asennoitumista kasvomaskien käyttöön tarkastelemalla kielessä ilmenevää evaluaatiota. Teorian viitekehys koostuu kolmesta järjestelmästä: asennoituminen (attitude), sitoutuminen (engagement) ja asteittaisuus (graduation). Tämä tutkimus on rajattu asennoitumisen järjestelmään, joka jakautuu edelleen kolmeen alajärjestelmään: tunteiden ilmaisuun (affect), toiminnan arvosteluun (judgement) sekä esineiden ja asioiden arvottamiseen (appreciation). Suhtautumisen teoriassa kieli mielletään systeemis-funktionaalisesta kieliteoriasta lainaten merkitysten viestittämisen järjestelmänä, jossa evaluaatio toteutuu puhujan valitessa lukuisien mahdollisten merkitysten välillä. Tutkimuksen aineistona käytetään yhdysvaltalaisessa Washington Post -lehdessä julkaistua kasvomaskien oikeaoppiseen käyttöön ohjeistavan uutisartikkelin kommenttiosiota. Kommenttiosio koostuu yhteensä 137 kommentista, joista 114 sisältää kasvomaskien käyttöön liittyvää asennoitumista. Näissä 114 kommentissa ilmenee asennoitumista yhteensä 147 kertaa. Kommenttien analysoinnissa sovelletaan kvalitatiivista analyysia, jonka avulla kommenteista ensin täsmennetään asennoitumisen esiintymät. Tämän jälkeen analyysissa määritellään tarkemmin mitä kasvomaskeihin liittyvää aspektia arvioidaan, mikä on asennoitumisen polariteetti ja mihin arviointi sijoittuu asennoitumisen alajärjestelmissä. Tulokset osoittavat, että kasvomaskeihin liittyvässä diskurssissa korostuu ihmistoiminnan arvostelu, mikä ilmenee kasvomaskien käyttämättä jättämisen kielteisenä arvosteluna. Myös kasvomaskien sääntöihin sekä sääntöjen toteutumiseen ja valvontaan liittyvät epäjohdonmukaisuudet saavat osakseen kielteistä arvottamista. Tuloksissa ilmenee myös negatiivista asennoitumista poliittisia johtajia ja instituutioita kohtaan sekä näkyvää poliittista vastakkainasettelua, jossa kasvomaskien käyttämättömyys mielletään oikeistolaisen ideologian seuraukseksi. Tulokset viittaavat siihen, että kasvomaskeihin suhtaudutaan myönteisesti ja niiden tärkeys sairauden leviämisen estämiseksi tiedostetaan.
  • Nieminen, Tommi (2018)
    Konekäännösten laadun arviointiin on kehitetty erilaisia menetelmiä 1950-luvulta lähtien. Aluksi laadunarviointimenetelmät olivat lähes yksinomaan manuaalisia, eli ne perustuivat kohdekielen osaajien subjektiivisiin arvioihin konekäännöksen laadusta. 1990-luvulla otettiin käyttöön ensimmäiset automaattiset arviointimenetelmät. Pitkäkestoisesta ja laajasta tutkimuksesta huolimatta sekä manuaaliset että automaattiset arviointimenetelmät ovat edelleen epäluotettavia. Manuaalisten menetelmien ongelmana on se, että eri arvioijien tekemät arviot eivät ole johdonmukaisia. Automaattiset menetelmät taas perustuvat yleensä konekäännöksen vertaamiseen ihmiskääntäjän tekemään yksittäiseen vertailukäännökseen. Lähes jokaiselle lähdelauseelle on olemassa suuri määrä mahdollisia käännöksiä, joten automaattiset menetelmät arvioivat hyvin usein käännökset väärin. Tässä tutkielmassa kuvataan uudenlainen automaattinen menetelmä konekäännösten laadun arviointia varten. Menetelmän testiaineisto koostuu englanninkielisistä lähdelauseista, joista jokaiselle on käytettävissä erittäin laaja joukko suomenkielisiä vertailukäännöksiä. Testiaineisto perustuu manuaalisesti laadittuihin monikielisiin kielioppeihin, jotka ovat eräänlaisia semanttisia malleja, joilla on erilaisia ilmentymiä lähde- ja kohdekielessä. Lähdekielen ilmentymät muodostavat lähdelauseiden joukon ja kohdekielen ilmentymät vertailulauseiden joukon. Semanttiset mallit sisältävät semanttisia muuttujia, jotka lisäävät vaihtelevuutta testiaineistoon. Lähdelauseiden konekäännöksiä verrataan vertailukäännöksiin käyttämällä äärellistilaisia menetelmiä, jotka mahdollistavat konekäännöstä eniten muistuttavan vertailukäännöksen tehokkaan etsimisen. Äärellistilaisten siirtymien avulla voidaan myös seurata, millaisia muutoksia konekäännökseen on tehtävä, jotta sen voi muuttaa sitä eniten muistuttavaksi vertailulauseeksi. Tämä mahdollistaa yksityiskohtaisten virheanalyysien laatimisen, joiden avulla voidaan analysoida konekäännösjärjestelmien vahvuuksia ja heikkouksia. Tutkielman menetelmää arvioidaan kääntämällä testiaineisto kahdeksalla erilaisella konekäännösjärjestelmällä, jotka perustuvat erilaisiin konekäännösmenetelmiin. Konekäännökset käsitellään sen jälkeen menetelmällä. Menetelmän toimivuutta arvioidaan vertaamalla sen tuottamaa virheanalyysia kahden arvioijan tekemiin manuaalisiin virheannotaatioihin sekä testaamalla, pystyykö menetelmä erottamaan ihmiskääntäjien käännökset konekäännöksistä luotettavasti. Menetelmän arviointi osoittaa, että se on riittävän luotettava antamaan yksityiskohtaisia tietoja konekäännösjärjestelmien ominaisuuksista. Menetelmän tulokset ovat myös yhdenmukaisia julkaistujen konekäännöksen virheanalyysia käsittelevien artikkelien tulosten kanssa. Menetelmä siis soveltuu ongelmien automaattiseen havaitsemiseen konekäännösjärjestelmien kehittämisen aikana, mikä on sen pääasiallinen käyttötarkoitus.
  • Kaaronen, Jukke (2018)
    Pro gradu -tutkielman tavoite on kehittää metodologia, joka yhdistää tilannekomedioissa esiintyvää sosiolingvististä epäkohteliaisuutta ja sen tilanteellista kontekstia ohjelmissa representoitujen käytänteiden pohjalta. Tavoitetta lähestytään soveltamalla toisiaan täydentävien alojen teoriamalleja 1970-luvun amerikkalaisessa tilannekomediassa Perhe on pahin (All in the Family) esiintyviin puheakteihin, joissa tuotetaan negatiivisia arviointeja perheenjäsenien kesken. Tärkeimmiksi teoriamalleiksi muodostuvat epäkohteliaisuuden käsitteellistämistä koskevat mallit (impoliteness), diskurssianalyysistä sovelletut ihmisten arviointiin liittyvät mallit (negative judgements) sekä käytäntöyhteisöjen rakennetta ja toimintaa soveltavat mallit (community of practice). Nämä yhdistetään tutkielmassa laajempaan kulttuuristen affordanssien (cultural affordances), televisiodiskurssin sekä sosiaalisen merkityksellisyyden rakentumisen ja indeksikaalisuuden kontekstiin. Tutkielman premissiksi muodostuu oletus, että henkilöhahmojen väliset negatiiviset arvioinnit sekä niissä ilmenevät kvalitatiiviset ja kvantitatiiviset eroavaisuudet sisältävät representaatioita yhteiskunnan makro-sosiaalisista diskursseista. Täten ne tarjoavat myös mahdollisuuden tutkia ajallista sosiaalista muutosta televisio-ohjelmien representaatioissa. Tutkimus perustuu Perhe on pahin -sarjan ensimmäiseen tuotantokauteen. Tutkimusmateriaali on kerätty sarjan jaksoja katsomalla ja litteroimalla. Se koostuu kahdesta erillisestä aineistosta: Ensimmäinen aineisto koostuu havainnoista, joissa hahmojen toisiinsa kohdistuneet negatiiviset arvioinnit aiheuttavat negatiivisia reaktioita arvioinnin kohteesssa. Toinen aineisto koostuu havainnoista, jotka perustuvat henkilöhahmojen representoituihin toimintoihin. Edellä mainitut aineistot yhdistetään tutkimuksessa synteesiksi, jossa henkilöhahmojen representoitu toiminta käsitteellistetään negatiivisten arviointien tilanteelliseksi kontekstiksi. Tutkimuksen analyysissä tuodaan esille tuloksissa esiintyviä mielenkiintoisia eroavaisuuksia, jotka yhdistetään 1970-luvun Yhdysvaltojen makro-sosiaalisiin diskursseihin, kuten rotu- ja sukupuolitasa-arvoon sekä seksuaaliseen vapauteen. Tuloksia tarkastellaan sekä negatiivisten arviointien kvalitatiivis-kvantitaativisella analyysillä että esimerkkianalyysillä. Tutkimuksen merkittävimmät tulokset nousevat esille henkilöhahmodyadeissa esiintyvien negatiivisten arviointien eroavaisuuksien laadullisessa sekä määrällisessä distribuutiossa. Tarkastelemalla näitä representoitujen toimintojen yhteydessä saadaan empiiristen havaintojen tukema kuvaus makro-sosiaalisten diskurssien, kuten sukupuolittuneen työnjaon, representaatiosta negativiisissa arvioinneissa. Tutkimuksessa kehitetty metodologia osoittautuu toimivaksi ja luo pohjan mahdolliselle jatkotutkimukselle.
  • Honkavaara, Sanni (2022)
    This thesis explores press bias in the US and UK news coverage of the final 2020 US presidential debate between Joe Biden and Donald Trump. An integral part of the US presidential election campaigns, the debates are televised events where the presidential candidates discuss controversial topics, and the press reports about the debates in real time. The goal of this thesis is to analyse whether a bias towards one of the candidates can be identified in the press coverage, and whether there is a difference between the coverage in the two countries. While the topic of press bias in elections has evoked academic interest in other fields, linguistic research has been minimal. Previous studies have found that the press coverage of presidential debates is sometimes biased or inaccurate, which might have the potential to influence voter behaviour. In this thesis I analyse whether a linguistic approach can offer new insight on how these biases manifest. The data comes from 8 US and 10 UK newspapers and consists of 69 newspaper articles. These countries were chosen, because their media systems have been found to share many similarities in the past, and they can give a general idea of the press coverage in the English-speaking world. More than just bias, this study analyses something called evaluation, an area of linguistics that deals with how writers express their views, how they build discourse with the readers and how they reflect the values of their community. Appraisal Framework (Martin and White, 2005) was used in the analysis, as it has been specifically designed for analysing evaluation and has been applauded for its ability to recognise implicit attitudes of the writers. The framework consists of three categories: ATTITUDES of the writer, ENGAGEMENT with the reader and GRADUATION, the degree of the attitudes. The collected data was analysed and classified manually in a close reading. The differences between the countries were found to be small, and a consistent bias favouring Biden was identified in the press coverage of both countries. In the ATTITUDE category, Trump was more often evaluated negatively than positively in both countries, especially regarding his moral standing (PROPRIETY) and his skills and capabilities (CAPACITY). Biden, on the other hand, was not evaluated negatively as much as Trump, and in the US, there were more positive than negative evaluations of him. He was most often applauded for his successes in the debate (CAPACITY). ENGAGEMENT was most often used by the journalists to oppose Trump’s views and to support Biden’s. The framework made it possible to build a more detailed description of how the biases manifest in the presidential debate news coverage and especially excelled in recognising implicit attitudes. At the same time, the framework had some issues regarding replicability of the study due to the subjectivity in identifying implicit attitudes. Some of these issues have been brought up by researchers in the past and adjustments for the framework have been suggested. Future studies using the Appraisal Framework could benefit from using one of these adjustments and seeing how that affects the results.