Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by Subject "faktorianalyysi"

Sort by: Order: Results:

  • Vepsäläinen, Lassi (2018)
    4chan on täysin anonyymi kuvafoorumi, joka on herättänyt huomiota valtamediassa mm. poliittisesta epäkorrektiudestaan. Täysi anonymiteetti on internetissä harvinaista, ja psykologiassa ilmiön on todettu vaikuttavan ihmisiin eri tavoin. Sivuston pääkieli on englanti ja käyttäjäkunta on melko kansainvälinen. Kielenkäyttö sivustolla tuntuu eroavan muusta internetistä, ja vaikka sosiaalisen median suurimmat alustat (esim. Twitter, Facebook) ovat herättäneet tutkijoiden huomion, on täysin anonyymin kielen tutkimus jäänyt vähemmälle. Tutkimukseni pyrkii selvittämään, onko englannin kielen anonyymissä verkkorekisterissä eroa ei-anonyymiin verkkorekisteriin verrattuna. Tutkimusta voi pitää pilottitutkimuksena, sillä vastaavaa menetelmää ei ole aiemmin sovellettu täysin anonyymiin aineistoon. Tutkimusta varten koottiin 4chanin eri foorumeilta n. 8 miljoonaa sanaa käsittävä korpus. Korpukseen merkittiin 62 eri kielenpiirrettä MAT-tietokoneohjelmalla. Multidimensionaalinen analyysi on Douglas Biberin kehittämä menetelmä, jossa hyödynnetään faktorianalyysiä ja korpuksesta kerättyä tietoa sanojen esiintyvyystaajuuksista. Metodi on sekä määrällinen että laadullinen. Ensin teksteistä lasketaan eri kielenpiirteiden esiintymistaajuudet, jotka normalisoidaan. Faktorianalyysiä soveltamalla kielenpiirteiden varianssia voidaan kuvata paljon alkuperäistä pienemmällä joukolla. Faktorianalyysi perustuu olettamukseen, että muuttujajoukon varianssin taustalla on piileviä muuttujia, joita kutsutaan faktoreiksi. Kielenpiirteiden yhteisesiintyvyyden ja komplementaarisen esiintyvyyden taajuuksien tulkinnan jälkeen ulottuvuudet nimetään. Tarkemmin kuvailtuna faktorianalyysiin syötetään kussakin tekstissä esiintyvien kielenpiirteiden esiintymistaajuudet, minkä jälkeen faktorianalyysi tuottaa faktorirakenteita. Lopputuloksena saadaan noin 10-20 muuttujan klustereita, jotka kuvaavat (teoriassa) kielen kommunikatiivista funktiota. Multidimensionaalisessa analyysissä jokaiselle tekstille lasketaan pisteet ulottuvuuksien kielenpiirteiden taajuuksien mukaan. Faktorianalyysin tuloksien perusteella päädyin tutkimaan viittä faktoria. Nämä ulottuvuudet kuvaavat 4chanin sisäistä rekisterivariaatiota. Nämä ovat (1) abstrakti tiedon esittäminen (Abstract Presentation of Information), (2) yleinen epämuodollinen kerronta vs. kuvaileva diskurssi (General Informal Narrative vs. Descriptive Discourse), (3) lukijaan kohdistuva taivuttelu vs. informaatiosisältöinen diskurssi (Addressee Oriented Persuasion vs. Informational Discourse), (4) yksinkertaiset mielipiteet (Simple Statements of Opinion) ja (5) lukijaan kohdistuvat väittämät (Addressee Oriented Statements). Tutkielmani keskittyy vertailemaan tuloksia aikaisempiin tutkimuksiin, sillä 4chanin sisäisen variaation tutkiminen on vaikeampaa nykyisellä aineistolla. Aineiston keruu sivustolta on haastavaa, sillä sivusto ei arkistoi vanhoja viestejä. Tästä johtuen sivustolta on vaikeaa kerätä tasapuolisesti eri foorumeita kuvastavaa aineistoa lyhyessä ajassa. Tuloksien voidaan katsoa korreloivan jossain määrin Douglas Biberin universaalien ulottuvuuksien kanssa, mutta ne ovat myös uniikkeja verrattuna muihin tutkimuksiin. Tämän tutkimuksen tulosten voidaan katsoa kuvastavan yksityiskohtaisempia variaation ilmiöitä kuin tutkimusten, joissa aineisto koostuu eri rekistereistä kerätyistä teksteistä.
  • Liimatta, Aatu (2016)
    Internetin kielen tutkimus on lisääntynyt voimakkaasti viime vuosina, mutta internetgenret ovat silti edelleen laajalti tutkimattomia. Vaikka sosiaalisen median alustat kuten Twitter ja Facebook ovat saaneet jonkin verran huomiota, monet sivustot ja näkökulmat ovat vielä käymättä läpi. Tutkin pro gradussani Redditin sisäistä rekisterivaihtelua käyttämällä Douglas Biberin kehittämää multidimensionaalista menetelmää. Tavoitteenani on arvioida Biberin menetelmän soveltuvuutta Redditin rekisteritutkimuksen välineenä ja selvittää, millaisia rekisterivaihtelun ulottuvuuksia Redditissä on. Rekisterillä tarkoitetaan Biberin määritelmän mukaisesti tilanteen vaatimusten perusteella valittua kielen varieteettia. Tilanteen vaatimuksiin sisältyvät mm. tekstin tarkoitus, vuorovaikutteisuus, olosuhteet tai osanottajien välinen suhde. Douglas Biberin multidimensionaalinen menetelmä on määrällis-laadullinen tapa tutkia tekstikorpuksen sisällä tekstien välillä esiintyvää rekisterivaihtelua. Kustakin tekstistä lasketaan esiintymistaajuudet suurelle määrälle kielenpiirteitä. Tämän jälkeen tilastollisia menetelmiä (tarkemmin sanottuna faktorianalyysiä) käyttämällä löydetään piirteitä, joiden taajuudet kasvavat ja pienenevät yhdessä. Tällaisilla yhteen kuuluvilla piirteillä tulkitaan olevan yhteinen kommunikatiivinen funktio eli kommunikatiivinen syy, jonka vuoksi niillä on tapana esiintyä yhdessä, ja niiden määrässä havaittavien muutosten katsotaan ilmentävän tekstien erilaista sijoittumista piirreryhmien taustalla olevilla rekisteriulottuvuuksilla. Näin löydetyt rekisteriulottuvuudet nimetään lopuksi niiden kommunikatiivisten funktioiden mukaan. Reddit on pääasiassa englanninkielinen sosiaalisen median sivusto, joka koostuu tuhansista niin kutsutuista subredditeistä. Kuka tahansa voi perustaa uuden subredditin, joten Redditin subredditit käsittelevät kaikkia kuviteltavissa olevia aiheita ja teemoja eri näkökulmista. Käsittelen tutkimuksessani 37 subredditiä, joista keräsin itse kirjoittamallani tietokoneohjelmalla automaattisesti viestejä ja niiden kommentit yhden kuukauden aikana kesäkuussa 2015. Keräämäni aineisto sisältää 34 402 viestiä kommentteineen. Pääasiassa keskityin kuitenkin viesteihin, joiden kokonaissanamäärä oli 400 tai suurempi. Tällaisia viestejä aineistossani on 10 594 kappaletta, ja niiden yhteissanamäärä on lähes 17,5 miljoonaa sanaa. Tutkimukseni perusteella tutkimissani subredditeissä on kolme yleistä rekisteriulottuvuutta, joilla viestit liikkuvat: “henkilöfokus tai faktuaalinen fokus”, “informatiivinen tai osallistuva tyyli” ja “nykyhetken abstrakti tai menneen ajan narratiivinen fokus”. Näistä ainakin toinen ja kolmas ulottuvuus vastaavat hyvin Douglas Biberin myöhemmin esittämiä universaaleja rekisteriulottuvuuksia. Multidimensionaalinen menetelmä soveltuu Redditin (ja siten mahdollisesti muunkin sosiaalisen median) rekisteritutkimuksen välineeksi, mutta hienojakoisempi rekisterivaihtelun tarkastelu vaatinee menetelmän edelleen kehittelyä, sillä esimerkiksi yksittäisiä kommentteja tarkastellessa tekstin lyhyys tekee normalisoiduista taajuuksista nopeasti merkityksettömiä.