Browsing by Subject "4chan"

  • Vepsäläinen, Lassi (2018)
    4chan on täysin anonyymi kuvafoorumi, joka on herättänyt huomiota valtamediassa mm. poliittisesta epäkorrektiudestaan. Täysi anonymiteetti on internetissä harvinaista, ja psykologiassa ilmiön on todettu vaikuttavan ihmisiin eri tavoin. Sivuston pääkieli on englanti ja käyttäjäkunta on melko kansainvälinen. Kielenkäyttö sivustolla tuntuu eroavan muusta internetistä, ja vaikka sosiaalisen median suurimmat alustat (esim. Twitter, Facebook) ovat herättäneet tutkijoiden huomion, on täysin anonyymin kielen tutkimus jäänyt vähemmälle. Tutkimukseni pyrkii selvittämään, onko englannin kielen anonyymissä verkkorekisterissä eroa ei-anonyymiin verkkorekisteriin verrattuna. Tutkimusta voi pitää pilottitutkimuksena, sillä vastaavaa menetelmää ei ole aiemmin sovellettu täysin anonyymiin aineistoon. Tutkimusta varten koottiin 4chanin eri foorumeilta n. 8 miljoonaa sanaa käsittävä korpus. Korpukseen merkittiin 62 eri kielenpiirrettä MAT-tietokoneohjelmalla. Multidimensionaalinen analyysi on Douglas Biberin kehittämä menetelmä, jossa hyödynnetään faktorianalyysiä ja korpuksesta kerättyä tietoa sanojen esiintyvyystaajuuksista. Metodi on sekä määrällinen että laadullinen. Ensin teksteistä lasketaan eri kielenpiirteiden esiintymistaajuudet, jotka normalisoidaan. Faktorianalyysiä soveltamalla kielenpiirteiden varianssia voidaan kuvata paljon alkuperäistä pienemmällä joukolla. Faktorianalyysi perustuu olettamukseen, että muuttujajoukon varianssin taustalla on piileviä muuttujia, joita kutsutaan faktoreiksi. Kielenpiirteiden yhteisesiintyvyyden ja komplementaarisen esiintyvyyden taajuuksien tulkinnan jälkeen ulottuvuudet nimetään. Tarkemmin kuvailtuna faktorianalyysiin syötetään kussakin tekstissä esiintyvien kielenpiirteiden esiintymistaajuudet, minkä jälkeen faktorianalyysi tuottaa faktorirakenteita. Lopputuloksena saadaan noin 10-20 muuttujan klustereita, jotka kuvaavat (teoriassa) kielen kommunikatiivista funktiota. Multidimensionaalisessa analyysissä jokaiselle tekstille lasketaan pisteet ulottuvuuksien kielenpiirteiden taajuuksien mukaan. Faktorianalyysin tuloksien perusteella päädyin tutkimaan viittä faktoria. Nämä ulottuvuudet kuvaavat 4chanin sisäistä rekisterivariaatiota. Nämä ovat (1) abstrakti tiedon esittäminen (Abstract Presentation of Information), (2) yleinen epämuodollinen kerronta vs. kuvaileva diskurssi (General Informal Narrative vs. Descriptive Discourse), (3) lukijaan kohdistuva taivuttelu vs. informaatiosisältöinen diskurssi (Addressee Oriented Persuasion vs. Informational Discourse), (4) yksinkertaiset mielipiteet (Simple Statements of Opinion) ja (5) lukijaan kohdistuvat väittämät (Addressee Oriented Statements). Tutkielmani keskittyy vertailemaan tuloksia aikaisempiin tutkimuksiin, sillä 4chanin sisäisen variaation tutkiminen on vaikeampaa nykyisellä aineistolla. Aineiston keruu sivustolta on haastavaa, sillä sivusto ei arkistoi vanhoja viestejä. Tästä johtuen sivustolta on vaikeaa kerätä tasapuolisesti eri foorumeita kuvastavaa aineistoa lyhyessä ajassa. Tuloksien voidaan katsoa korreloivan jossain määrin Douglas Biberin universaalien ulottuvuuksien kanssa, mutta ne ovat myös uniikkeja verrattuna muihin tutkimuksiin. Tämän tutkimuksen tulosten voidaan katsoa kuvastavan yksityiskohtaisempia variaation ilmiöitä kuin tutkimusten, joissa aineisto koostuu eri rekistereistä kerätyistä teksteistä.
  • Kotajärvi, Miro (2024)
    This study combines corpus linguistic methods and discourse analysis to examine hate speech produced by transgender people targeting other transgender people. Open access online discussion forums have enabled communities to form around increasingly fringe and, at times, violent interests, thus making online hate speech difficult to define and detect. The aim of this study is to highlight these fringe forms of hate speech and how online genres influence the production of such language. The corpus data for this study consists of posts from the website 4chan and its imageboard /lgbt/. 4chan has been investigated extensively by other researchers of hate speech, because of its anonymous userbase and its associations with the alt-right, online political extremism and anti-LGBT attitudes. Thus, the imageboard /lgbt/, whose membership consists mostly of transgender people, proves a productive avenue of inquiry into in-group directed hate speech. To establish a statistically informed hierarchy of the transgender lexicon of /lgbt/, a list of terminology referring to transgender people was parsed out from the corpus data. The frequencies of these lemmas were compared and contrasted, after which the lemmas were subjected to more intimate, qualitative analysis to determine whether the language on /lgbt/ sufficiently resembles hate speech. The results suggest that, not only is violent language targeting transgender people frequent on /lgbt/, but that it is increasing over time. Furthermore, the corpus data reveals that, instead of general and neutral terminology, hostile genre-specific jargon targeting transgender people is increasingly preferred within the discourse community of /lgbt/, thus suggesting that in-group directed hate speech is a key communicative goal of /lgbt/.
