Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by Subject "luokittelu"

Sort by: Order: Results:

  • Poutanen, Julia (2018)
    Tämän tutkielman tarkoituksena on tutkia aikuisten ja nuorten kielenkäytön välisiä eroja ranskankielisessä tekstiviestiaineistossa. Eroja tutkitaan luomalla koneoppimista hyödyntävä automaattinen luokittelija, joka kykenee erottelemaan aikuisten ja nuorten tekstiviestit toisistaan. Työssä tarkastellaan luokittelijan antamia tuloksia ja pyritään selvittämään, miten luokittelijan toimintaa voidaan parantaa kielenkäytöstä saatujen tietojen valossa esimerkiksi tutkielmassa määritellyillä piirteillä (engl. feature). Teoriaosassa käsitellään tekstiviestikielen piirteiden lisäksi iän ja kielenkäytön välistä suhdetta sekä kieliteknologialle ja korpuslingvistiikalle tärkeitä käsitteitä. Menetelmänä käytetystä tilastollisesta luokittelijasta esitellään siihen liittyvä olennainen teoria sekä muita tutkielman kannalta tärkeitä käsitteitä. Tutkielman aineisto on kerätty Montpellier’ssä, Ranskassa vuonna 2011, ja se koostuu silloiseen tutkimukseen osallistuneiden lähettämistä tekstiviesteistä. Tekstiviestejä on yhteensä 88 000, ja niistä noin 70 000 käytetään tutkielmassa. Analyysissä keskitytään sekä kielellisiin että teknisiin piirteisiin: tarkastelun kohteina ovat täten sekä malli että aineiston kielelliset piirteet. Tutkimustuloksista selviää, että luokittelija toimii varsin hyvin tekstiviestien erottelussa, mutta tutkielmassa erikseen määritellyt piirteet eivät paranna merkittävästi luokittelijan toimintaa. Piirteistä voidaan kuitenkin tehdä joitakin johtopäätöksiä: tekstiviesteille on tyypillistä keskustelunomainen kielenkäyttö viestin lähettäjän ja vastaanottajan välillä sekä puhekieli. Analysoitujen viestien perusteella voidaan nähdä, että tekstiviestikielen ominaispiirteisiin kuuluvat ääntämistä ja foneettista muotoa heijastavat sanamuodot ja että tekstiviesti muodostanee oman rekisterinsä ranskan kielessä.
  • Poutanen, Julia (2018)
    Tämän tutkielman tarkoituksena on tutkia aikuisten ja nuorten kielenkäytön välisiä eroja ranskankielisessä tekstiviestiaineistossa. Eroja tutkitaan luomalla koneoppimista hyödyntävä automaattinen luokittelija, joka kykenee erottelemaan aikuisten ja nuorten tekstiviestit toisistaan. Työssä tarkastellaan luokittelijan antamia tuloksia ja pyritään selvittämään, miten luokittelijan toimintaa voidaan parantaa kielenkäytöstä saatujen tietojen valossa esimerkiksi tutkielmassa määritellyillä piirteillä (engl. feature). Teoriaosassa käsitellään tekstiviestikielen piirteiden lisäksi iän ja kielenkäytön välistä suhdetta sekä kieliteknologialle ja korpuslingvistiikalle tärkeitä käsitteitä. Menetelmänä käytetystä tilastollisesta luokittelijasta esitellään siihen liittyvä olennainen teoria sekä muita tutkielman kannalta tärkeitä käsitteitä. Tutkielman aineisto on kerätty Montpellier’ssä, Ranskassa vuonna 2011, ja se koostuu silloiseen tutkimukseen osallistuneiden lähettämistä tekstiviesteistä. Tekstiviestejä on yhteensä 88 000, ja niistä noin 70 000 käytetään tutkielmassa. Analyysissä keskitytään sekä kielellisiin että teknisiin piirteisiin: tarkastelun kohteina ovat täten sekä malli että aineiston kielelliset piirteet. Tutkimustuloksista selviää, että luokittelija toimii varsin hyvin tekstiviestien erottelussa, mutta tutkielmassa erikseen määritellyt piirteet eivät paranna merkittävästi luokittelijan toimintaa. Piirteistä voidaan kuitenkin tehdä joitakin johtopäätöksiä: tekstiviesteille on tyypillistä keskustelunomainen kielenkäyttö viestin lähettäjän ja vastaanottajan välillä sekä puhekieli. Analysoitujen viestien perusteella voidaan nähdä, että tekstiviestikielen ominaispiirteisiin kuuluvat ääntämistä ja foneettista muotoa heijastavat sanamuodot ja että tekstiviesti muodostanee oman rekisterinsä ranskan kielessä.
  • Kummunsalo, Sini (University of HelsinkiHelsingin yliopistoHelsingfors universitet, 2016)
    Bronkoskopia eli keuhkotähystys on yleistyvä menetelmä koirien alempien hengitysteiden sairauksien diagnosoinnissa. Menetelmän yleistyessä on kohdattu myös uusia haasteita, kuten keuhkotähystyslöydösten tulkinnanvaraisuus eri tähystäjästä riippuen sekä ongelmat tähystysmuutosten yksiselitteisessä kirjaamisessa. Kirjallisuuskatsauksessa perehdytään hengitystiesairauksien aiheuttamiin muutoksiin keuhkojen ilmateissä koirilla. Tämän perusteella tutkimusosiossa kehitetään neliportainen asteikko viiden eri tähystyksessä tavallisimmin havaitun muutoksen arvioimiseksi. Tässä tutkielmassa arvioidut tähystysmuutokset ovat: 1. limaisuus, 2. limakalvon epätasaisuus, 3. bronkomalasia, 4. bronkiektasia ja 5. hyperemia. Koeasetelmassa kokenut tähystäjä ja eläinlääketieteen kandidaatti arvioivat itsenäisesti tutkimuksessa esitetyn asteikon mukaisesti edellä mainitut viisi muuttujaa yhteensä 84 keuhkotähystyskuvasta, minkä jälkeen arvioiden yhteneväisyyttä verrataan. Jokaista muuttujaa arvioidaan itsenäisenä ja muista muuttujista riippumattomana. Tutkimuksessa käytetty tähystyskuvamateriaali on eläinlääkäri Minna Rajamäen 30 eri potilaastaan keräämää videokuvaa keuhkotähystyksistä Yliopistollisesta eläinsairaalasta vuosilta 2011-2014. Tutkimuksessa käytetyt 84 muutoskuvaa ovat kuvankaappauksia videomateriaalista. Koeasetelmalla pyritään alustavasti testaamaan tutkimuksessa esiteltyä pisteytysmenetelmää ja sen soveltuvuutta hyvin eritasoisten arvioijien tarpeisiin. Kahden arvioijan antamia pisteitä verrattiin kunkin muuttujan osalta ja laskettiin muuttujakohtainen korrelaatiokerroin Cohenin kappa-analyysillä. Kappa-analyysi osoitti arvioijien arvioiden korrelaation olevan välillä 42,2% - 64,8% muuttujasta riippuen. Tämä merkitsee kappa-analyysin mukaan kohtalaisia korrelaatioita, mutta kliinisissä käyttötarkoituksissa terveydenhuollon piirissä tavoitellaan yleensä yli 80% korrelaatiota, sillä joidenkin terveydenhuollossa käytettävien menetelmien kohdalla mahdollisen virheen seuraukset voivat olla potilasturvallisuuden kannalta vakavia. Korrelaatioita ei siis voida pitää vielä riittävinä, mutta pienillä koeasetelman parannuksilla, kuten arvioijien ouluttamisella arviointimenetelmän käyttöön voitaisiin päästä jo riittäviin tuloksiin. Tämä voisi mahdollistaa tutkimuksessa esitellyn luokittelumenetelmän laajemman käytön keuhkotähystysten arvioinnissa.
  • Kääriä, Petra (2012)
    Ihmisvaikutuksen myötä maailman luonnon monimuotoisuus vähenee kiihtyvällä tahdilla. Rajallisten suojeluresurssien vuoksi lajien uhanalaisuusaste on tärkeää määrittää, jotta suojelutoimet voidaan kohdistaa eniten suojelua tarvitseviin lajeihin. Lajien uhanalaisuuden määrittämiseen käytetään yhä enenevissä määrin kansainvälisen luonnonsuojeluliiton (IUCN) maailmanlaajuista uhanalaisuuden luokittelumenetelmää. Luokittelumenetelmä ei sellaisenaan huomioi lajien luokitteluun liittyvää epävarmuutta, mutta Bayes-menetelmien avulla epävarmuutta voidaan esittää ja tarkastella todennäköisyysmuodossa. Tämän tutkimuksen tarkoituksena oli kuvata IUCN:n uhanalaisuusluokittelumenetelmän logiikka ja luokittelukriteerit Bayes-verkkojen avulla ja tarkastella uhanalaisuusluokitteluun liittyvän epävarmuuden esittämistä ja sen vaikutuksia lajien luokitteluun. Bayes-verkot ovat matemaattisia, verkkokaavioiden avulla kuvattavia malleja, joiden avulla voidaan mallintaa epävarmaa tietoa todennäköisyysjakaumien avulla. Tutkimuksen myötä rakennettiin neljä erilaista eri laskentaperiaatteisiin perustuvaa IUCN:n luokittelumenetelmää kuvaavaa todennäköisyysmallia. Mallien toimivuutta tarkasteltiin haastattelemalla Suomen vuoden 2010 uhanalaisuusarvioinnissa mukana olleita eri lajityöryhmien edustajia. Asiantuntijahaastattelujen tarkoituksena oli mm. tarkastella uhanalaisiin lajeihin liittyvän epävarmuuden esittämistä mallien avulla todellisen uhanalaisuusaineiston ja asiantuntijatiedon avulla ja vertailla haastatteluissa saatavia luokittelutuloksia vuoden 2010 arvioinnin tuloksiin. Tutkimuksessa havaittiin, että uhanalaisuusluokitteluun liittyvän epävarmuuden ilmaiseminen on tärkeää ja vaikuttaa luokittelutuloksiin. Keskeinen havainto oli, että kun uhanalaisuusluokitteluun liittyvää epävarmuutta oli mahdollista ilmaista todennäköisyysmallien avulla, luokiteltavien lajien uhanalaisuusluokka muuttui useissa tapauksissa. Kaikissa näissä tapauksissa muutos oli luokan nouseminen aiempaa uhanalaisemmaksi. Epävarmuuden ilmaisemisen tärkeyttä korostavat myös asiantuntijahaastattelujen tulokset, joiden mukaan suurin osa lajien luokitteluun liittyvästä tiedosta on jollakin tasolla epävarmaa. Tutkimuksessa ilmeni, että Bayes-verkkojen käyttö uhanalaisuusluokittelussa epävarman tiedon tarkastelussa on hyödyllistä, sillä malleja käytettäessä uhanalaisuuden luokittelukriteereihin liittyvä epävarmuuden aste välittyy selvästi todennäköisyysmuodossa ja luokittelukriteerien keskinäisten vaikutussuhteiden hahmottaminen on selkeää. Lisäksi luokittelua kuvaavien graafisten mallien tarkastelu auttaa hahmottamaan ja ymmärtämään kriteerien avulla tapahtuvaa luokittelukäytäntöä. Uhanalaisuusmallien käyttö lisää myös luokittelun järjestelmällisyyttä ja selkeyttää ja yhdenmukaistaa käytännön luokittelutyötä, esim. luokitteluehtojen toteutuminen voidaan aiempaa paremmin varmistaa mallien avulla. Bayes-verkkojen käyttäminen uhanalaisuusluokittelussa on hyödyllistä myös siksi, että menetelmän käyttö saattaa mahdollistaa uusien lajien tarkastelun ja arvioimisen. Haastatteluihin osallistuneiden asiantuntijoiden suhtautuminen todennäköisyysmallinnukseen oli positiivista, joten menetelmää olisi hyödyllistä soveltaa ja kehittää edelleen niin, että sitä voitaisiin jatkossa hyödyntää epävarman tiedon tarkastelussa käytännön luokittelutyössä.
  • Nykänen, Hanne-Maaria (2018)
    The goal of the thesis was to examine 1) whether the special education teachers’ and other teachers’ educational stances show mutual differences in the areas of classification or categorization, and 2) which kind of imaginal characteristics is it possible to build by using teachers’ stances. In the theoretical framework classification or categorization was spread into more specific themes which were automatic thinking, medicalization, separate special education, labeling, social disability studies and social constructionist language. The sense of the thesis was explorative, considering that the concepts of classification or categorization haven’t been exactly framed in special educational studies. According to previous research it seems that there exist mutual differences when comparing special educators’ and other educators’ attitudes concerning the educational system overall. The data was collected in the areas of Helsinki and Turku cities by using an E-questionnaire. Along with the background information the questionnaire included 48 educational claims which were estimated by a Likert scale from 0 to 5. There were altogether N=119 answers gathered from class teachers, special education teachers, kindergarten teachers and special kindergarten teachers. Summaries were counted and explored through frequency analysis in the four occupational groups. Mann-Whitney’s U-test was proceeded to answer to the first task of the research. The test’s purpose was to examine the differences of summary medians formed by special education teachers’ and other teachers’ answers. Explorative factor analysis was completed to answer to the second task, to find out which kind of characteristics the correlations between the teachers’ answers would reveal. According to the Mann-Whitney’s U-test there was discovered that the educational attitudes of special education teachers were more categorizational around theme of medicalization, both in the direct claims (p=.049, r=.19) and the opposite claims (p=.005, r=.30). Also it appeared that the special education teachers’ educational attitudes were more categorizational (p=.057, r=.18) than the other teachers’ attitudes when supporting the separate special education system. Nevertheless the latest mentioned result wasn’t found to be statistically significant. The explorative factor analysis revealed four characteristics, 1) the one being aware of language and against labeling, 2) the one being an aware thinker who demands social equality, 3) the one supporting medicalization and seeing speciality being absolute, and 4) the character positioning against medical culture and individualism.
  • Nykänen, Hanne-Maaria (2018)
    The goal of the thesis was to examine 1) whether the special education teachers' and other teachers' educational stances show mutual differences in the areas of classification or categorization, and 2) which kind of imaginal characteristics is it possible to build by using teachers' stances. In the theoretical framework classification or categorization was spread into more specific themes which were automatic thinking, medicalization, separate special education, labeling, social disability studies and social constructionist language. The sense of the thesis was explorative, considering that the concepts of classification or categorization haven't been exactly framed in special educational studies. According to previous research it seems that there exist mutual differences when comparing special educators' and other educators' attitudes concerning the educational system overall. The data was collected in the areas of Helsinki and Turku cities by using an E-questionnaire. Along with the background information the questionnaire included 48 educational claims which were estimated by a Likert scale from 0 to 5. There were altogether N=119 answers gathered from class teachers, special education teachers, kindergarten teachers and special kindergarten teachers. Summaries were counted and explored through frequency analysis in the four occupational groups. Mann-Whitney's U-test was proceeded to answer to the first task of the research. The test's purpose was to examine the differences of summary medians formed by special education teachers' and other teachers' answers. Explorative factor analysis was completed to answer to the second task, to find out which kind of characteristics the correlations between the teachers' answers would reveal. According to the Mann-Whitney's U-test there was discovered that the educational attitudes of special education teachers were more categorizational around theme of medicalization, both in the direct claims (p=.049, r=.19) and the opposite claims (p=.005, r=.30). Also it appeared that the special education teachers' educational attitudes were more categorizational (p=.057, r=.18) than the other teachers' attitudes when supporting the separate special education system. Nevertheless the latest mentioned result wasn't found to be statistically significant. The explorative factor analysis revealed four characteristics, 1) the one being aware of language and against labeling, 2) the one being an aware thinker who demands social equality, 3) the one supporting medicalization and seeing speciality being absolute, and 4) the character positioning against medical culture and individualism.
  • Kukkonen, Aleksi (2018)
    Objective. The topic of this study is classification in psychology and the aim is to introduce, why classification is important in psychology, what classification is used for in psychology and how classification is done in psychology. In addition the study introduces attributes and assumptions of the most common statistical methods used in psychology. The aim was to create a coherent totality, which can be used when either choosing a method for study or evaluating methods of previous studies. The study also describes common challenges regarding classification and ways to evaluate classification solutions. The statistical methods focus on unsupervised learning methods, which are used when the structure and number of classes are unknown. Hierarchical, centroid-based and distribution based clustering are introduced alongside with latent class analysis. For supervised learning methods, neural networks, Bayesian methods and decision trees are considered. Methods. Since this study is based on statistics, most of the literature used is considering statistical methods. In addition, studies of psychology which use methods relevant for this study are used as reference. Results. Classification in psychology is important in measuring, communicating about and understanding phenomena. It has made diagnostics, recognizing risk groups and specifying attributes and features possible. Classification has also challenges. Psychological phenomena can be heterogenetic, unstable and used parameters do not necessarily measure intended phenomenon. Classification methods are numerous and every method has its own attributes, weaknesses and strengths. And every solution is only a data dependent model. Statistical methods are in totality useful tools in psychological studies and literature. Understanding of these statistical methods enables producing accurate models and also evaluating them.
  • Kronstedt, Johanna (2013)
    Tidigare forskning utförd av feministiska våldsforskare har påstått att media kategoriserar kriminella kvinnor som antingen 'galna' eller 'onda'. Hur media kategoriserar dessa kvinnor anses bero på hur traditionellt kvinnligt hon beter sig. För att forska om detta fenomen användes könsroller och stereotypier som förklaringsmodeller. Därtill granskades kvinnors våld och brott i Finland. Socialpsykologiska teorier om ambivalent sexism och direkt och indirekt aggression samt teorin om den misshandlade kvinnans syndrom tillämpades för att utreda orsakerna bakom den påstådda tudelningen. För att undersöka om samma dikotoma indelning skedde i finländsk media användes kvalitativ innehållsanalys som metod för att analysera fyra fall av finländska, kvinnliga mördare och dråpare. Det undersöktes även om kvinnornas femininitet hade påverkat indelningen. Kvinnorna vars fall analyserades var Sanna Sillanpää, Virpi Butt, Katariina Pantila och Aino Nykopp- Koski. Fallen begränsades till kvinnor vars offer varit i huvudsak för dem obekanta. Materialet bestod av alla artiklar om dessa fyra kvinnor från två rikstidningar: Helsingin Sanomat och Hufvudstadsbladet. 188 artiklar analyserades och kodades. Det var även av intresse att se om presentationerna av de fyra kvinnorna var annorlunda i de två tidningarna. Kodningens resultat visar att det gick att finna en finkänslig indelning av kvinnorna som antingen 'galna' eller 'onda'. Det gick inte att finna att denna indelning skulle ha något samband med hur feminint eller maskulint kvinnorna beskrevs. Detta kan bero på Finlands långa historia av jämställdhet mellan könen. Tidningarnas presentationer av kvinnorna skilde sig från varandra i det avseendet att Hufvudstadsbladets beskrivning av fallen var mer personinriktad och sensationssökande medan Helsingin Sanomat skrev mer objektivt om fallen. Indelningen av kriminella kvinnor i media som antingen 'galna' eller 'onda' visade sig vara alltför simpel för att kunna tillämpas i finländska rikstidningar. Tidigare forsknings kritik av medias orättvisa behandling av kvinnor tog inte i beaktande sannolikheten att även kriminella män kategoriseras i media. Resultaten av denna forskning pekar på att indelningen inte är könsrelaterad. Även finländska kvinnors androgyna drag kan vara en orsak till att beskrivningarna av fallen och förövarna var könsneutrala.
  • Láng, Ilona (2017)
    Matalapainemyrskyt muodostavat Suomessa suurimman yksittäisen uhan sähkönjakeluverkon vakaudelle. Vuosina 2005-2015 kolmannes kaikista sähkönjakelun keskeytyksistä aiheutui matalapainemyrskyjen voimakkaista tuulista. Sääsuureiden yhdistäminen yhteiskunnallisesti vaikuttaviin suureisiin, kuten sähkövikoihin on ollut eri maiden ilmatieteen laitoksien tutkimuskohteena nouseva suuntaus kautta Euroopan. Tässä tutkielmassa luokitellaan matalapaineiden aiheuttamat myrskyt saapumissuunnan mukaan ja tutkitaan niiden vaikutuksia sähköverkkoihin. Matalapainemyrskyjen luokitteleminen Suomessa on verrattain uusi aihe. Myrskyt luokitellaan tässä työssä kaksivaiheisella menetelmällä saapumissuunnan ja pintamatalan rantautumisen mukaan, sekä selvitetään ominaisuuksia, jotka tekevät niistä tuhoisia sähköverkoille. Myrskyt luokiteltiin kuuteen luokkaan tarkastelemalla menneiden myrskyjen myrskyratoja vuosilta 2005-2015. Aineistoon valikoitui yhteensä 51 myrskyä, joita tutkittiin käyttämällä Ilmatieteen laitoksen tietokannan havaintoja, ERA-Interim uusanalyysejä sekä sähköyhtiöiden sähkövika-aineistoa. Myrskyluokat saivat nimekseen A-SW (maan eteläosaan lounaasta saapuvat), A-SE (maan eteläosaan kaakosta saapuvat), A-NW (maan eteläosaan luoteesta saapuvat), B-SW (maan pohjoisosaan lounaasta saapuvat), B-NW (maan pohjoisosaan luoteesta saapuvat) ja B-NE (maan pohjoisosaan koillisesta saapuvat). Aineiston myrskytapausten perusteella havaittiin, että suurin osa eli noin 60 prosenttia tarkastelujakson myrskyistä saapuu Suomeen lounaasta, mikä tukee hyvin aiempia tutkimustuloksia. Tutkielmassa on pyritty myös löytämään yhteys myrskyjen ja sähkövikatilanteiden välille yhdistämällä meteorologista dataa sähköverkkoyhtiöiltä (Loiste Sähköverkko Oy ja ENEASE Oy) saatuihin vikatietoihin. Myrskyluokille tyypilliset puuskatuulijakaumat on yhdistetty alueellisiin sähköttömien talouksien lukumääriin eli käyttöpaikkojen lukumääriin (kpk). Työssä tutkittiin eri myrskyluokkien ominaispiirteiden vaikutuksia sähköverkkoihin ja määritettiin maantieteellisten alueiden mukaan jakautuvat viat kussakin luokassa. Myrskyluokista tuhoisimpina esille nousivat luokat B-NW-, sekä A-SE-myrskyt. Nämä myrskyluokat ovat eri syistä tuhoisat. B-NW- myrskyistä tuhoisan tekee todennäköisesti niiden nopea kehityskaari, sekä voimakkaan matalapaineen keskuksen aiheuttamat ärhäkät puuskat. A-SE-myrskyt puolestaan ovat hidasliikkeisiä, jolloin puuskien vaikutukset tietyllä alueella kumuloituvat. Kaakosta saapuvia (A-SE) myrskyjä voisi kutsua myös kesämyrskyiksi niiden tyypillisen esiintymisajankohdan mukaan. Tutkielman lopputuloksena saatiin määritettyä yksinkertainen kaava, joka sai nimekseen yhteisvaikutusindeksi. Yhteisvaikutusindeksin avulla pystytään ennen kaikkea havainnollistamaan niin eri voimakkuuksisten puuskatuulien, kuin muidenkin tuhoihin vaikuttavien tekijöiden yhteisvaikutusta. Lopuksi esimerkkitapauksena käsitellään sähköyhtiöiden kannalta merkittävää Valio-myrskyä (2015), joka oli tyypiltään B-NW. Aikaisempiin tutkimuksiin verrattuna tässä työssä uutta oli myrskyjen luokittelu, sekä meteorologisten ja ei-meteorologisten tekijöiden yhdistäminen yhteisvaikutusindeksin laskukaavaksi. Yhteisvaikutusindeksiä voidaan tulevaisuudessa käyttää joko tukena operatiivisten sääennusteiden laadinnassa myrskyjen vaikuttavuutta arvioitaessa tai pohjana algoritmille. Työ sai alkunsa Ilmatieteen laitoksen ELASTINEN- tutkimushankkeesta, jossa selvitettiin sää- ja ilmastoriskien hallintaa ja otettiin ensiaskelia kohti vaikutusvaroittamista Suomessa. Tutkielma liittyy myös Tekes/SASSE- ja H2020/ANYWHERE- hankkeisiin, joissa pyritään selvittämään sääilmiöiden yhteiskunnallista vaikuttavuutta. Tutkielman tuloksia voidaan hyödyntää jatkossa muissakin hankkeissa, joissa selvitetään sähkönjakelun kannalta merkittäviä sääilmiöitä. Aiheen tutkimisesta on apua myös operatiivisessa sääennusteen laatimisessa ja arvioitaessa lähestyvän myrskyn vaikutuksia.