Browsing by Subject "klusterointi"
Now showing items 1-9 of 9
-
(2024)Eläinsanasujuvuustehtävää käytetään yleisesti kliinisissä neuropsykologisissa ja puhetera-peuttisissa tutkimuksissa lasten kielellisten ja toiminnanohjauksen taitojen arviointiin. Tehtä-vässä mitataan yleensä hyväksytysti tuotettujen sanojen ja virheiden määrää. Käytetyistä kognitiivisista prosesseista saadaan kuitenkin enemmän tietoa, kun tarkastellaan myös sa-nanhakustrategioiden käyttöä eli sitä, miten lapset kykenevät muodostamaan peräkkäin tuotet-tujen samaan semanttiseen alakategoriaan kuuluvien tai äänteellisesti samankaltaisten sano-jen klustereita ja vaihtamaan tehokkaasti alakategoriasta toiseen. Aiemmissa tutkimuksissa yksikielisten lasten klusterointi- ja vaihtoprosesseista semanttisessa sanasujuvuustehtävässä on saatu ristiriitaisia tuloksia, ja monikielisten lasten sananhakustrategioiden käytöstä on saa-tavilla vain vähän tutkimustietoa. Tämän tutkimuksen tavoitteena oli tutkia sananhakustrategi-oiden käytön suhdetta tuotettujen sanojen kokonaissanamäärään sekä selvittää mahdollisia eroja yksi- ja monikielisten lasten sananhakustrategioiden ja alakategorioiden käytössä eläin-sanasujuvuustehtävässä. Lisäksi tutkittiin, oliko tutkittavien sukupuolella yhteyttä suorituksiin. Tutkittavana oli 26 monikielistä ja 28 yksikielistä 6–8-vuotiasta lasta, jotka olivat suorittaneet eläinsanasujuvuustehtävän osana laajempaa kielellisten taitojen arviointia. Tehtävässä lapsia pyydettiin tuottamaan mahdollisimman monta eläinsanaa yhden minuutin aikana. Kunkin tutkit-tavan tuottamasta sanalistasta laskettiin kokonaissanamäärän lisäksi klustereiden keskimää-räinen koko, klustereiden ja vaihtojen absoluuttinen ja kokonaistuotokseen suhteutettu määrä sekä alakategorioiden määrä. Lisäksi alakategorioita tarkasteltiin laadullisesti. Monikieliset lapset tuottivat tehtävässä huomattavasti vähemmän sanoja ja käyttivät vähem-män erilaisia alakategorioita kuin yksikieliset lapset. Ryhmien välillä ei ollut eroa semanttisten klustereiden keskimääräisessä koossa, mutta monikieliset lapset tuottivat semanttisia kluste-reita selvästi yksikielisiä lapsia vähemmän. Kokonaistuotokseen suhteutettuna vaihtojen mää-rässä ei ryhmien välillä ollut eroa. Molemmissa ryhmissä klustereiden ja vaihtojen määrä kor-reloi positiivisesti kokonaissanamäärän kanssa, mutta klustereiden koolla ei ollut yhteyttä ko-konaissanamäärään. Näin ollen monikielisten lasten yksikielisiä heikompi kokonaissuoritus näyttää liittyvän tuotettujen semanttisten klustereiden vähäisyyteen ja siihen, että heillä on käytössään vähemmän alakategorioita kuin yksikielisillä lapsilla. Sukupuolen ja tehtävässä suoriutumisen välillä ei havaittu merkittävää yhteyttä.
-
(2024)Eläinsanasujuvuustehtävää käytetään yleisesti kliinisissä neuropsykologisissa ja puhetera-peuttisissa tutkimuksissa lasten kielellisten ja toiminnanohjauksen taitojen arviointiin. Tehtä-vässä mitataan yleensä hyväksytysti tuotettujen sanojen ja virheiden määrää. Käytetyistä kognitiivisista prosesseista saadaan kuitenkin enemmän tietoa, kun tarkastellaan myös sa-nanhakustrategioiden käyttöä eli sitä, miten lapset kykenevät muodostamaan peräkkäin tuotet-tujen samaan semanttiseen alakategoriaan kuuluvien tai äänteellisesti samankaltaisten sano-jen klustereita ja vaihtamaan tehokkaasti alakategoriasta toiseen. Aiemmissa tutkimuksissa yksikielisten lasten klusterointi- ja vaihtoprosesseista semanttisessa sanasujuvuustehtävässä on saatu ristiriitaisia tuloksia, ja monikielisten lasten sananhakustrategioiden käytöstä on saa-tavilla vain vähän tutkimustietoa. Tämän tutkimuksen tavoitteena oli tutkia sananhakustrategi-oiden käytön suhdetta tuotettujen sanojen kokonaissanamäärään sekä selvittää mahdollisia eroja yksi- ja monikielisten lasten sananhakustrategioiden ja alakategorioiden käytössä eläin-sanasujuvuustehtävässä. Lisäksi tutkittiin, oliko tutkittavien sukupuolella yhteyttä suorituksiin. Tutkittavana oli 26 monikielistä ja 28 yksikielistä 6–8-vuotiasta lasta, jotka olivat suorittaneet eläinsanasujuvuustehtävän osana laajempaa kielellisten taitojen arviointia. Tehtävässä lapsia pyydettiin tuottamaan mahdollisimman monta eläinsanaa yhden minuutin aikana. Kunkin tutkit-tavan tuottamasta sanalistasta laskettiin kokonaissanamäärän lisäksi klustereiden keskimää-räinen koko, klustereiden ja vaihtojen absoluuttinen ja kokonaistuotokseen suhteutettu määrä sekä alakategorioiden määrä. Lisäksi alakategorioita tarkasteltiin laadullisesti. Monikieliset lapset tuottivat tehtävässä huomattavasti vähemmän sanoja ja käyttivät vähem-män erilaisia alakategorioita kuin yksikieliset lapset. Ryhmien välillä ei ollut eroa semanttisten klustereiden keskimääräisessä koossa, mutta monikieliset lapset tuottivat semanttisia kluste-reita selvästi yksikielisiä lapsia vähemmän. Kokonaistuotokseen suhteutettuna vaihtojen mää-rässä ei ryhmien välillä ollut eroa. Molemmissa ryhmissä klustereiden ja vaihtojen määrä kor-reloi positiivisesti kokonaissanamäärän kanssa, mutta klustereiden koolla ei ollut yhteyttä ko-konaissanamäärään. Näin ollen monikielisten lasten yksikielisiä heikompi kokonaissuoritus näyttää liittyvän tuotettujen semanttisten klustereiden vähäisyyteen ja siihen, että heillä on käytössään vähemmän alakategorioita kuin yksikielisillä lapsilla. Sukupuolen ja tehtävässä suoriutumisen välillä ei havaittu merkittävää yhteyttä.
-
(2022)Aims of the study. This study seeks to find out what kind of situations students typically face during their progress through university studies and what kind of different pathways can be identified as a series of these situations. The aim was to map out and to develop a clustering-based method of identifying these situations and pathways from student transcript data that would complement the information provided by commonly used measures of student progression. Methods. The research strategy of this study follows that of design research, where methods and new knowledge is built iteratively. The data consists of student transcript data of 3167 students at the University of Helsinki who had started their studies in computer science, mathematics, or general and adult education between the years 2010 and 2015. The data was provided by the Agile Education Research group at the University of Helsinki and contained all records of passed or failed completion attempts that had been recorded by 11.3.2020. The data was shaped to coarser level to be used in cluster analysis and clustered using k-medians clustering. Results and conclusions. The results show that it is possible to use clustering as a tool to better understand student transcript data and the pathways students take through their university degrees. The shown clustering makes it possible to describe the progression of studies both on the individual and group levels. Three clusters defining the starting situations and 22 clusters defining the situations during studies were identified. Transitions between clusters show that series of clusters for several pathways that have different stages and outcomes. In conclusion, the results show that student transcript data contains information which universities could use in efforts aimed at helping students advance in their studies
-
(2022)Aims of the study. This study seeks to find out what kind of situations students typically face during their progress through university studies and what kind of different pathways can be identified as a series of these situations. The aim was to map out and to develop a clustering-based method of identifying these situations and pathways from student transcript data that would complement the information provided by commonly used measures of student progression. Methods. The research strategy of this study follows that of design research, where methods and new knowledge is built iteratively. The data consists of student transcript data of 3167 students at the University of Helsinki who had started their studies in computer science, mathematics, or general and adult education between the years 2010 and 2015. The data was provided by the Agile Education Research group at the University of Helsinki and contained all records of passed or failed completion attempts that had been recorded by 11.3.2020. The data was shaped to coarser level to be used in cluster analysis and clustered using k-medians clustering. Results and conclusions. The results show that it is possible to use clustering as a tool to better understand student transcript data and the pathways students take through their university degrees. The shown clustering makes it possible to describe the progression of studies both on the individual and group levels. Three clusters defining the starting situations and 22 clusters defining the situations during studies were identified. Transitions between clusters show that series of clusters for several pathways that have different stages and outcomes. In conclusion, the results show that student transcript data contains information which universities could use in efforts aimed at helping students advance in their studies
-
(2017)Tässä pro gradu -tutkielmassa selvitetään laskennallista musiikkianalyysia hyödyntäen, millä tavoin japanilaisen bambuhuilun shakuhachin dynamiikan ja soinnin käsittely ilmenee honkyoku-musiikissa. Shakuhachia soitetaan tyypillisesti soolona tai pienissä yhtyeissä. Honkyoku viittaa yhdellä – tai muutamissa harvoissa tapauksissa kahdella – shakuhachilla soitettavaan musiikkiin, jonka alkuperä on 1600–1800-luvuilla zenbuddhalaisen tradition piirissä soitetuissa kappaleissa. Aineisto koostuu 111 kappaleesta 21 levyltä japanilaisten shakuhachin soittajien esittämänä. Materiaali jaetaan hengityksen mittaisiin osiin eli niin sanottuihin äänisoluihin. Äänisoluista laaditaan aaltomuotokuvaajan perusteella dynamiikkaa kuvaavia verhokäyriä ja spektrin perusteella sointia kuvaavia taajuussisällön muutosta merkitseviä käyriä eli deskriptoreita. Verhokäyrät ja deskriptorit kategorisoidaan klusterointimenetelmillä. Kategorisoinnilla on kaksi tavoitetta: 1) korpuksen deskriptiivinen tulkinta sekä 2) eri soittajien tyylien vertaileminen. Pääasiallisina tutkimustyökaluina hyödynnetään MATLAB-laskentaohjelmointiympäristössä käytettäviä MIRtoolbox- ja Statistics and Machine Learning Toolbox -työkalupaketteja. Korrelaatioetäisyysmittaan perustuvalla kokoavalla hierarkkisella klusteroinnilla pystyttiin tarkoituksenmukaisesti selittämään noin 32 prosenttia aineistosta dynamiikan osalta. Analyysin perusteella honkyoku-musiikin dynamiikka koostuu ainakin neljästä kategoriasta: 1) nopea voimakas aluke, joka vaimenee vähitellen, 2) nopeahko, voimakas aluke, jota seuraa vastaavanlainen vaimeneminen sekä pitkä häntä lopussa, 3) selvä erillinen aluke, jonka jälkeen signaali vaimenee hetkeksi ennen etenemistä korkeimpaan huippuun ja loppuun vielä asteittainen vaimeneminen ja 4) asteittainen voimistuminen korkeimpaan huippuun ja vastaavanlainen vaimeneminen. Soittajien tyylien vertaileminen ei ollut mielekästä, koska analyysista syntyneet kategoriat eivät selittäneet kaikkien muusikoiden tyyliä riittävän kattavasti. Kehitellyt työkalut ovat todennäköisesti sovellettavissa jatkotutkimuksissa. Soinnin analysoiminen jäi tässä tutkimuksessa työkalujen testauksen tasolle. Tuloksien perusteella äänisolu ei ole sopiva rakenneosa soinnin analysoimiseen. Soinnin kuvaajiksi kaavaillut ominaisuudet niin sisällön kuin teknisten seikkojen suhteen kuvasivat lopulta liian monitulkintaisesti asioita.
-
(2017)Tässä pro gradu -tutkielmassa selvitetään laskennallista musiikkianalyysia hyödyntäen, millä tavoin japanilaisen bambuhuilun shakuhachin dynamiikan ja soinnin käsittely ilmenee honkyoku-musiikissa. Shakuhachia soitetaan tyypillisesti soolona tai pienissä yhtyeissä. Honkyoku viittaa yhdellä – tai muutamissa harvoissa tapauksissa kahdella – shakuhachilla soitettavaan musiikkiin, jonka alkuperä on 1600–1800-luvuilla zenbuddhalaisen tradition piirissä soitetuissa kappaleissa. Aineisto koostuu 111 kappaleesta 21 levyltä japanilaisten shakuhachin soittajien esittämänä. Materiaali jaetaan hengityksen mittaisiin osiin eli niin sanottuihin äänisoluihin. Äänisoluista laaditaan aaltomuotokuvaajan perusteella dynamiikkaa kuvaavia verhokäyriä ja spektrin perusteella sointia kuvaavia taajuussisällön muutosta merkitseviä käyriä eli deskriptoreita. Verhokäyrät ja deskriptorit kategorisoidaan klusterointimenetelmillä. Kategorisoinnilla on kaksi tavoitetta: 1) korpuksen deskriptiivinen tulkinta sekä 2) eri soittajien tyylien vertaileminen. Pääasiallisina tutkimustyökaluina hyödynnetään MATLAB-laskentaohjelmointiympäristössä käytettäviä MIRtoolbox- ja Statistics and Machine Learning Toolbox -työkalupaketteja. Korrelaatioetäisyysmittaan perustuvalla kokoavalla hierarkkisella klusteroinnilla pystyttiin tarkoituksenmukaisesti selittämään noin 32 prosenttia aineistosta dynamiikan osalta. Analyysin perusteella honkyoku-musiikin dynamiikka koostuu ainakin neljästä kategoriasta: 1) nopea voimakas aluke, joka vaimenee vähitellen, 2) nopeahko, voimakas aluke, jota seuraa vastaavanlainen vaimeneminen sekä pitkä häntä lopussa, 3) selvä erillinen aluke, jonka jälkeen signaali vaimenee hetkeksi ennen etenemistä korkeimpaan huippuun ja loppuun vielä asteittainen vaimeneminen ja 4) asteittainen voimistuminen korkeimpaan huippuun ja vastaavanlainen vaimeneminen. Soittajien tyylien vertaileminen ei ollut mielekästä, koska analyysista syntyneet kategoriat eivät selittäneet kaikkien muusikoiden tyyliä riittävän kattavasti. Kehitellyt työkalut ovat todennäköisesti sovellettavissa jatkotutkimuksissa. Soinnin analysoiminen jäi tässä tutkimuksessa työkalujen testauksen tasolle. Tuloksien perusteella äänisolu ei ole sopiva rakenneosa soinnin analysoimiseen. Soinnin kuvaajiksi kaavaillut ominaisuudet niin sisällön kuin teknisten seikkojen suhteen kuvasivat lopulta liian monitulkintaisesti asioita.
-
(2020)Semanttista sanasujuvuustehtävää on usein käytetty osana lasten sanaston kehityksen arviointia. Tehtävällä arvioidaan kykyä tuottaa tiettyyn kategoriaan kuuluvia sanoja rajoitetussa ajassa. Aikaisemmissa tutkimuksissa semanttisen sanasujuvuuden on havaittu kehittyvän lapsen kasvaessa. Lisäksi sanasujuvuustehtävissä käytettyjen sanahakustrategioiden on havaittu tehostavan sanojen mieleenpalauttamista kouluikäisillä lapsilla ja aikuisilla. Alle kouluikäisten lasten semanttisessa sanasujuvuustehtävässä käyttämiä sanahakustrategioita on kuitenkin tutkittu varsin vähän ja toistaiseksi alle 4-vuotiaiden kohdalla tutkimusta ei ole tehty lainkaan. Tämän tutkimuksen tarkoituksena oli selvittää, eroaako suoriutuminen semanttisissa sanasujuvuustehtävissä 2–5-vuotiaiden lasten välillä ja ovatko lapsen sukupuoli sekä vanhempien sosioekonominen tausta yhteydessä lasten suoriutumiseen tehtävissä. Lisäksi tarkasteltiin, käyttävätkö lapset sanahakustrategioita tehtävien suorittamisessa ja jos käyttävät, onko niillä yhteys hyväksyttyjen sanojen määrään. Tutkimukseen osallistui 79 lasta. Lapset tekivät kaksi vanhempiensa ohjaamaa sanasujuvuustehtävää verkkokyselyn yhteydessä. Tehtävien aikana tuli luetella eläinkategoriaan ja vaatekategoriaan kuuluvia sanoja yhden minuutin ajan. Tehtävistä tarkasteltiin hyväksyttyjen sanojen määrää, virheiden määrää ja virhetyyppejä. Sanahakustrategioita tutkittiin tarkastelemalla klustereita, semanttisia alakategorioita ja alakategorioiden välisiä vaihtoja. Tulokset osoittivat iällä olevan vahva yhteys lasten sanasujuvuussuoriutumiseen hyväksyttyjen sanojen, klustereiden, semanttisten alakategorioiden sekä vaihtojen määrällä mitattuna. Uusi tulos oli se, että jo 2-vuotiaat kykenivät tuottamaan sanasujuvuustehtävään hyväksyttyjä sanoja ja hyödyntämään tehtävässä sanahakustrategioita. Sukupuoli ja vanhempien sosioekonominen tausta eivät olleet yhteydessä tehtäväsuoriutumiseen. Klustereiden, semanttisten alakategorioiden ja vaihtojen määrä oli positiivisesti yhteydessä hyväksyttyjen sanojen määrään, minkä perusteella näyttäisi siltä, että onnistunut sanahaku sanasujuvuustehtävässä edellyttää sanahakustrategioiden käyttöä myös alle kouluikäisillä lapsilla. Aikaisemman tutkimustiedon puutteen vuoksi lisätutkimus on kuitenkin tarpeen lasten varhaisten sanahakustrategioiden suhteen. Tämä tutkimus on ensimmäinen, jossa lasten sanasujuvuustehtävän ovat ohjanneet vanhemmat. Käytännön puheterapiatyön ja tulevaisuuden tutkimuksien kannalta hyödyllinen tieto on, että tällainen tutkimusasetelma näyttäisi soveltuvan lasten sanasujuvuuden arviointiin.
-
(2020)Semantic fluency task is often used as part of an assesment to investigate children’s lexical development. Semantic fluency task measures the ability to generate words within a certain category and within a restricted amount of time. In previous studies, children’s semantic fluency skills have increased as the child grows. In addition, word retrieval strategies have been found to enhance word recall in the semantic fluency task with school-aged children and adults. However, there is only little knowledge regarding the use of word retrieval strategies in the semantic fluency task with preschool aged children. So far, in previous studies word retrieval strategies in the task have not been investigated with children under the age of 4. The aim of this study was to examine whether there are differences in 2 to 5 year old children’s performance in the semantic fluency task and whether children’s gender or their parent’s socioeconomic status had an impact on their performance. In addition, the children’s ability of using word retrieval strategies were explored and the relation between the use of word retrieval strategies and the number of correct words were evaluated. The study sample included 79 children. Children completed two semantic fluency tasks guided by their parents in an online questionnaire. During the tasks, the children generated words belonging to the semantic category of animals and clothes within a minute. The performance was evaluated on the basis of the number of correct words, errors and error types. Word retrieval strategies were studied by examining clusters, semantic subcategories and switches between subcategories. The results of this study showed that age had a strong relation to performance on fluency tasks as measured with a number of correct words, clusters, semantic subcategories and switches. The new result was that even 2 year old children could generate correct words for the task and utilize word retrieval strategies in the tasks. The children’s gender or parents’ socioeconomic status had no effect on performance in the semantic fluency tasks. Number of clusters, semantic subcategories and switches had a positive relation to the number of correct words which indicated that successful word retrieval required use of fluency strategies even with preschool aged children. However, due to the lack of previous research data, more research regarding children’s word retrieval strategies is necessary. This study is the first in which the children’s word fluency task was guided by their parents. Clinical practice and further studies could benefit from these results that such a research design would appear to be suitable for assessing children’s semantic fluency.
-
(2018)Objective. The topic of this study is classification in psychology and the aim is to introduce, why classification is important in psychology, what classification is used for in psychology and how classification is done in psychology. In addition the study introduces attributes and assumptions of the most common statistical methods used in psychology. The aim was to create a coherent totality, which can be used when either choosing a method for study or evaluating methods of previous studies. The study also describes common challenges regarding classification and ways to evaluate classification solutions. The statistical methods focus on unsupervised learning methods, which are used when the structure and number of classes are unknown. Hierarchical, centroid-based and distribution based clustering are introduced alongside with latent class analysis. For supervised learning methods, neural networks, Bayesian methods and decision trees are considered. Methods. Since this study is based on statistics, most of the literature used is considering statistical methods. In addition, studies of psychology which use methods relevant for this study are used as reference. Results. Classification in psychology is important in measuring, communicating about and understanding phenomena. It has made diagnostics, recognizing risk groups and specifying attributes and features possible. Classification has also challenges. Psychological phenomena can be heterogenetic, unstable and used parameters do not necessarily measure intended phenomenon. Classification methods are numerous and every method has its own attributes, weaknesses and strengths. And every solution is only a data dependent model. Statistical methods are in totality useful tools in psychological studies and literature. Understanding of these statistical methods enables producing accurate models and also evaluating them.
Now showing items 1-9 of 9