Skip to main content
Login | Suomeksi | På svenska | In English

Survey-tutkimusten informaation yhdistäminen : tilastomenetelmällinen ja empiirinen tarkastelu

Show full item record

Title: Survey-tutkimusten informaation yhdistäminen : tilastomenetelmällinen ja empiirinen tarkastelu
Author(s): Honkala, Miika-Markus Salomon
Contributor: University of Helsinki, Faculty of Science, Department of Mathematics and Statistics
Discipline: Statistics
Language: Finnish
Acceptance year: 2015
Abstract:
Tutkielmassa tarkastellaan erilaisia menetelmiä kahden tutkimuksen informaation yhdistämiseen, kun tutkimusten aineistoissa on samoja tulosmuuttujia. Informaatiota halutaan yhdistää, koska siten voidaan saada parempia estimaatteja aineistojen yhteisille tulosmuuttujille. Tutkielma on tehty Helsingin yliopiston ja Tilastokeskuksen yhteisenä pro-gradu -projektina. Luvussa 2 esitetään tutkielmassa käytettävät aineistot. Ne ovat Ulkomaista syntyperää olevien työ ja hyvinvointi -tutkimuksen (UTH) aineisto sekä Työvoimatutkimuksen AHM2014-aineiston ulkomaalaistaustaisista koostuva AHM-aineisto. UTH-aineiston koko on 4 977 henkilöä ja AHM-aineiston koko 1 472 henkilöä. Luvussa 3 esitetään kirjallisuudessa käytettyjä menetelmiä tutkimusten tietojen yhdistämiseen ja esitetään tutkielmassa sovellettavia menetelmiä. Luvussa 4 yhdistetään esimerkkiaineistojen informaatiota ja esitetään siitä saatavia tuloksia. Tutkielman aineistoille sekä niiden yhdistetylle aineistolle muodostetaan vastaustodennäköisyysmallin avulla uudet otospainot. Yhdistetylle aineistolle saadaan laskettua vastaustodennäköisyysmallin avulla paremmat painot, koska suurelle aineistolle tehtävään malliin saadaan paljon vastanneisuuden selittäjiä. Aineistojen estimaatteja yhdistetään neljällä menetelmällä ja tutkitaan, mikä menetelmä tuottaa estimaatit, jotka ovat lähimpänä yhdistetystä aineistosta laskettuja estimaatteja. Tällaiseksi menetelmäksi osoittautuu painotettu keskiarvo, jossa aineiston estimaatin painokertoimen määrittää aineiston koko. Lisäksi lasketaan LGREG-estimaatteja UTH-aineistolle ja yhdistetylle aineistolle siten, että estimaattorin avustava malli on sama. Estimaateista tulee tällöin hyvin samankaltaisia. Luvussa 5 esitetään tulosten perusteella tehtyjä johtopäätöksiä. Informaation yhdistäminen kannattaa tehdä yhdistämällä aineistot. Se on työläämpi vaihtoehto kuin estimaattien yhdistäminen, mutta suuresta aineistosta lasketut estimaatit ovat tarkempia kuin pienemmästä aineistosta lasketut estimaatit. Informaation yhdistämiseen on parhaat mahdollisuudet, kun aineistojen kaikki muuttujat ovat samoja. Silloin kaikkien tulosmuuttujien estimaatteja voidaan parantaa, ja yhdistetyn aineiston kaikkia rekisterimuuttujia voidaan hyödyntää vastaustodennäköisyysmalleissa ja regressioestimaattoreissa. Tutkielman tulokset kahden tutkimuksen informaation yhdistämisestä ovat käyttökelpoisia, kun aineistot ovat erikokoiset. Jos yhdistettäisiin kahden samankokoisen aineiston informaatiota, tuloksista osa olisi hieman erilaisia. Jatkotutkimuksena voisi olla imputointimenetelmien soveltaminen informaation yhdistämiseen.


Files in this item

Files Size Format View
Honkala_gradu.pdf 1.340Mb PDF

This item appears in the following Collection(s)

Show full item record