dc.date.accessioned |
2015-12-14T08:30:53Z |
und |
dc.date.accessioned |
2017-10-24T12:21:49Z |
|
dc.date.available |
2015-12-14T08:30:53Z |
und |
dc.date.available |
2017-10-24T12:21:49Z |
|
dc.date.issued |
2015-12-14T08:30:53Z |
|
dc.identifier.uri |
http://radr.hulib.helsinki.fi/handle/10138.1/5224 |
und |
dc.identifier.uri |
http://hdl.handle.net/10138.1/5224 |
|
dc.title |
Survey-tutkimusten informaation yhdistäminen : tilastomenetelmällinen ja empiirinen tarkastelu |
fi |
ethesis.discipline |
Statistics |
en |
ethesis.discipline |
Tilastotiede |
fi |
ethesis.discipline |
Statistik |
sv |
ethesis.discipline.URI |
http://data.hulib.helsinki.fi/id/670ef0b6-2f9e-4e98-91af-a292298fb670 |
|
ethesis.department.URI |
http://data.hulib.helsinki.fi/id/61364eb4-647a-40e2-8539-11c5c0af8dc2 |
|
ethesis.department |
Institutionen för matematik och statistik |
sv |
ethesis.department |
Department of Mathematics and Statistics |
en |
ethesis.department |
Matematiikan ja tilastotieteen laitos |
fi |
ethesis.faculty |
Matematisk-naturvetenskapliga fakulteten |
sv |
ethesis.faculty |
Matemaattis-luonnontieteellinen tiedekunta |
fi |
ethesis.faculty |
Faculty of Science |
en |
ethesis.faculty.URI |
http://data.hulib.helsinki.fi/id/8d59209f-6614-4edd-9744-1ebdaf1d13ca |
|
ethesis.university.URI |
http://data.hulib.helsinki.fi/id/50ae46d8-7ba9-4821-877c-c994c78b0d97 |
|
ethesis.university |
Helsingfors universitet |
sv |
ethesis.university |
University of Helsinki |
en |
ethesis.university |
Helsingin yliopisto |
fi |
dct.creator |
Honkala, Miika-Markus Salomon |
|
dct.issued |
2015 |
|
dct.language.ISO639-2 |
fin |
|
dct.abstract |
Tutkielmassa tarkastellaan erilaisia menetelmiä kahden tutkimuksen informaation yhdistämiseen, kun tutkimusten aineistoissa on samoja tulosmuuttujia. Informaatiota halutaan yhdistää, koska siten voidaan saada parempia estimaatteja aineistojen yhteisille tulosmuuttujille. Tutkielma on tehty Helsingin yliopiston ja Tilastokeskuksen yhteisenä pro-gradu -projektina.
Luvussa 2 esitetään tutkielmassa käytettävät aineistot. Ne ovat Ulkomaista syntyperää olevien työ ja hyvinvointi -tutkimuksen (UTH) aineisto sekä Työvoimatutkimuksen AHM2014-aineiston ulkomaalaistaustaisista koostuva AHM-aineisto. UTH-aineiston koko on 4 977 henkilöä ja AHM-aineiston koko 1 472 henkilöä. Luvussa 3 esitetään kirjallisuudessa käytettyjä menetelmiä tutkimusten tietojen yhdistämiseen ja esitetään tutkielmassa sovellettavia menetelmiä.
Luvussa 4 yhdistetään esimerkkiaineistojen informaatiota ja esitetään siitä saatavia tuloksia. Tutkielman aineistoille sekä niiden yhdistetylle aineistolle muodostetaan vastaustodennäköisyysmallin avulla uudet otospainot. Yhdistetylle aineistolle saadaan laskettua vastaustodennäköisyysmallin avulla paremmat painot, koska suurelle aineistolle tehtävään malliin saadaan paljon vastanneisuuden selittäjiä. Aineistojen estimaatteja yhdistetään neljällä menetelmällä ja tutkitaan, mikä menetelmä tuottaa estimaatit, jotka ovat lähimpänä yhdistetystä aineistosta laskettuja estimaatteja. Tällaiseksi menetelmäksi osoittautuu painotettu keskiarvo, jossa aineiston estimaatin painokertoimen määrittää aineiston koko. Lisäksi lasketaan LGREG-estimaatteja UTH-aineistolle ja yhdistetylle aineistolle siten, että estimaattorin avustava malli on sama. Estimaateista tulee tällöin hyvin samankaltaisia.
Luvussa 5 esitetään tulosten perusteella tehtyjä johtopäätöksiä. Informaation yhdistäminen kannattaa tehdä yhdistämällä aineistot. Se on työläämpi vaihtoehto kuin estimaattien yhdistäminen, mutta suuresta aineistosta lasketut estimaatit ovat tarkempia kuin pienemmästä aineistosta lasketut estimaatit. Informaation yhdistämiseen on parhaat mahdollisuudet, kun aineistojen kaikki muuttujat ovat samoja. Silloin kaikkien tulosmuuttujien estimaatteja voidaan parantaa, ja yhdistetyn aineiston kaikkia rekisterimuuttujia voidaan hyödyntää vastaustodennäköisyysmalleissa ja regressioestimaattoreissa.
Tutkielman tulokset kahden tutkimuksen informaation yhdistämisestä ovat käyttökelpoisia, kun aineistot ovat erikokoiset. Jos yhdistettäisiin kahden samankokoisen aineiston informaatiota, tuloksista osa olisi hieman erilaisia. Jatkotutkimuksena voisi olla imputointimenetelmien soveltaminen informaation yhdistämiseen. |
fi |
dct.language |
fi |
|
ethesis.language.URI |
http://data.hulib.helsinki.fi/id/languages/fin |
|
ethesis.language |
Finnish |
en |
ethesis.language |
suomi |
fi |
ethesis.language |
finska |
sv |
ethesis.thesistype |
pro gradu-avhandlingar |
sv |
ethesis.thesistype |
pro gradu -tutkielmat |
fi |
ethesis.thesistype |
master's thesis |
en |
ethesis.thesistype.URI |
http://data.hulib.helsinki.fi/id/thesistypes/mastersthesis |
|
dct.identifier.urn |
URN:NBN:fi-fe2017112251201 |
|
dc.type.dcmitype |
Text |
|