Browsing by master's degree program "Statistics"
Now showing items 1-5 of 5
-
(2023)Otantamenetelmät ovat perustavanlaatuinen osa tiedettä ja tutkimusta, kun halutaan havainnoida ja mitata mitä tahansa mitattavaa ilmiötä. Hyvin tehdyn otannan tavoitteena on saada kerättyä otos, joka edustaa tavoiteperusjoukkoa mahdollisimman hyvin. Jos otantaa ei ole tehty huolellisesti ja tiettyjä perusperiaatteita noudattaen, tutkimustulokset eivät ole luotettavia eikä tilastollista päättelyä voida tehdä. Tässä tutkielmassa tarkastellaan otantaa todennäköisyys- ja ei-todennäköisyysmenetelmillä. Todennäköisyysotannassa kaiken perustana on se, että jokaisella yksiköllä on nollaa suurempi todennäköisyys tulla valituksi otokseen. Ei-todennäköisyysotannalla tarkoitetaan sellaisia otantamenetelmiä, jotka eivät noudata todennäköisyysotannan perusperiaatteita. Vastaava tilanne voisi tapahtua esimerkiksi tutkimuksissa, joissa yksikön todennäköisyyttä tulla valituksi otokseen ei tiedetä. Kyseessä on myös ei-todennäköisyysotos, jos yhden tai useamman perusjoukon yksikön valikoitumistodennäköisyys on nolla. Ei-todennäköisyysotoksissa ilmenee usein harhaa.Tilanteessa, jossa otantaa ei ole valikoitu satunnaisesti ja menetelmien mukaisesti, otoksessa esiintyvää harhaa voidaan korjata erilaisin menetelmin. Tässä tutkielmassa esittelen näitä menetelmiä. Tutkielman aineistona Kelan työterveyshuoltotutkimuksen aineistoa (OHC), joka on kerätty työterveyshuoltolain täytäntöönpanon ja toteuttamisen arvioimiseksi vuonna 1985. Tarkasteluissa käytettiin OHC-aineistoa perusjoukkona. Tarkasteluissa perusjoukosta poimitaan eri kokoisia otoksia eri otantamenetelmillä, ja vertaillaan niitä. Lopuksi kokeillaan myös painokertoimilla kalibroimista, eli harhan korjaamista. Tuloksista huomataan, että perinteiset menetelmät antavat odotetusti luotettavia tuloksia, mutta oikein käytettynä ei-todennäköisyysotannalla voidaan kerätä tärkeää tietoa.
-
(2023)Survey-tutkimuksilla kerätään tietoa ympäröivästä maailmasta. Ne perustuvat usein otantaan eli siihen, että tietoa poimitaan valituilta tutkimuskohteilta. Vastaajia ja muita tietolähteitä poimitaan satunnaisesti tai jollain muulla tavalla valitsemalla. Otanta säästää tutkimuksen tekijältä aikaa ja kustannuksia, mutta tuottaa tutkimukselle epävarmuustekijöitä. Epävarmuus johtuu siitä, että poimittu otos ei vastaa tutkittavaa perusjoukkoa. Osa tutkimuskohteista jää tavoittamatta, tutkimuskohteet eivät vastaa tai vastaukset jäävät joiltain osin puutteellisiksi. Näin ollen otantatutkimus tuottaa aineistoja, joiden edustavuus ei ole täydellistä. Edustavuutta pyritään korjaamaan tilastollisilla menetelmillä, kuten painottamalla saatuja vastauksia sekä imputoimalla (paikkaamalla) tyhjiksi jääneitä vastauksia. Tässä opinnäytteessä keskitytään otannan korjaamiseen painottamalla. Opinnäytteessä luodaan katsaus katokorjausmenetelmään nimeltään jälkiositus. Menetelmä esitellään ja siihen liittyvä konkreettinen esimerkki käydään lävitse. Konkreettinen esimerkki liittyy Risto Lehtosen ja Erkki Pahkisen oppikirjaan [Lehtonen ja Pahkinen, 2004]. Siinä ennustetaan työttömien lukumääriä ja työttömien suhteellista osuutta entisen Keski-Suomen läänin alueella. Oppikirjan esimerkki toistettiin pääpiirteissään käyttäen eri otosta kuin oppikirjassa oli käytetty. Otokseen valikoituneiden kuntien takia tulokset poikkesivat jonkin verran oppikirjassa esitetyistä tuloksista. Jälkiosittaminen on loogista aineiston painottamista, joka tapahtuu aineiston keräämisen jälkeen. Siinä käytetään apuna lisätietoa esimerkiksi rekistereistä tai aiemmista tutkimuksista. Jälkiosittamisen historia ulottuu saman nimisenä 1970-luvulle ja eri nimisenä vähintäänkin 1940-luvulle. Jälkiosittaminen perustuu aineiston jakamiseen homogeenisiin soluihin sen jälkeen, kun aineisto on kerätty. Homogeenisten solujen käsittely vähentää epävarmuutta, jota tutkimuksen tekemiseen sisältyy. Epävarmuuden vähentyminen näkyy estimaattorien varianssien pienentymisenä.
-
(2023)Tilastollisen lukutaidon osaamisen tarve on jo pitkään tunnustettu yhdeksi yhteiskunnassa toimivan aikuisen kansalaistaidoksi. Tilastollisen lukutaidon määritelmästä ei kuitenkaan ole asiantuntijoiden välillä täyttä yhteisymmärrystä. Tutkielmassa tarkastellaan ensin tilastotieteen oppikirjojen ja populaaritieteen kirjojen tarjoamia määritelmiä tilastotieteelle, sekä kirjojen sisällysluetteloiden avulla sitä, mitä tilastoaiheita kirjoissa käsitellään. Tämän jälkeen pyritään löytämään sekä määritelmiä tilastolliselle lukutaidolle, että kartoittamaan niitä elementtejä, josta tilastollinen lukutaito koostuu. PISA-tutkimuksen matemaattisen lukutaidon mallia tarkastellaan yhtenä mahdollisuutena tilastollisen lukutaidon osa-alueiden ja prosessien määrittämiseen. Tilastollisen lukutaidon mallien avulla on mahdollista tarkentaa tilastotieteen perusteiden opetussisältöjä. Niitä on myös mahdollista käyttää opetuksen kehityksessä ja opiskelijoiden osaamisen arvioimisessa. Vaikka PISA-tutkimus tarjoaakin mielenkiintoisen näkökulman tilastollisen lukutaidon tarkasteluun, tutkimuksen viitekehystä tulisi tarkastella ja kehittää tilastotieteen opetuksen tutkijoiden tilastollisen lukutaidon valossa. Tilastotieteen määritelmät korostavat havaintojen keräämisen merkitystä todellisen maailman kuvaamiseksi ja analysoimiseksi, epävarmuuden hallitsemiseksi ja parempien päätösten tekemiseksi. Perinteiset tilastollisen lukutaidon määritelmät painottavat näiden lisäksi myös numeeristen havaintojen ymmärtämistä, kontekstia, kommunikaatiota, kriittistä ajattelua, asenteita ja motivaatiota. Tilastotieteen oppikirjojen lisäksi opetuksen suunnittelussa olisi hyvä hyödyntää populaaritieteen kirjojen käytännöllistä lähestymistapaa. Opetuksen painopisteen tulisi siirtyä numeeristen vastausten tuottamisesta numeroiden tulkitsemiseen kontekstissa. Opetuksessa tulisi kiinnittää erityistä huomiota kriittisten taitojen harjoitteluun. Dispositiotekijät, kuten asenteet ja motivaatio, ovat osa tutkijoiden ehdottamia tilastollisen lukutaidon malleja, eikä niitä tulisi sivuttaa myöskään opetuksessa.
-
(2023)Tässä tutkielmassa keskitytään vuonna 2003 ensi kertaa ilmestyneen suomalainen rahapelaaminen-tutkimussarjan viimeisimpään, vuonna 2019 ilmestyneeseen osaan Rahapelitutkimus 2019. Rahapelitutkimus 2019 selvittää suomalaisten rahapelien pelaamista, rahapelien pelaamisen useutta, pelaamiseen käytettyjä rahamääriä ja mielipiteitä ongelmapelaamisesta. Tutkittava kyselytutkimus on laaja ja sisältää useita muuttujia. Tutkielmassa on tarkasteltu rahapelaamista lineaaristen regressiomallien kautta ja kiinnitetty erityistä huomiota lineaaristen mallien diagnostiikkaan. Mallien diagnostiikkana toimi erilaiset visuaaliset tarkastelut, kuten kvantiilikuvaajat ja Cookin etäisyys. Selitettäväksi muuttujaksi on valittu vuodessa rahapelattu määrä euroissa. Selittäviksi muuttujiksi on valittu vastaajan sukupuoli, alkoholin käytön määrä ja koulutustaso. Näistä on saatu neljä tilastollista mallia, jossa ensin tarkastellaan muuttujien yhteyttä yksin ja tämän jälkeen muuttujat on yhdistetty yhdeksi malliksi. Tutkielmassa havaittiin, että rahapeleihin käytetty rahamäärä on keskimäärin suurempi miehillä kuin naisilla. Myös havaittiin, että rahapelattu määrä keskimäärin kasvaa kun alkoholiannokset kasvavat käyttökertaa kohden. Tutkielmassa ei havaittu, että vastaajan koulutustason nousu 1. asteelta toiselle asteelle vaikuttaisi keskimääräisesti rahapeleihin käytettyyn rahamäärään, mutta rahapelaaminen väheni keskimäärin, kun vastaaja oli suorittanut alemman tai ylemmän korkeakoulututkinnon.
-
(2021)People with a drug use disorder have a high risk of death following release from criminal sanctions due to increased risk of overdose. Time in prison has been associated with increased mortality from natural causes of death and suicides. In this thesis, the association of criminal sanctions with the mortality and causes of death of Finnish treatment-seeking individuals with substance use disorder was studied. Prior research on the topic is scarce and old. The data was the Register-based follow-up study on criminality, health and taxation of inpatients and outpatients entered into substance abuse treatment (RIPE, n = 10 887). The patients had been clients of A-Clinic Foundation between 1990 and 2009. Mortality was the modelled with logistic regression from 1.1.1992 to 26.8.2015. The time was divided into one-week episodes. For each client it was marked whether they were free, in prison or serving a community service, and whether they had died during the episode. Causes of death were studied using death records from 1992 to 2018. There was a 2,5-fold increase in overall mortality during the first two weeks after sentences. The risk stayed elevated even after the first 12 weeks (odds ratio 1,20; 95% confidence interval 1,08-1,32). The risk of a drug-related death (DRD) was almost 8,5-fold during the first two weeks. Poisonings excl. alcohol poisoning and assaults were more likely causes of death for patients with criminal history. DRD was over three times more likely among patients with criminal records. After validations, 33 individuals who had died during their sentence were identified from the data, of whom 14 (42,4%) had committed suicide. Approximately 10 percent of other deaths were suicides. Thus, it can be concluded that Finland has similar increased risk of death after sentences as has been observed in other countries despite frequent use of buprenorphine. Sentences affect causes of death for 2-5 years after the last sentence. Additionally, first signs of elevated mortality during community sanctions was observed, but further studies are required to confirm the finding.
Now showing items 1-5 of 5