Skip to main content
Login | Suomeksi | På svenska | In English

Syntyvyyden ennustaminen Suomessa Google Trends -datan avulla

Show full item record

Title: Syntyvyyden ennustaminen Suomessa Google Trends -datan avulla
Author(s): Haimi, Pekka
Contributor: University of Helsinki, Faculty of Social Sciences
Degree program: Master 's Programme in Social Research (SOSM)
Specialisation: Demography
Language: Finnish
Acceptance year: 2023
Abstract:
Google Trends -palvelun tarjoamaa hakuintensiteettiaineistoa on hyödynnetty kansainvälisessä tieteellisessä tutkimuksessa lähes kaksi vuosikymmentä. Suomessa sen käyttö on rajoittunut yhteiskunnallisessa tutkimuksessa lähinnä taloustieteellisiin sovelluksiin, kuten työttömyyden mallintamiseen. Yhdysvalloissa Google Trends -dataa on hyödynnetty syntyvyyslukujen ennustamiseen koronapandemian alkuvaiheilla. Syntyvyyslukujen ennustaminen lähitulevaisuuteen on vaikeaa äkillisten ja yhteiskunnallisesti merkittävien käännekohtien tapahtuessa. Tässä työssä selvitettiin onko hakukoneaineiston avulla mahdollista parantaa syntyvyyden ennustemallien tarkkuutta Suomessa. Aineistona käytettiin Tilastokeskuksen tarjoamaa tietoa kuukausittain elävänä syntyneiden lasten lukumäärästä aikavälillä tammikuu 2010 - heinäkuu 2022. Aineisto jaettiin kaikkiin elävänä syntyneisiin lapsiin ja esikoisina syntyneisiin lapsiin. Hakutermien hakuintensiteettiaineisto ladattiin R-ohjelmistolla Google Trends -palvelusta. Tutkittavat hakutermit liittyvät raskauden alkuvaiheisiin eli sanoihin, joita todennäköisesti haetaan raskauden alkuvaiheessa. Historiallisesta datasta muodostettua SARIMA-ennustemallia verrattiin SARIMAX-ennustemalliin, johon oli lisätty hakutermit ulkoisina selittävinä tekijöinä. Tulosten perusteella ennustemallin tarkkuus parani esikoisaineistolla 4 % ja kaikkien syntyneiden aineistolla 10 % lisäämällä hakutermit ulkoisina selittävinä tekijöinä. Pandemian alkuvaiheen kohdalla hakutermit sisältävä ennustemalli ei kuitenkaan parantanut ennusteen tarkkuutta, kun taas loppukeväästä 2021 eteenpäin hakutermien lisääminen ennustemalliin paransi ennusteen tarkkuutta. Hakutermien välillä oli eroja ja osa jopa heikensi ennustemallin tarkkuutta. Parhaiksi ennustemalleiksi valikoitui useamman hakutermin sisältävät ennustemallit. Tulosten perusteella hakukoneaineistoa voidaan käyttää väestötieteellisten ilmiöiden mallintamiseen Suomessa. Harvinaisempien hakutermien ja tarkemman alueellisen rajauksen hyödyntämiseen liittyy kuitenkin rajoitteita.
Keyword(s): syntyvyys ennustemalli Google Trends SARIMAX


Files in this item

Files Size Format View
Haimi_Pekka_maisteritutkielma_2023.pdf 1.951Mb PDF

This item appears in the following Collection(s)

Show full item record