Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by Author "Haimi, Pekka"

Sort by: Order: Results:

  • Haimi, Pekka (2023)
    Google Trends -palvelun tarjoamaa hakuintensiteettiaineistoa on hyödynnetty kansainvälisessä tieteellisessä tutkimuksessa lähes kaksi vuosikymmentä. Suomessa sen käyttö on rajoittunut yhteiskunnallisessa tutkimuksessa lähinnä taloustieteellisiin sovelluksiin, kuten työttömyyden mallintamiseen. Yhdysvalloissa Google Trends -dataa on hyödynnetty syntyvyyslukujen ennustamiseen koronapandemian alkuvaiheilla. Syntyvyyslukujen ennustaminen lähitulevaisuuteen on vaikeaa äkillisten ja yhteiskunnallisesti merkittävien käännekohtien tapahtuessa. Tässä työssä selvitettiin onko hakukoneaineiston avulla mahdollista parantaa syntyvyyden ennustemallien tarkkuutta Suomessa. Aineistona käytettiin Tilastokeskuksen tarjoamaa tietoa kuukausittain elävänä syntyneiden lasten lukumäärästä aikavälillä tammikuu 2010 - heinäkuu 2022. Aineisto jaettiin kaikkiin elävänä syntyneisiin lapsiin ja esikoisina syntyneisiin lapsiin. Hakutermien hakuintensiteettiaineisto ladattiin R-ohjelmistolla Google Trends -palvelusta. Tutkittavat hakutermit liittyvät raskauden alkuvaiheisiin eli sanoihin, joita todennäköisesti haetaan raskauden alkuvaiheessa. Historiallisesta datasta muodostettua SARIMA-ennustemallia verrattiin SARIMAX-ennustemalliin, johon oli lisätty hakutermit ulkoisina selittävinä tekijöinä. Tulosten perusteella ennustemallin tarkkuus parani esikoisaineistolla 4 % ja kaikkien syntyneiden aineistolla 10 % lisäämällä hakutermit ulkoisina selittävinä tekijöinä. Pandemian alkuvaiheen kohdalla hakutermit sisältävä ennustemalli ei kuitenkaan parantanut ennusteen tarkkuutta, kun taas loppukeväästä 2021 eteenpäin hakutermien lisääminen ennustemalliin paransi ennusteen tarkkuutta. Hakutermien välillä oli eroja ja osa jopa heikensi ennustemallin tarkkuutta. Parhaiksi ennustemalleiksi valikoitui useamman hakutermin sisältävät ennustemallit. Tulosten perusteella hakukoneaineistoa voidaan käyttää väestötieteellisten ilmiöiden mallintamiseen Suomessa. Harvinaisempien hakutermien ja tarkemman alueellisen rajauksen hyödyntämiseen liittyy kuitenkin rajoitteita.