Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by Subject "ennustemalli"

Sort by: Order: Results:

  • Lindroos, Robin (2021)
    Tämän työn tarkoituksena oli selvittää, onko mahdollista avoimia paikkatieto- ja kaukokartoitusaineistoja hyödyntäen luoda kasvupaikkatyyppiä ennustava malli, jonka ennuste olisi tarkempi kuin saatavilla oleva, koko Suomen kattava Luonnonvarakeskuksen tekemä kasvupaikkamalli. Viime vuosikymmenen aikana avointen paikkatietoaineistojen saata-vuus on lisääntynyt moninkertaisesti. Taustalla on EU:n säätämä INSPIRE-direktiivi 2007/2/EC (EU 2007), jonka tavoit-teena on yhteiskäyttöiset paikkatiedot ja yhteinen paikkatietoinfra-struktuuri. Tässä työssä hyödynnetään useita paikka-tieto- ja kaukokartoitusaineistoja, jotka ovat tulleet avoimeen käyttöön maksutta INSPIRE-direktiivin ansiosta. Aineistojen pohjalta on tunnistettu viisitoista mahdollista muuttujaa, jotka voisivat selittää kasvupaikkatyyppiä. Kaksitois-ta muuttujaa kuvaa topografiaa ja pohjautuvat suoraan tai välillisesti korkeusmalliin, yksi muuttuja kuvaa kasvukauden kokonaissadantaa, yksi muuttuja kuvaa maaperää ja yksi muuttuja on valtapituuden kasvuun pohjautuva kasvupaikka-tyyppiennuste. Valtapituuden kasvuun pohjautuvalle kasvupaikkatyyppiennusteelle kehitettiin malli, joka perustuu mänty-, kuusi- ja koivumetsiköiden kasvatusmalleihin. Näiden muuttujien pohjalta sovitettiin regressioanalyysiä hyödyntäen kasvupaikkatyyppiä ennustavia malleja. Referenssiaineistona käytettiin Suomen metsäkeskuksen kaukokartoituskoealo-ja pohjoisen napapiirin eteläpuolelta. Koealoihin on merkitty kasvupaikkatyyppi, johon malli sovitettiin. Tässä työssä kehitetty paras malli ennustaa mittareiden mukaan kasvupaikkatyyppiä tarkemmin kuin Luonnonvarakes-kuksen kasvupaikkamalli. Paras malli käyttää selittäjinä valtapituuden muutokseen perustuvaa kasvupaikkatyyppiennus-tetta, maalajia, korkeutta merenpinnasta, topografista sijainti-indeksiä (TPI), ”cartographic depth-to-water” -indeksiä (DTW) sekä kasvukauden kokonaissadantaa. Toiseksi paras malli ei hyödynnä maalajia selittäjänä, sillä Geologian tutkimuskeskuksen tuottama maaperäkartta ei kata koko Suomea. Malli käyttää selittäjinä valtapituuden muutokseen pe-rustuvaa kasvupaikkatyyppiennustetta, maalajia, korkeutta merenpinnasta, topografista sijainti-indeksiä (TPI), ”carto-graphic depth-to-water” -indeksiä (DTW), topografista kosteusindeksiä (TWI), kasvukauden kokonaissadantaa sekä auringon potentiaalista kokonaissäteilytystä. Selitysvoimaltaan paras muuttuja perustuu valtapituuden kehityksen tarkasteluun useamman ajankohdan laserkeilausai-neistoja hyödyntäen. Muuttujasta saatavat kasvupaikkatyyppiennusteet ovat sitä tarkemmat, mitä enemmän havaintoja aikasarjassa on. Tämän takia tässä työssä kehitettävän mallin parantamisen ja jatkokehittämisen kannalta olennaista on useamman ajankohdan laserkeilausaineistojen saatavuuden lisääminen. Malli hyödyntää 1970-luvulla kehitettyjä kasva-tusmalleja. On viitteitä siitä, että Suomessa puusto kasvaa nykyään nopeammin kuin 30–40 vuotta sitten. Tulevissa tutki-muksissa tätä kasvun muutosta olisi syytä tutkia tarkemmin ja huomioida se kasvupaikkatyyppiä ennustavien mallien jatkokehittämisessä.
  • Lindroos, Robin (2021)
    Tämän työn tarkoituksena oli selvittää, onko mahdollista avoimia paikkatieto- ja kaukokartoitusaineistoja hyödyntäen luoda kasvupaikkatyyppiä ennustava malli, jonka ennuste olisi tarkempi kuin saatavilla oleva, koko Suomen kattava Luonnonvarakeskuksen tekemä kasvupaikkamalli. Viime vuosikymmenen aikana avointen paikkatietoaineistojen saata-vuus on lisääntynyt moninkertaisesti. Taustalla on EU:n säätämä INSPIRE-direktiivi 2007/2/EC (EU 2007), jonka tavoit-teena on yhteiskäyttöiset paikkatiedot ja yhteinen paikkatietoinfra-struktuuri. Tässä työssä hyödynnetään useita paikka-tieto- ja kaukokartoitusaineistoja, jotka ovat tulleet avoimeen käyttöön maksutta INSPIRE-direktiivin ansiosta. Aineistojen pohjalta on tunnistettu viisitoista mahdollista muuttujaa, jotka voisivat selittää kasvupaikkatyyppiä. Kaksitois-ta muuttujaa kuvaa topografiaa ja pohjautuvat suoraan tai välillisesti korkeusmalliin, yksi muuttuja kuvaa kasvukauden kokonaissadantaa, yksi muuttuja kuvaa maaperää ja yksi muuttuja on valtapituuden kasvuun pohjautuva kasvupaikka-tyyppiennuste. Valtapituuden kasvuun pohjautuvalle kasvupaikkatyyppiennusteelle kehitettiin malli, joka perustuu mänty-, kuusi- ja koivumetsiköiden kasvatusmalleihin. Näiden muuttujien pohjalta sovitettiin regressioanalyysiä hyödyntäen kasvupaikkatyyppiä ennustavia malleja. Referenssiaineistona käytettiin Suomen metsäkeskuksen kaukokartoituskoealo-ja pohjoisen napapiirin eteläpuolelta. Koealoihin on merkitty kasvupaikkatyyppi, johon malli sovitettiin. Tässä työssä kehitetty paras malli ennustaa mittareiden mukaan kasvupaikkatyyppiä tarkemmin kuin Luonnonvarakes-kuksen kasvupaikkamalli. Paras malli käyttää selittäjinä valtapituuden muutokseen perustuvaa kasvupaikkatyyppiennus-tetta, maalajia, korkeutta merenpinnasta, topografista sijainti-indeksiä (TPI), ”cartographic depth-to-water” -indeksiä (DTW) sekä kasvukauden kokonaissadantaa. Toiseksi paras malli ei hyödynnä maalajia selittäjänä, sillä Geologian tutkimuskeskuksen tuottama maaperäkartta ei kata koko Suomea. Malli käyttää selittäjinä valtapituuden muutokseen pe-rustuvaa kasvupaikkatyyppiennustetta, maalajia, korkeutta merenpinnasta, topografista sijainti-indeksiä (TPI), ”carto-graphic depth-to-water” -indeksiä (DTW), topografista kosteusindeksiä (TWI), kasvukauden kokonaissadantaa sekä auringon potentiaalista kokonaissäteilytystä. Selitysvoimaltaan paras muuttuja perustuu valtapituuden kehityksen tarkasteluun useamman ajankohdan laserkeilausai-neistoja hyödyntäen. Muuttujasta saatavat kasvupaikkatyyppiennusteet ovat sitä tarkemmat, mitä enemmän havaintoja aikasarjassa on. Tämän takia tässä työssä kehitettävän mallin parantamisen ja jatkokehittämisen kannalta olennaista on useamman ajankohdan laserkeilausaineistojen saatavuuden lisääminen. Malli hyödyntää 1970-luvulla kehitettyjä kasva-tusmalleja. On viitteitä siitä, että Suomessa puusto kasvaa nykyään nopeammin kuin 30–40 vuotta sitten. Tulevissa tutki-muksissa tätä kasvun muutosta olisi syytä tutkia tarkemmin ja huomioida se kasvupaikkatyyppiä ennustavien mallien jatkokehittämisessä.
  • Sarasjärvi, Kiira (2016)
    In my review (bachelor thesis) I am presenting J.N. Vickers theory about Quiet eye. In the beginning I am go through how we use eye fixations in a everyday life. According to stuides people are pointing their eyes only for targets which re relevant for the upcoming task. At the same time the amount of fixations are strived to keep low. Vision has shown also to lead usually in action after two second after the eye fixation. The Quiet eye is the final fixation or tracking gaze on a location or object that is within 3ᵒ of visual angle for a minimum of 100ms. Quiet eye is mainly studied and has still be used in sport science. The most used research frame is to study difference in eye fixations periods and location between experts and novisers, success and unsuccess sportperformaning and before and after quiet eye training. In my review I also present fractioned reaction time paradigm and internal model. I try to create an overall picture about how and why The Quiet eye theory could actually worked and how the models could explain the differences between the different study groups. My goal is to give to the reader a general view about the quiet eye, the theories and literature behind it.
  • Loukusa, Eeva (2022)
    The degassing of coffee is an exponentially decaying process during which the gases formed within coffee beans during roasting are released from the coffee material. Degassing takes place during the hours and days subsequent to roasting. Degassing and it’s optimization are important in the processing of roasted coffee; roasted coffee must be let to degas sufficiently before packaging, while on the other hand a too long degassing time may lead to loss of sensory quality attributes. The aim of this research was to study the effects of the coffee variety, origin and the degree of roast and grinding on the degassing behavior of coffee, to gain knowledge on the degassing of coffee blends and to create a mathematical prediction model for estimating the degassing behavior of coffees especially for new coffee product development purposes. The study was conducted by roasting two different coffee blends and mixtures of four different green coffee components with varying mixing ratios. The samples were placed into air-tight degassing vessels, and the degassing was calculated by measuring the change of internal pressure within the closed degassing vessels for 24 hours. The obtained data was assessed using statistical methods, and two prediction models for the prediction of degassing time and the amount of degassed gases each were established. The Brazilian dry processed arabica coffee (screen 14/16) was observed to release more gases than the other studied components, while the Colombian, wet processed arabica coffee was observed to have a shorter and the Indian robusta coffee a longer degassing time compared to the other studied components. The degree of roast and grinding were also observed to affect the degassing behavior of coffee. The darker the roast, the more gases were released and the longer the degassing times were. In addition, the finer the grind, the less gases were released and the shorter the degassing times were. The observed effects of the different green coffee components and degree of grinding and roast were most likely caused by differences in the chemical composition and physical structure of the coffees. Although the different green coffee components were found to have varying effects on the degassing behavior of the coffees, the roast and grinding degrees were found to be the most significant factors affecting the degassing behavior of coffee. Accordingly, the prediction models based on the roast degree, grinding degree and blend were found to be most accurate for estimating the degassing behavior of roasted coffee.
  • Loukusa, Eeva (2022)
    The degassing of coffee is an exponentially decaying process during which the gases formed within coffee beans during roasting are released from the coffee material. Degassing takes place during the hours and days subsequent to roasting. Degassing and it’s optimization are important in the processing of roasted coffee; roasted coffee must be let to degas sufficiently before packaging, while on the other hand a too long degassing time may lead to loss of sensory quality attributes. The aim of this research was to study the effects of the coffee variety, origin and the degree of roast and grinding on the degassing behavior of coffee, to gain knowledge on the degassing of coffee blends and to create a mathematical prediction model for estimating the degassing behavior of coffees especially for new coffee product development purposes. The study was conducted by roasting two different coffee blends and mixtures of four different green coffee components with varying mixing ratios. The samples were placed into air-tight degassing vessels, and the degassing was calculated by measuring the change of internal pressure within the closed degassing vessels for 24 hours. The obtained data was assessed using statistical methods, and two prediction models for the prediction of degassing time and the amount of degassed gases each were established. The Brazilian dry processed arabica coffee (screen 14/16) was observed to release more gases than the other studied components, while the Colombian, wet processed arabica coffee was observed to have a shorter and the Indian robusta coffee a longer degassing time compared to the other studied components. The degree of roast and grinding were also observed to affect the degassing behavior of coffee. The darker the roast, the more gases were released and the longer the degassing times were. In addition, the finer the grind, the less gases were released and the shorter the degassing times were. The observed effects of the different green coffee components and degree of grinding and roast were most likely caused by differences in the chemical composition and physical structure of the coffees. Although the different green coffee components were found to have varying effects on the degassing behavior of the coffees, the roast and grinding degrees were found to be the most significant factors affecting the degassing behavior of coffee. Accordingly, the prediction models based on the roast degree, grinding degree and blend were found to be most accurate for estimating the degassing behavior of roasted coffee.
  • Kämäräinen, Emma (2018)
    Tässä työssä aiheena oleva mobiilipuhelimien käyttöiän mallintaminen ja ennustaminen on osa teleoperaattori DNA Oyj:n laitemallia. Laitemalliin kuuluu asiakkaan seuraavan puhelinlaitteen ostoajanhetken, hinnan ja valmistajan ennustaminen. Ostoajanhetken arviointi on olennainen tieto yrityksille, jotka myyvät mobiililaitteita, sillä sen avulla voidaan ajoittaa laitesuositteluja sekä tehdä asiakkaalle ajankohtaisia toimenpiteitä. Käyttöiän mallintamista varten haettiin aineisto DNA Oyj:n tietokannasta, jota jatkojalostettiin mallinnukseen sopivaksi. Aineistoa kertyy koko ajan lisää, jonka takia mallinnuksessa käytetty aineisto muuttuu jopa päivittäin. Laitemallia ajetaan DNA Oyj:n tuotantoympäristössä ja sen tulokset ovat operatiivisessa käytössä. Tutkielmani alussa esittelen mallinnuksessa käytettävän satunnainen metsä-algoritmin, joka on päätöspuiden kokoelmaan perustuva menetelmä. Ensin kerron hieman algoritmin historiasta ja sen teoreettisesta taustasta. Algoritmin toiminnan ymmärtämiseksi esittelen myös muita koneoppimisen menetelmiä, jotka ovat oleellinen osa algoritmia. Satunnainen metsä- menetelmässä on monia hyviä ominaisuuksia, joita täsmennän teoriaosuuden yhteydessä. Menetelmän suorituksen yhteydessä voidaan esimerkiksi laskea selittäville muuttujille niiden tärkeys mallinnuksessa. Algoritmin teorian esittelyn jälkeen määrittelen vielä muutamia metriikoita, joita käytän mallinnusvaiheessa tulosten analysoinnissa ja validoinnissa. Seuraavaksi kuvailen työssä käytetyn aineiston. Aineiston hakuja tehtiin kaksi, joista toinen on mallin koulutusaineistoa varten ja toinen on aineisto, jolle lopulliset ennusteet muodostetaan. Aineistoissa on paljon muuttujia, joten esittelen ne kahdessa osassa. Ensin kerron laitteeseen liittyvät ominaisuudet ja sen jälkeen asiakkaaseen liittyvät tiedot. Laitteiden ostopäivätiedoista saatiin selville mallinnuksen selitettävä muuttuja, puhelimen käyttöaika, joka luokiteltiin kolmen kuukauden tarkkuudella. Ostopäivän lisäksi puhelinlaitteesta on tiedossa monenlaisia teknisiä ominaisuuksia, muun muassa laitteen käyttöjärjestelmä sekä 4G- kyvykkyys. Asiakkaan tiedoista mallinnuksessa käytettiin demografisia tietoja, kuten sukupuolta ja ikää. Lisäksi hyödynnettiin asiakkaan ilmoittaman osoitetiedon perustella määriteltyä laajakaistasaatavuutta ja mobiilidatan käyttöön liittyviä muuttujia. Aineiston esittelyn jälkeen kerron varsinaisesta mallinnuksesta. Mallinnuksen yhteydessä tutkin eri parametrien vaikutusta ennustetuloksiin. Optimaalisten parametrien avulla luotiin luokkaennusteet mobiililaitteiden käyttöiälle. Eräs satunnainen metsä- algoritmin ominaisuus liittyy siihen, että menetelmän suorituksen yhteydessä pystytään arvioimaan sen tuottamia tuloksia aineistolle, jota menetelmä ei ole käyttänyt kyseisellä suorituskerralla mallin rakentamiseen. Arviointiin käytettiin luokittelumenetelmiin sopivia metriikoita, joiden perusteella algoritmi ennustaa onnistuneesti suuren osan aineistosta. Parametrien määrittämisen ja mallin kouluttamisen jälkeen muodostettiin luokat ennusteaineistolle. Lopullisten ennusteiden paikkansapitävyyttä ei voida arvioida, ennen kuin asiakas ostaa uuden puhelimen. Joissakin tapauksissa vaihtoon voi mennä useampi vuosi. Päätän opinnäytetyöni arvioimalla menetelmän toimivuutta ja pohtimalla laitevaihdon taustalla olevia muuttujia. Vaikka työssä oli käytössä rikas aineisto, puhelinvaihdon luultavasti yleisintä syytä eli laitteen vikatilannetta ei ollut saatavilla työn tekohetkellä. Laitevaihdon syihin perustuvan aineiston lisääminen parantaisi mallinnuksen tuloksia entisestään. Lopussa pohdin myös tuotannossa ajettavan, päivittäin muuttuvan mallinnuksen haasteita. Eräs mallinnuksen tuloksiin vaikuttava tekijä on muuttumattomat parametrit, jotka aineiston muuttuessa eivät välttämättä tuota enää parhaita ennustetuloksia. Laitemallia aiotaan kehittää entistä paremmaksi DNA Oyj:llä.
  • Haimi, Pekka (2023)
    Google Trends -palvelun tarjoamaa hakuintensiteettiaineistoa on hyödynnetty kansainvälisessä tieteellisessä tutkimuksessa lähes kaksi vuosikymmentä. Suomessa sen käyttö on rajoittunut yhteiskunnallisessa tutkimuksessa lähinnä taloustieteellisiin sovelluksiin, kuten työttömyyden mallintamiseen. Yhdysvalloissa Google Trends -dataa on hyödynnetty syntyvyyslukujen ennustamiseen koronapandemian alkuvaiheilla. Syntyvyyslukujen ennustaminen lähitulevaisuuteen on vaikeaa äkillisten ja yhteiskunnallisesti merkittävien käännekohtien tapahtuessa. Tässä työssä selvitettiin onko hakukoneaineiston avulla mahdollista parantaa syntyvyyden ennustemallien tarkkuutta Suomessa. Aineistona käytettiin Tilastokeskuksen tarjoamaa tietoa kuukausittain elävänä syntyneiden lasten lukumäärästä aikavälillä tammikuu 2010 - heinäkuu 2022. Aineisto jaettiin kaikkiin elävänä syntyneisiin lapsiin ja esikoisina syntyneisiin lapsiin. Hakutermien hakuintensiteettiaineisto ladattiin R-ohjelmistolla Google Trends -palvelusta. Tutkittavat hakutermit liittyvät raskauden alkuvaiheisiin eli sanoihin, joita todennäköisesti haetaan raskauden alkuvaiheessa. Historiallisesta datasta muodostettua SARIMA-ennustemallia verrattiin SARIMAX-ennustemalliin, johon oli lisätty hakutermit ulkoisina selittävinä tekijöinä. Tulosten perusteella ennustemallin tarkkuus parani esikoisaineistolla 4 % ja kaikkien syntyneiden aineistolla 10 % lisäämällä hakutermit ulkoisina selittävinä tekijöinä. Pandemian alkuvaiheen kohdalla hakutermit sisältävä ennustemalli ei kuitenkaan parantanut ennusteen tarkkuutta, kun taas loppukeväästä 2021 eteenpäin hakutermien lisääminen ennustemalliin paransi ennusteen tarkkuutta. Hakutermien välillä oli eroja ja osa jopa heikensi ennustemallin tarkkuutta. Parhaiksi ennustemalleiksi valikoitui useamman hakutermin sisältävät ennustemallit. Tulosten perusteella hakukoneaineistoa voidaan käyttää väestötieteellisten ilmiöiden mallintamiseen Suomessa. Harvinaisempien hakutermien ja tarkemman alueellisen rajauksen hyödyntämiseen liittyy kuitenkin rajoitteita.
  • Haimi, Pekka (2023)
    Google Trends -palvelun tarjoamaa hakuintensiteettiaineistoa on hyödynnetty kansainvälisessä tieteellisessä tutkimuksessa lähes kaksi vuosikymmentä. Suomessa sen käyttö on rajoittunut yhteiskunnallisessa tutkimuksessa lähinnä taloustieteellisiin sovelluksiin, kuten työttömyyden mallintamiseen. Yhdysvalloissa Google Trends -dataa on hyödynnetty syntyvyyslukujen ennustamiseen koronapandemian alkuvaiheilla. Syntyvyyslukujen ennustaminen lähitulevaisuuteen on vaikeaa äkillisten ja yhteiskunnallisesti merkittävien käännekohtien tapahtuessa. Tässä työssä selvitettiin onko hakukoneaineiston avulla mahdollista parantaa syntyvyyden ennustemallien tarkkuutta Suomessa. Aineistona käytettiin Tilastokeskuksen tarjoamaa tietoa kuukausittain elävänä syntyneiden lasten lukumäärästä aikavälillä tammikuu 2010 - heinäkuu 2022. Aineisto jaettiin kaikkiin elävänä syntyneisiin lapsiin ja esikoisina syntyneisiin lapsiin. Hakutermien hakuintensiteettiaineisto ladattiin R-ohjelmistolla Google Trends -palvelusta. Tutkittavat hakutermit liittyvät raskauden alkuvaiheisiin eli sanoihin, joita todennäköisesti haetaan raskauden alkuvaiheessa. Historiallisesta datasta muodostettua SARIMA-ennustemallia verrattiin SARIMAX-ennustemalliin, johon oli lisätty hakutermit ulkoisina selittävinä tekijöinä. Tulosten perusteella ennustemallin tarkkuus parani esikoisaineistolla 4 % ja kaikkien syntyneiden aineistolla 10 % lisäämällä hakutermit ulkoisina selittävinä tekijöinä. Pandemian alkuvaiheen kohdalla hakutermit sisältävä ennustemalli ei kuitenkaan parantanut ennusteen tarkkuutta, kun taas loppukeväästä 2021 eteenpäin hakutermien lisääminen ennustemalliin paransi ennusteen tarkkuutta. Hakutermien välillä oli eroja ja osa jopa heikensi ennustemallin tarkkuutta. Parhaiksi ennustemalleiksi valikoitui useamman hakutermin sisältävät ennustemallit. Tulosten perusteella hakukoneaineistoa voidaan käyttää väestötieteellisten ilmiöiden mallintamiseen Suomessa. Harvinaisempien hakutermien ja tarkemman alueellisen rajauksen hyödyntämiseen liittyy kuitenkin rajoitteita.
  • Piekkari, Nelli (2019)
    Wheat is the most common crop of the world and there are many plant pathogens that are causing diseases in wheat. In Finland leaf spot diseases cause crop losses every year and typical diseases are for example tan spot and stagonospora nodorum spot. It is possible to use different kind of forecasting models to estimate the risk of the plant disease epidemic and need for controlling. Forecasting models make possible to focus the controlling actions to the right place and time. The aim of this study was clear up how reliably the WisuEnnuste forecasting model can forecast amount of tan spot and stagonospora nodorum spot of wheat. It was estimated how good correlation there is between the risk value of the forecasting model and amount of the disease observed from wheat samples. In addition it was evaluated how well tan spot and stagonospora nodorum spot are recognized visually from the plant samples. The correlation between risk value and real amount of the disease was weak for both diseases. When cumulating risk values were divided into three different classes there were statistically significant differences between classes. It is possible to use boundary values between classes when it is defined what risk values cause warning about the disease. The amount of the data was too small to evaluate how individual factors affect to the risk value. The visual identifying of the diseases was difficult and there happened many mistakes.