  • Kulbitski, Mikita (2023)
    Nowadays power consumption is a hot and actual domain. Efficient energy consumption allows you to use resources from the environment wisely and, moreover, switch to alternative energy sources where it is possible. This thesis is aimed at analyzing elevator’s power consumption data (average per every 5 minutes and 1 hour). The data has been gathered for several years, so it is a time series. This thesis includes review of time series models, which then can be used for the consequent analysis. Main directions are forecasting power consumption, capturing trends and anomalies. In addition, time series data may also be used for calculating average power consumption for each elevator inside the elevator group. As an outcome, spread of the power consumption across 4 elevators inside the elevator group may be seen. One of the thesis’ goals is to check whether it is even or not.
  • Gråsten, Emilia (2022)
    The opportunity costs of defence and the impact of defence spending on economic growth aroused the interest of researchers during the Cold War. The question is topical again, as the war in Ukraine has accelerated international armaments and increased investments in defence. For Finland and Sweden, the issue is also important in terms of future NATO membership, because NATO recommends that its member countries spend at least 2% of GDP on defence. Achieving the limit requires an increase in defence spending from both countries. No case studies on the impact of defence spending on economic growth have been published about Finland and Sweden, but the countries have been discussed as part of broader panel materials. This thesis fills the gap. The thesis applies structural vector autoregressive methods to analyse the period from 1960 to 2021. Granger causality is included in the analysis, because–despite its problematic nature–the concept has a central position in the history of the research topic. Previous literature has considered the identification of a structural model challenging because the determination of bidirectional causality would require a suitable exogenous variable, which is almost impossible to find in this context. The view is challenged by suggesting that a partial identification can be accepted when the interest is focused only on the defence spending shock. The alternative analysis concerning a shorter time period tests the sensitivity of results to a time period. The impulse response analysis suggests that the impact of defence spending on GDP is slightly positive for both countries, but statistically significant only for Sweden. Granger causality is not observed in either direction for either country. Finland's neutral result is in line with expectations and previous literature, but Sweden's positive result is contrary to expectations. The alternative analysis concerning the post-Cold War era confirms that the Finnish result is robust regardless of the time period. The inconsistency with previous literature and the challenges caused by conditional heteroskedasticity raise doubts about the reliability of the Swedish result. The thesis indicates that increases in defence spending will not harm economic growth in Finland and Sweden. The result is surprising, as it has been suggested that previous studies have underestimated the negative impact of defence spending and most of the recent literature supports a negative or neutral impact. Further research is needed, especially on the impact mechanisms and the causes of heterogeneity. Decomposing defence spending could provide answers to unresolved questions.
  • Tiihonen, Iiro (2020)
    Työni aihe on Gaussisten prosessien (Gp) soveltaminen aikasarjojen analysointiin. Erityisesti lähestyn aikasarjojen analysointia verrattain harvinaisen sovellusalan, historiallisten aikasarja-aineistojen analysoinnin näkökulmasta. Bayesilaisuus on tärkeä osa työtä: parametreja itsessään kohdellaan satunnaismuuttujina, mikä vaikuttaa sekä mallinnusongelmien muotoiluun että uusien ennusteiden tekemiseen työssä esitellyillä malleilla. Työni rakentuu paloittain. Ensin esittelen Gp:t yleisellä tasolla, tilastollisen mallinnuksen työkaluna. Gp:eiden keskeinen idea on, että Gp-prosessin äärelliset osajoukot noudattavat multinormaalijakaumaa, ja havaintojen välisiä yhteyksiä mallinnetaan ydinfunktiolla (kernel), joka samaistaa havaintoja niihin liittyvien selittäjien ja parametriensa funktiona. Oikeanlaisen ydinfunktion valinta ja datan suhteen optimoidut parametrit mahdollistavat hyvinkin monimutkaisten ja heikosti ymmärrettyjen ilmiöiden mallintamisen Gp:llä. Esittelen keskeiset tulokset, jotka mahdollistavat sekä GP:n sovittamisen aineistoon että sen käytön ennusteiden tekemiseen ja mallinnetun ilmiön alatrendien erittelyyn. Näiden perusteiden jälkeen siirryn käsittelemään sitä, miten GP-malli formalisoidaan ja sovitetaan, kun lähestymistapa on Bayesilainen. Käsittelen sekä eri sovittamistapojen vahvuuksia ja heikkouksia, että mahdollisuutta liittää Gp osaksi laajempaa tilastollista mallia. Bayesilainen lähestymistapa mahdollistaa mallinnettua ilmiötä koskevan ennakkotiedon syöttämisen osaksi mallin formalismia parametrien priorijakaumien muodossa. Lisäksi se tarjoaa systemaattisen, todennäköisyyksiin perustuvan tavan puhua sekä ennakko-oletuksista että datan jälkeisistä parametreihin ja mallinnetun ilmiön tuleviin arvoihin liittyvistä uskomuksista. Seuraava luku käsittelee aikasarjoihin erityisesti liittyviä Gp-mallintamisen tekniikoita. Erityisesti käsittelen kolmea erilaista mallinnustilannetta: ajassa tapahtuvan Gp:n muutoksen, useammasta eri alaprosessista koostuvan Gp:n ja useamman keskenään korreloivan Gp:n mallintamista. Tämän käsittelyn jälkeen työn teoreettinen osuus on valmis: aikasarjojen konkreettinen analysointi työssä esitellyillä työkaluilla on mahdollista. Viimeinen luku käsittelee historiallisten ilmiöiden mallintamista aiemmissa luvuissa esitellyillä tekniikoilla. Luvun tarkoitus on ensisijaisesti esitellä lyhyesti useampi potentiaalinen sovelluskohde, joita on yhteensä kolme. Ensimmäinen luvussa käsitelty mahdollisuus on usein vain repalaisesti havaintoja sisältävien historiallisten aikasarja-aineistojen täydentäminen GP-malleista saatavilla ennusteilla. Käytännön tulokset korostivat tarvetta vahvoille prioreille, sillä historialliset aikasarjat ovat usein niin harvoja, että mallit ovat valmiita hylkäämän havaintojen merkityksen ennustamisessa. Toinen esimerkki käsittelee historiallisia muutoskohtia, esimerkkitapaus on Englannin sisällissodan aikana äkillisesti räjähtävä painotuotteiden määrä 1640-luvun alussa. Sovitettu malli onnistuu päättelemään sisällissodan alkamisen ajankohdan. Viimeisessä esimerkissä mallinnan painotuotteiden määrää per henkilö varhaismodernissa Englannissa, käyttäen ajan sijaan selittäjinä muita ajassa kehittyviä muuttujia (esim. urbanisaation aste), jotka tulkitaan alaprosesseiksi. Tämänkin esimerkin tekninen toteutus onnistui, mikä kannustaa sekä tilastollisesti että historiallisesti kattavampaan analyysiin. Kokonaisuutena työni sekä esittelee että demonstroi Gp-lähestymistavan mahdollisuuksia aikasarjojen analysoinnissa. Erityisesti viimeinen luku kannustaa jatkokehitykseen historiallisten ilmiöiden mallintamisen uudella sovellusalalla.
  • Keningi, Eino (2022)
    In little over a decade, cryptocurrencies have become a highly speculative asset class in global financial markets, with Bitcoin leading the way. Throughout its relatively brief history, the price of bitcoin has gone through multiple cycles of growth and decline. As a consequence, Bitcoin has become a widely discussed – and polarizing – topic on Twitter. This work studies whether the sentiment of popular Bitcoin-related tweets can be used to predict the future price movements of bitcoin. In total, seven different algorithms are evaluated: Vector Autoregression, Vector Autoregression Moving-Average, Random Forest, XGBoost, LightGBM, Long Short-Term Memory, and Gated Recurrent Unit. By applying lexicon-based sentiment analysis, and heuristic filtering of tweets, it was discovered that sentiment-based features of popular tweets improve the prediction accuracy over baseline features (open-high-low-close data) in five of the seven algorithms tested. The tree-based algorithms (Random Forest, XGBoost, LightGBM) generally had the lowest prediction errors, while the neural network algorithms (Light Short-Term Memory and Gated Recurrent Unit) had the poorest performance. The findings suggest that the sentiment of popular Bitcoin-related tweets can be an important feature in predicting the future price movements of bitcoin.
  • Lapinlampi, George (2020)
    There’s a specific but sometimes quite a significant problem in time series modeling caused by changing means. First, the foundation behind the model addressing this problem is introduced in the form of the basic theory of Markov chains and problems related to hidden Markov chains. This approach builds on the ARMA (Autoregressive Moving average) model but is utilizing estimation methods from the areas not specifically dedicated to the time series analysis. The hybrid approach comprising Markov chains, EM (expectation-maximization) algorithm, and linear modeling may be well justified when the conventional methods do not seem to produce desired results and the modeler has competencies and means to attempt more sophisticated approaches. The literature review provides an insight into an earlier kind of models that have led to the development of the model investigated in this work. Finally, in the empirical part the model’s power is assessed against the conventional ARMA model. The modeling is performed on the simulated series in order to assess the functionality of the EM algorithm, to have a precise knowledge about real state variables, and to get an optimal comparison between a linear and non-linear models. The models are compared using multiple diagnostic procedures such as AIC (Akaike criterion), autocorrelation and partial autocorrelation functions, residuals variance, and other descriptive statistical measures.