Skip to main content
Login | Suomeksi | På svenska | In English

Time series analysis : Gap filling and feature recognition

Show full item record

Title: Time series analysis : Gap filling and feature recognition
Author(s): Hannula, Minna
Contributor: University of Helsinki, Faculty of Science, Department of Mathematics and Statistics
Discipline: Applied Mathematics
Language: English
Acceptance year: 2016
Abstract:
Time series are very common in many fields of science as well as in, for example, economics. Nowadays time series are a more common way of expressing data because of the wide range of sensors and equipments collecting ordered data, such as stock prices and wind speed. Desire for a time series analysis usually rises from a wish to both understand a time-related data and interpolate missing values. In this research we had two different time series and two different aims for the analyze. The first goal was to analyze one-dimensional time series of temperature measurements and try to fill in a self-created gap in the time series. Missing values are commonly present in a real life measurement data, often caused by a failure of a measurement device or a simple human error. The missing values are problematic when analyzing time series: some of the common analyzing methods are not applicable to a data containing gaps and even a small, unfilled gap reduces the reliability of the observation analysis such as future value predictions. The second aim was to work with a selection of satellite image data. These satellite images were all taken from the same location and together they formed a two-dimensional time series. The goal was to analyze the time series of images, aiming to find some common features between different land types and by using these features divide the image pixels into five different clusters, depending on the land types the pixels were representing. The motivation behind such analysis was to test feature recognition possibilities for the recently collected satellite image data, which was measured using the synthetic aperture radar imaging. The data was provided by the Electric Brain project. For analyzing the time series we used techniques based on Fourier analysis, wavelet analysis, cross-correlation and k-means clustering algorithm. As the results presented in the chapter 3 present, the gap filling for the one-dimensional temperature data was performed successfully with two different approaches based on Fourier and wavelet analysis. Especially the wavelet analysis approach performed a very good reconstruction for a missing year of temperatures using data from two to five surrounding years. The results of the feature recognition of the two-dimensional satellite image data were not as successful and results did not offer a good land type based separation of the pixels.
Aikasarjat ovat yleisiä sekä tieteessä että erilaisissa sovelluksissa. Yleistyneet sensorit ja laitteistot, jotka keräävät järjestettyä dataa kuten osakkeiden hintoja ja tuulen nopeutta, ovat lisänneet aika-sarjojen yleisyyttä datan ilmaisun keinona. Tarve aikasarja-analyysille syntyy usein tarpeesta sekä ymmärtää aikasidonnaista dataa että pystyä tuottamaan siitä haluttuja puuttuvia arvoja. Tässä tutkimuksessa käsiteltiin kahta eri aikasarjaa, joilla molemmilla oli yksilöllinen tavoite analyysille. Ensimmäinen aikasarja oli yksiulotteinen ja koostui lämpötiladatasta. Tutkimuksen tavoite oli analysoida kyseistä aikasarjaa ja paikata siihen luotu aukko. Puuttuvat arvot ovat yleisiä mittausdatassa mittauslaitteiston ongelmista ja inhimillisistä erehdyksistä johtuen. Tällaiset aukot aiheuttavat ongelmia aikasarja-analyysissa: jotkut yleisesti käytetyistä metodeista eivät sovellu aukkoja sisältävän datan käsittelyyn, ja jopa pieni täyttämatön aukko vähentää analyysin tulosten luotettavuutta. Toinen tavoite oli samasta sijainnista kerätyistä satelliittikuvista koostuvan kaksiuloitteisen aikasarjan analysointi. Tavoite oli analysoida kuvista koostuvaa aikasarjaa ja löytää siitä eri maatyypeille ominaisia piirteitä, joiden avulla kuvien pikselit jaettaisiin viiteen eri klusteriin. Jokainen näistä viidestä klusterista edusti yhtä maaluokkaa. Tavoite oli löytää tällaisen ominaisuuksiin perustuvan jaon mahdollisuuksia uudella datalla, joka oli kerätty käyttäen SAR-kuvausta (synthetic aperture radar imaging). Datan tuotti Electric Brain-projekti. Aikasarjojen analysoinnissa käytettiin tekniikoita jotka perustuivat Fourier analyysiin, wavelet analyysiin, ristikorrelaatioon ja k-means algorithmiin. Kuten tulokset kappaleessa 3 esittävät, yksiulotteisen datan aukon paikkaus onnistui hyvin Fourier ja wavelet analyyseihin perustuvilla tekniikoilla. Erityisesti wavelet-pohjainen lähestymistapa tuotti todella hyviä paikkauksia kokonaiselle puuttuvalle vuodelle, kun käytössä oli dataa ympäröiviltä kahdelta ja viideltä vuodelta. Kaksiulotteisen datan jaottelu ominaisuuksien mukaan ei tuottanut tyydyttävää tulosta tämänhetkisellä data-aineistolla.


Files in this item

Files Size Format View
gradu_MinnaHannula.pdf 2.716Mb PDF

This item appears in the following Collection(s)

Show full item record