Automatic identification of land cover types from satellite data with machine learning techniques
Title: | Automatic identification of land cover types from satellite data with machine learning techniques |
Author(s): | Huusari, Riikka |
Contributor: | University of Helsinki, Faculty of Science, Department of Mathematics and Statistics |
Discipline: | Applied Mathematics |
Language: | English |
Acceptance year: | 2016 |
Abstract: |
This study is part of the TEKES funded Electric Brain -project of VTT and University of Helsinki where the goal is to develop novel techniques for automatic big data analysis. In this study we focus on studying potential methods for automated land cover type classification from time series satellite data. Developing techniques to identify different environments would be beneficial in monitoring the effects of natural phenomena, forest fires, development of urbanization or climate change.
We tackle the arising classification problem with two approaches; with supervised and unsupervised machine learning methods. From the former category we use a technique called support vector machine (SVM), while from the latter we consider Gaussian mixture model clustering technique and its simpler variant, k-means.
We introduce the techniques used in the study in chapter 1 as well as give motivation for the work. The detailed discussion of the data available for this study and the methods used for analysis is presented in chapter 2. In that chapter we also present the simulated data that is created to be a proof of concept for the methods. The obtained results for both the simulated data and the satellite data are presented in chapter 3 and discussed in chapter 4, along with the considerations for possible future works. The obtained results suggest that the support vector machines could be suitable for the task of automated land cover type identification. While clustering methods were not as successful, we were able to obtain as high as 93 % accuracy with the data available for this study with the supervised implementation.
Tutkielma on osa TEKES-rahoitteista VTT:n ja Helsingin yliopiston Electric Brain -projektia, jonka tarkoituksena on kehittää tekniikoita automaattiseen suurien datamäärien käsittelyyn. Tämä työ keskittyy tutkimaan potentiaalisia menetelmiä automaattiseen maanpeittotyyppien tunnistukseen aikasarjaluonteisesta sateliittidatasta. Tällaiset automaattiset seurantamentelmät olisivat hyödyllisiä erilaisten luonnon- ja muiden ilmiöiden tarkkailuun; mahdollisia seurantakohteita ovat esimerkiksi metsäpalot, urbaanien alueiden kehittyminen ja ilmastonmuutoksen aiheuttamien muutosten tarkkailu.
Lähestymme luokitteluongelmaa kahdesta lähtökohdasta: ohjatun ja ohjaamattoman koneoppimisen menetelmillä. Ensimmäisestä kategoriasta käytämme tekniikkaa nimeltä tukivektorikone, kun taas jälkimmäisessä keskitymme klusterointiin Gaussisilla sekoitemalleilla ja niiden yksinkertaisemmalla versiolla, k-means -menetelmällä.
Esittelemme työssä käytettävät tekniikat ja motivaatiota työlle kappaleessa yksi. Tarkemmin nämä tekniikat käsitellään kappaleessa kaksi, jossa myös esitellään työss\ä käytettävä data, sekä simuloitu data joka on luotu tekniikoiden toimivuuden testaamiseksi. Tulokset sekä simuloidulla että oikealla datalla esitellään kappaleessa kolme. Keskustelemme tuloksista ja mahdollisista laajennoksista työlle kappaleessa neljä. Saadut tulokset viittaavat siihen, että tukivektorikone voisi olla soveltuva menetelmä tämäntyyppiseen sateliittidatan analysointiin. Korkein saavutettu tarkkuus tukivektorikoneilla maanpeittotyyppejä luokitellessa oli 93 %, joka oli huomattavasti parempi kuin klusterointimenetelmillä saavutetut tulokset.
|
Files in this item
Files | Size | Format | View |
---|---|---|---|
graduHuusari.pdf | 2.970Mb |
This item appears in the following Collection(s)
-
Faculty of Science [4253]