Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by Title

Sort by: Order: Results:

  • Stark, Piritta (2022)
    In this study, single-grain rutile techniques (rutile U-Pb geochronology, Zr-in rutile thermometry, rutile Nb-Cr systematics and trace element composition) are applied on Red Clay samples from Lingtai, central-southern Chinese Loess Plateau (CLP), to reveal more detailed information on provenance of the Red Clay and wind regimes responsible for transporting the particles from source to sink between 7 Ma and 2.6 Ma. The new rutile data are combined with previous zircon U-Pb data from Lingtai and nearby Chaona to strengthen the interpretations with multi-proxy approach. The results suggest that from 7.05 Ma to 6.23 Ma the westerlies and the East Asian Winter Monsoon (EAWM) were relatively equally responsible for the sediment transportation to the CLP. At 5.55 Ma, the Red Clay was mostly derived from the westerly sources. At 3.88 Ma, contribution from northeastern Tibetan Plateau was most dominant suggesting enhanced East Asian Summer Monsoon (EASM) and surficial drainage from the source regions. At 3.20 Ma, the Red Clay was mainly sourced from proximal areas and fluctuation between EAWM and EASM had begun. This study demonstrates that single-grain rutile techniques have strong potential to aid a more precise distinction between individual primary and secondary sources for aeolian dust in the CLP region, especially when combined with zircon geochronology or other single-grain techniques. However, at present the applicability of rutile in provenance studies is hindered by scarcity of rutile data from the potential primary as well as secondary source regions, and lack of truly homogenous rutile standards for the analysis.
  • Kivisaari, Tero (2015)
    Changing consumer behavior drives the demand for convenient and easy-to-use mobile applications across industries. This also impacts the financial sector. Banks are eager to offer their services as mobile applications to match the modern consumer needs. The mobile applications are not independently able to provide the required functionality; they interact with the existing core business functions by consuming secure Web Services over the Internet. The thesis analyses the problem of how a bank can enable a new secure distribution and communication channel via the mobile applications. This new channel must be able to interact with existing core systems. The problem is investigated from different axis related to Web Services protocols suitable for mobile use, security solutions for the communication protocols and the required support available in the selected mobile operating systems. The result of the analysis is an architectural description to fulfil the presented requirements. In addition to constructing the architecture, the thesis also describes some of the more advanced threats targeted against mobile apps and Web Services and provides mitigation schemes for the threats. The selected architecture contains a modular security solution that can be utilized outside of the financial context as well. ACM Computing Classification System (CCS 2012): - Information systems → Web Services - Security and privacy → Software and application security - Software and its engineering → Software architectures
  • Boström, Jani (Helsingin yliopistoUniversity of HelsinkiHelsingfors universitet, 2000)
  • Tyree, Juniper (2023)
    Response Surface Models (RSM) are cheap, reduced complexity, and, usually, statistical models that are fit to the response of more complex models to approximate their outputs with higher computational efficiency. In atmospheric science, there has been a continuous push to reduce the amount of training data required to fit an RSM. With this reduction in costly data gathering, RSMs can be used more ad hoc and quickly adapted to new applications. However, with the decrease in diverse training data, the risk increases that the RSM is eventually used on inputs on which it cannot make a prediction. If there is no indication from the model that its outputs can no longer be trusted, trust in an entire RSM decreases. We present a framework for building prudent RSMs that always output predictions with confidence and uncertainty estimates. We show how confidence and uncertainty can be propagated through downstream analysis such that even predictions on inputs outside the training domain or in areas of high variance can be integrated. Specifically, we introduce the Icarus RSM architecture, which combines an out-of-distribution detector, a prediction model, and an uncertainty quantifier. Icarus-produced predictions and their uncertainties are conditioned on the confidence that the inputs come from the same distribution that the RSM was trained on. We put particular focus on exploring out-of-distribution detection, for which we conduct a broad literature review, design an intuitive evaluation procedure with three easily-visualisable toy examples, and suggest two methodological improvements. We also explore and evaluate popular prediction models and uncertainty quantifiers. We use the one-dimensional atmospheric chemistry transport model SOSAA as an example of a complex model for this thesis. We produce a dataset of model inputs and outputs from simulations of the atmospheric conditions along air parcel trajectories that arrived at the SMEAR II measurement station in Hyytiälä, Finland, in May 2018. We evaluate several prediction models and uncertainty quantification methods on this dataset and construct a proof-of-concept SOSAA RSM using the Icarus RSM architecture. The SOSAA RSM is built on pairwise-difference regression using random forests and an auto-associative out-of-distribution detector with a confidence scorer, which is trained with both the original training inputs and new synthetic out-of-distribution samples. We also design a graphical user interface to configure the SOSAA model and trial the SOSAA RSM. We provide recommendations for out-of-distribution detection, prediction models, and uncertainty quantification based on our exploration of these three systems. We also stress-test the proof-of-concept SOSAA RSM implementation to reveal its limitations for predicting model perturbation outputs and show directions for valuable future research. Finally, our experiments affirm the importance of reporting predictions alongside well-calibrated confidence scores and uncertainty levels so that the predictions can be used with confidence and certainty in scientific research applications.
  • Smirnov, Pavel (2022)
    There are many computationally difficult problems where the task is to find a solution with the lowest cost possible that fulfills a given set of constraints. Such problems are often NP-hard and are encountered in a variety of real-world problem domains, including planning and scheduling. NP-hard problems are often solved using a declarative approach by encoding the problem into a declarative constraint language and solving the encoding using a generic algorithm for that language. In this thesis we focus on pseudo-Boolean optimization (PBO), a special class of integer programs (IP) that only contain variables that admit the values 0 and 1. We propose a novel approach to PBO that is based on the implicit hitting set (IHS) paradigm, which uses two separate components. An IP solver is used to find an optimal solution under an incomplete set of constraints. A pseudo-Boolean satisfiability solver is used to either validate the feasibility of the solution or to extract more constraints to the integer program. The IHS-based PBO algorithm iteratively invokes the two algorithms until an optimal solution to a given PBO instance is found. In this thesis we lay out the IHS-based PBO solving approach in detail. We implement the algorithm as the PBO-IHS solver by making use of recent advances in reasoning techniques for pseudo-Boolean constraints. Through extensive empirical evaluation we show that our PBO-IHS solver outperforms other available specialized PBO solvers and has complementary performance compared to classical integer programming techniques.
  • Salmivaara, Antti (2020)
    Pseudodifferentiaalioperaattoreiden tutkimus nousi 1960-luvulla singulaaristen integraalioperaattoreiden tutkimuksesta. Vaikka esimerkiksi sellaiset tunnetut tulokset kuin Atiyah-Singerin indeksilause ja Alberto Calderónin todistama osittaisdifferentiaaliyhtälöiden Cauchy-ongelman yksikäsitteisyys käyttivät hyväkseen menetelmiä, joiden nykyään katsotaan kuuluvan pseudodifferentiaalioperaattoreiden alaan, termiä pseudodifferentiaalioperaattorit ryhdyttiin käyttämään vasta Lars Hörmanderin, Louis Nirenbergin ja Joseph J. Kohnin myötä vuodesta 1968 eteenpäin. Pseudodifferentialaioperaattoreiden tutkimuksessa erityisen mielenkiinnon kohteena on operaattorin muodostava symboli. Toisin kuin tavallisissa differentiaaliyhtälöissä, pseudodifferentiaalioperaattorin symboli on jokin yleinen funktio. Tässä työssä käsitellään pseudodifferentiaalioperaattoreita, joiden symbolit kuuluvat symboliluokkaan S^m, joka tarkoittaa sellaisia äärettömän monta kertaa derivoituvia jatkuvia funktioita, jota ovat rajoitettuja korkeintaan astetta m olevalla polynomilla. Ennen aiheen varsinaista käsittelyä määrittelemme luvussa kaksi Schwartzin avaruuden, temperoidut distribuutiot ja Sobolev-avaruuden H^s. Todistamme joitakin näiden avaruksien ominaisuuksia ja määrittelemme Fourier-muunnoksen ja käänteismuunnoksen. Kolmannessa luvussa määrittelemme pseudodifferentiaalioperaattoreiden symboliluokat astetta m ja astetta negatiivinen ääretön ja todistamme, että symbolien derivointi ja kertominen keskenään tuottavat symboleita. Lisäksi todistamme, että symboleille on olemassa asymptoottinen kehitelmä. Luvussa neljä käytämme hieman aikaa oskilloivien integraalien määrittelyyn ja todistamme, että tällaiset integraalit ovat rajoitettuja. Tämän jälkeen määrittelemme pseudodifferentiaalioperaattorit luvussa viisi käyttämällä edellisten lukujen tuloksia. Todistamme, että pseudodifferentiaalioperaattorit, joiden symbolit ovat edellämainituissa symboliluokissa, ovat jatkuvia kuvauksia Schwartzin avaruuden alkioille ja temperoiduille distribuutioille. Luvussa kuusi todistamme, että pseudodifferentiaalioperaatorilla on L^2-adjungaatti ja todistamme, että kahden operaattorin tulo on hyvin määritelty. Todistamme myös, että pseudodifferentiaalioperaattori on jatkuva kuvaus avaruudessa L^2 ja Sobolev-avaruuksissa. Lopuksi luvussa 7 esittelemme elliptiset pseudodifferentiaalioperaattorit ja todistamme, että tällaisten operaattoreiden käänteisoperaattori on löydettävissä modulo silotusoperaattorit parametriksien avulla.
  • Siipola, Janne (2019)
    Työssä on kaksi keskeistä teemaa: esitellä pseudodifferentiaalioperaattoreiden teoriaa ja todistaa tarkka Gårdingin epäyhtälö. Työhön on valittu erityisesti sellaisia pseudodifferentiaalioperaattoreihin liittyviä tuloksia, jotka tukevat tarkan Gårdingin epäyhtälön todistamista. Luvussa kaksi määritellään symboli ja esitetään kuinka symboli määrää pseudodifferentiaalioperaattorin. Lisäksi luvussa tarkastellaan pseudodifferentiaalioperaattoreiden ja lineaaristen osittaisdifferentiaalioperaattoreiden välistä yhteyttä. Luvun lopussa esitellään tulos, jonka mukaan pseudodifferentiaalioperaattori kuvaa Schwartz-avaruuden itselleen. Luku kolme aloitetaan määrittelemällä asymptoottinen kehitelmä. Luvussa osoitetaan teorian kaksi perustulosta: kahden pseudodifferentiaalioperaattorin tulo ja pseudodifferentiaalioperaattorin adjungaatti ovat pseudodifferentiaalioperaattoreita. Näihin kahteen perustulokseen sisältyy myöskin tieto siitä, mihin symboliluokkaan tulo-operaattorin ja adjungaatin symboli kuuluvat ja niiden symboleille esitetään asymptoottiset kehitelmät. Luvussa neljä esitellään ja todistetaan Gårdingin epäyhtälö ja tarkka Gårdingin epäyhtälö. Luvussa laajennetaan tietoja pseudodifferentiaalioperaattoreista siinä määrin kuin on välttämätöntä Gårdingin epäyhtälöiden todistamiseksi. Yksi merkittävä pseudodifferentiaalioperaattoreihin liittyvä tulos, joka todistetaan luvussa 4, sanoo, että luokan S^0 pseudodifferentiaalioperaattori kuvaan L^2-avaruuden itselleen. Tästä syystä luvun ensimmäinen kappale on nimetty L^2-teoriaksi. Luvussa sivutaan myös Sobolev-avaruuksien teoriaa, sillä se on kytköksissä Gårdingin epäyhtälöihin. Viidennessä luvussa tarkastellaan evoluutioyhtälöä. Päämääränä on antaa esimerkki tarkan Gårdingin epäyhtälön soveltamisesta. Tämä esimerkki on tulos, jonka mukaan kyseisen evoluutioyhtälön ratkaisulle on olemassa aikaestimaatti. Tarkastelun kohteena oleva evoluutioyhtälö määritellään pseudodifferentiaalioperaattorin avulla.
  • Leppä-aho, Janne Lauri Antero (2014)
    Multivariate Gaussian distribution is an often encountered continuous distribution in applied mathematics and statistics due to its well known properties and wide applicability. In the graphical models framework, we make use of graphs to compactly represent the conditional independences between a set of random variables. Combining these two together leads to the class of Gaussian graphical models. This thesis discusses learning of Gaussian graphical models from multivariate data. Given the data, our goal is to identify the graphical structure that specifies the conditional independence statements between the variables under consideration. Following the footsteps of Pensar et al [10], we adopt a Bayesian, score-based approach for learning graphical models. Using pseudo-likelihood to approximate the true likelihood allows us to apply results of Consonni et al [4] to compute marginal likelihood integrals in closed form. This results in a method that can be used to make objective comparisons among Gaussian graphical models. We test the method numerically and show that it can be readily applied in high-dimensional settings. According to our tests, the method presented here outperforms the widely used graphical LASSO method in accuracy. The structure of this thesis is as follows. The chapters 2-4 discuss graphical models, multivariate Normal distribution and Bayesian model comparison in general. The fifth chapter goes through the results derived by Consonni, which are utilised in the next chapter to develop a scoring function and a learning algorithm for Gaussian graphical model selection. In the sixth chapter, we test the method in practice and present the obtained numerical results. The last appendix chapter is dedicated to the consistency proof, which gives the theoretical justification for the presented method.
  • Leppänen, Heidi (2013)
    Pro gradu -tutkielma käsittelee pseudostationaarifaasin ja analyyttien välisten vuorovaikutusten määrittämistä misellisessä elektrokineettisessä kapillaarikromatografiassa (MEKC). Tässä menetelmässä elektrolyyttiliuokseen lisätään pinta-aktiivista ainetta, joka muodostaa misellejä, jos niiden konsentraatio ylittää ns. kriittisen misellikonsentraation ja Kraftin lämpötilan. Misellit toimivat sitten erotuksissa pseudostationaarifaasina. Yhdisteiden erottuminen perustuu niiden elektroforeettisiin liikkuvuuksiin ja jakautumiseen misellifaasin ja vesipohjaisen elektrolyyttisysteemin välille. Näytemolekyylin erottuminen perustuu sekä elektroforeettisiin että kromatografisiin mekanismeihin. Analyyttien ja pseudostationaarifaasin välisten vuorovaikutusten arvioiminen auttaa ymmärtämään näyteyhdisteiden retentiomekanismeja sekä erilaisten pseudostationaarifaasien ominaisuuksia. Tutkielmassa on käyty läpi analyyttien ja pseudostationaarifaasin välisiä vuorovaikutuksia ilmaisevien tekijöiden määrittämistä. Yleisimmin vuorovaikutuksien kuvaamiseen on käytetty retentiotekijää ja jakautumisvakiota. Tutkielmassa on käsitelty myös analyyttien ja pinta-aktiivisen aineen monomeerien välisiä vuorovaikutuksia sekä ionisten yhdisteiden retention mallintamista. Vuorovaikutusten määrittämiseen ja pseudostationaarifaasien karakterisointiin on kehitetty erilaisia matemaattisia mallinnusmenetelmiä. Malleja kehitettäessä pyritään siihen, että ominaisuuksia ja retentiota voitaisiin arvioida ilman laajoja, aikaa vieviä kokeellisia mittauksia. Yleisimmin käytetty matemaattinen malli on lineaarinen solvaatioenergiasuhde. Sen avulla pyritään selvittämään vuorovaikutuksia, jotka kontrolloivat erilaisten misellifaasien retentiota ja selektiivisyyttä. Lineaarista solvaatioenergiasuhdetta hyödyntävät tutkimukset ovat osoittaneet, että hydrofobisten vuorovaikutusten lisäksi myös pinta-aktiivisen aineen pääryhmän spesifisimmillä vuorovaikutuksilla on merkitystä analyyttien retentioon ja selektiivisyyteen. Toinen varsin yleisesti käytetty matemaattinen malli on kvantitatiivinen rakenteen ja aktiivisuuden/retention malli, jolla yleensä pyritään selittämään yhdisteen retentiota käyttämällä yhtälössä tekijöitä, jotka perustuvat yhdisteiden rakenteellisiin ominaisuuksiin. Näiden mallien käyttö misellisessä elektrokineettisessä kapillaarikromatografiassa on vielä vähäistä verrattuna niiden käyttöön nestekromatografisissa menetelmissä. Tutkielmassa on esitelty lineaarista solvaatioenergiasuhdetta ja kvantitatiivista rakenteen ja aktiivisuuden/retention mallia hyödyntäviä julkaisuja vuosilta 2002–2012. Tutkielman kokeellisessa osassa perehdyttiin tähtipolymeerien ja liposomien käyttöön pesudostationaarifaaseina. Tarkoituksena oli tutkia kahdeksan sakaraisten tähtipolymeerien polymetyylimetakrylaatti-b-polyakryylihapon ja polybutyylimetakrylaatti-b-polyakryylihapon kykyä kompleksoida fullereenia määrittämällä analyytin ja pseudostationaarifaasin välisiä vuorovaikutuksia. Fullereeneilla ei havaittu olevan vuorovaikutuksia tähtipolymeerien muodostaman pseudostationaarifaasin kanssa. Kokeellisen osan toisessa osassa selvitettiin kaupallisen lipidipohjaisen Intralipidi-emulsion ja kahden muun liposomidispersion vuorovaikutuksia yhdeksän yleisesti käytetyn huumaus- ja lääkeaineen kanssa. Liposomit pseudostationaarifaasina mahdollistivat liposomien ja lääkeaineiden vuorovaikutusten tutkimisen.
  • Mannelli, Petriina (2019)
    Psykotrooppiset lääkeaineet vaikuttavat potilaan psyykeeseen. Tällaisiä lääkeaineita ovat esimerkiksi antipsykoottiset ja antidepressiiviset lääkeaineet. Ne ovat tehokkaita tautien hoidossa, mutta vakavien haittavaikutusten välttämäiseksi lääkeaineenpitoisuuden tasoa tulee seurata. Terapeuttisessa lääkkeen monitoroinnissa on tärkeää toteuttaa seurantasuunnitelmaa, etenkin klotsapiiniä sekä norklotsapiini käyttävien potilaiden kohdalla. Tämän maisterin tutkielman kirjallisessa osassa tarkastastellaan psykotrooppisten lääkeaineiden luokituksia ja molekyylirakennetta. Lisäksi siinä esitellään neste- ja kaasukromatografisia erotusmenetelmiä eri detektoreilla, sekä nestekromatografinen laitteisto. Kromatografiset menetelmät ovat tärkeässä roolissa nykyaikana määritettäessä psykotrooppisia lääkeaineita. Massaspektrometrin käyttö detektorina on yleistynyt huomattavasti, mutta kliinisessä työssä suositaan myös UV-Vis- detektoreja tai diodirividetektoreja. Usein näytteen esikäsittelyssä käytetään aikaa vievää sekä kallista neste-neste uuttoa. Joskus käytetään myös kapillaarissa tapahtuvaa kiinteäfaasiuuttoa tai saostusta. Tutkielman kokeellisessa osassa validoitiin analyysimenetelmä, LC-MS/MS, joka oli lineaarinen, selektiivinen, tarkka ja yksityiskohtainen, sekä toistettava. Lyhyt retentioaika, tehokas ja helppo näytteenesikäsittely saostamalla ja Tecan nesteensiirtorobotilla tehtävä näytteensiirto rutiinianalysointia varten oli suuri etu verrattuna käytössä olleeseen HPLC-UV/Vis- menetelmään. Nykyisellä kuoppalevyllä voidaan tehdä 96- näytteen sarja kun aiemmin pystyttiin analysoimaan vain 50 näytteen sarja. Menetelmä paransi myös muiden analysoitavien näytteiden häiritsevyyttä tarkemmalla detektorilla. Lisäksi tarkoituksena oli vähentää orgaanisten liuottimien kulutusta muuttamalla neste-nesteuutto proteiinien saostukseksi.
  • Nissinen, Hannu (2013)
    We consider the problem of finding a reasonable logical characterization for the complexity class PTIME in the class of all finite models. We approach this problem by adding a set Q_n of n-ary generalized quantifiers to the infinitary finite variable logic L^k_{∞ Ω}. More precisely, we show that it is not possible to characterize PTIME in such a way. This result is obtained by constructing models A(G) and B(G) which are L^k_{∞ Ω}(Q_n)-equivalent and by showing that there is a PTIME computable boolean query q such that q(A(G)) \neq q(B(G)) for any appropriate finite graph G.
  • Pärtel, Martin (2014)
    Ohjelmoinnissa puhdas funktio ei vaikuta ohjelman tilaan muuten kuin palauttamalla paluuarvon, joka riippuu ainoastaan annetuista parametreista. Jotkut ohjelmointikielet sallivat lähtökohtaisesti vain puhtaiden funktioiden kirjoittamisen. Nämä kielet ovat yleensä tyyliltään 'funktionaalisia', eli ne suosivat funktion toteutuksen esittämistä yhtenä lausekkeena tavanomaisemman 'imperatiivisen' lausejonon sijaan. Tutkielmassa esitellään uusi ohjelmointikieli Uniic, joka on tyyliltään imperatiivinen, mutta sallii vain puhtaiden funktioiden kirjoittamisen. Uniic käännetään puhtaasti funktionaaliselle kohdekielelle, mikä estää suunnittelemasta kieleen epäpuhtaita ominaisuuksia. Kääntäjästä on toteutettu prototyyppi. Funktionaalisessa kohdekielessä on Clean-kieleen perustuva uniikkityypitysjärjestelmä. Uniikkityypitys mahdollistaa epäpuhtaiden operaatioiden turvallisen mallintamisen rajoittamalla uniikiksi merkityt arvot yhteen käyttökertaan. Uniicin lähdekielessä on rakenne nimeltä lainaus, jolla ohjelmoija voi näennäisesti käyttää uniikkia arvoa monta kertaa. Lainaus on toteutettu siten, ettei kohdekielen uniikkityypitysjärjestelmää tarvitse muuttaa. Uniicin imperatiiviset piirteet sekä lainaus mahdollistavat koodin kirjoittamisen imperatiivisella tyylillä monessa tilanteessa, jossa olemassa olevat puhtaat kielet pakottavat funktionaaliseen tyyliin. Yritykset laajentaa Uniicia kielen puhtautta menettämättä auttavat hahmottamaan funktionaalisen ja imperatiivisen ohjelmoinnin eroavaisuuksia ja toisaalta myös potentiaalisia samankaltaisuuksia.
  • Sipilä, Suvi (2020)
    Clean and high-quality code affects the maintainability of software throughout the software lifecycle. Cleanliness and high-quality should be pursued from the software development phase. Nowadays, the software is developed rapidly, which is why the code must be easy to maintain. When the code is easy to maintain, it can basically be managed by any software developer. The thesis conducted a literature review of clean and high-quality code. The thesis aimed to find out what is clean and high-quality code in the class and function level. The purpose of the thesis was to explain why clean and high-quality code is necessary and how the clean and high-quality code can be improved with different tools such as metrics, refactoring, code review, and unit tests. The thesis also included a survey for software developers. The survey sought an answer to how clean and high-quality code practices are implemented in working life from the perspective of software developers. 103 software professionals responded to the survey. Based on the responses, 82,5 \% of respondents felt that they always or usually write clean and high-quality code. The main reasons why clean and high-quality code cannot be written were the challenges of the old codebase and schedule pressures. Writing code is a very people-oriented job, so we must understand the code and its purpose. The code must be simple and carefully written. When the code is clean and high-quality, it is easier to read and understand, and thus easier to maintain.
  • Vuoristo, Varpu (2021)
    Puolueiden kannatusmittaukset vaalien välillä tehdään kyselytutkimusten avulla. Näitä mielipidetiedusteluita kutsutaan kansankielellä termillä gallup. Tässä työssä perehdytään poliittisten mielipidetutkimusten historiaan sekä tehdään lyhyt katsaus galluppien nykytilanteeseen Suomessa. Tässä maisterintutkielmassa on ollut käytössä kyselytutkimuksella kerätyt aineistot. Aineistoissa on kysytty vastaajien äänestyskäyttäytymistä seuraavissa vaaleissa: kuntavaalit 2012, eduskuntavaalit 2015 sekä kuntavaalit 2017. Tutkielmassa esitellään kyselytutkimuksien kysymyksen asettelu, aineistojen puhdistamisen työvaiheita sekä perusteet mitkä tiedot tarvitaan tilastollisen mallin sovittamista varten. Teoriaosuudessa esitellään yleistettyjä lineaarisia malleja. Menetelmänä sovitetaan yleistetty lineaarinen malli valittuihin ja puhdistettuihin aluperäisten aineistojen osa-aineistoihin. Näissä osa-aneistoissa on tiedot vastaajien äänestyskäyttäytymisestä kahdeksan eri eduskuntapuolueen kesken. Lisäksi tilastollisen mallin sovittamista varten osa-aineistossa on tiedot vastaajien sukupuolesta sekä asuinpaikasta NUTS 2 -aluejaon mukaisesti. Sukupuoli ja viisi eri aluetta toimivat mallissa selittävinä muuttujina, kun taas puoluekannatus selitettävänä muuttujana. Aineiston käsittely on toteutettu R-laskentaohjelmalla. Tuloksissa on esitetään taulukointina selittävien muuttujien vaikutusta tarkasteltavan puolueen äänestämiseen, niin itsenäisinä selittäjinä kuin niiden yhteisvaikuksina. Jokaista kahdeksaa puoluetta tarkastellaan kaikkien kolmen vaaliaineiston osalta erikseen. Analysoinnin työkaluina toimivat suurimman uskottavuuden estimaattit sekä niiden luottamusvälit.
  • Kaasinen, Joel (Helsingin yliopistoHelsingfors universitetUniversity of Helsinki, 2011)
    The study of compressed data structures strives to represent information on a computer concisely — using as little space as possible. Compressed bit vectors are the simplest compressed data structure. They are used as a basis for more complex data structures with applications in, for example, computational biology. Functional programming is a programming paradigm that represents computation using functions without side-effects (such as mutation). Data structures that are representable in and suitable for functional programming are termed functional data structures. Functional data structures are also persistent: operations on them do not destroy previous versions. This thesis provides implementations of functional compressed bit vectors in the purely functional programming language Haskell. The implemented structures are analyzed and benchmarked against established imperative (C++) implementations. Applications of compressed bit vectors are also surveyed. This includes compressed wavelet trees, an implementation of which is also presented.
  • Laapas, Mikko (Helsingin yliopistoHelsingfors universitetUniversity of Helsinki, 2008)
    Tämä työ käsittelee Suomen ilmastoa puutarhakasvien näkökulmasta painopisteen ollessa lämpöilmastollisissa piirteissä ja kasvien talvehtimiseen liittyvissä tekijöissä. Työssä esitellään puutarhakasvien, erityisesti monivuotisten puuvartisten kasvien selviytymiseen vaikuttavia tekijöitä, ja näiden pohjalta kartoitetaan ilmastollisia olosuhteita eri puolilla Suomea viimeisen noin viiden vuosikymmenen ajalta. Lisäksi pyritään arvioimaan tuleville vuosikymmenille ennustetun lämpenemisen aiheuttamia muutoksia Suomen puutarhatuotannon menestymismahdollisuuksissa. Nykyilmaston osalta tarkastelu perustuu vuosien 1960-2006 päivittäisiin lumi- ja lämpötilahavaintoihin kymmenellä havaintopaikalla lounaisrannikolta Koillismaalle. Puutarhakasvien kannalta hyödyllisiä ja haitallisia ilmaston piirteitä pyrittiin kuvaamaan erilaisilla indekseillä, ns. kynnystapahtumien ajankohdilla ja erinäisten raja-arvojen ylittymisillä. Tulevaisuuden jaksojen 2010-39 ja 2040-69 osalta tilannetta tarkasteltiin A2- ja B1-skenaariossa. Työssä käytettiin ns. delta-menetelmää, missä 19 ilmastomallin keskiarvona saadut arviot kuukausikeskilämpötilojen noususta lisättiin havaintopaikkojen päivittäisiin vuosien 1971-2000 lämpötilahavaintoihin. Olosuhteet puutarhakasvien menestymiselle vaihtelevat paljon tarkastelussa olleella kolmelle kasvimaantieteelliselle vyöhykkeelle sijoittuvalla alueella. 1990-luvun alusta lisääntyneet leudot talvet näkyvät hyvin talvehtimisoloja kuvaavissa muuttujissa. Toisaalta havaintopaikkojen pienilmastolliset tekijät korostuvat erityisesti alueiden hallatilanteita tarkasteltaessa. Tulevaisuuden osalta monien puutarhakasvien talven selviytymisedellytyksiin vaikuttavien tekijöiden voidaan odottaa yleisesti parantuvan ilmaston lämmetessä, tosin Suomen ilmastossa pakkasvahinkojen riski on silti olemassa. Toisaalta entisestään leudontuvat talvet lämpöjaksoineen tulevat lisäämään mahdollisuutta kasvien kylmänkestävyyden heikkenemisestä aiheutuville ongelmille. Myöhäisten hallojen esiintymisen aiheuttamat vahingot riippuvat niitä edeltäneen ajan kasvuolosuhteista. Tällöin kasvukauden alun ajankohdassa, sen alkupuolen lämpimyydessä ja hallojen esiintymisen ajankohdassa tapahtuvien muutosten nettovaikutus ratkaisee myöhäisten hallatilanteiden kukinnalle muodostavan riskin tulevaisuudessa. Tästä ei saatu yksiselitteisiä tuloksia tämän tutkimuksen puitteissa, sillä hallariskiä kuvaavan indeksin käyttäytyminen oli varsin epämääräistä.
  • Mattila, Mari (2023)
    Tilastokeskuksessa haluttiin kehittää omakotitalojen lämmitysöljyn käyttöä ja lämmitystapaa ku- vaavia tilastoja. Asumisen rahoitus- ja kehittämiskeskuksen ylläpitämä energiatodistusrekisteri näh- tiin yhdeksi mahdolliseksi aineistoksi, jota kehittämisessä voisi käyttää. Kun energiatodistusrekis- terin aineistoa alettiin tarkastella, huomattiin, että energiatodistusrekisteriin valikoituu keskimää- räistä suurempia ja uudempia rakennuksia. Valikoituneisuuden oletettiin muodostuvan keskeiseksi ongelmaksi energiatodistusrekisterin hyödyntämisessä. Tutkimuskysymykseksi muotoutui, ovatko rakennuskannan öljylämmitteisten omakotitalojen tiedot lämmitystavasta ja pinta-alasta energia- todistusrekisterissä yleistettävissä koko rakennuskantaan. Koska valikoituneisuus on yksi puuttuneisuuden ilmenemismuoto, tutkimuksen teoriaosuudessa pää- tettiin keskittyä puuttuneisuuteen. Puuttuneisuuden mekanismi on tutkimuksen teoriaosan kes- keisimpiä käsitteitä. Puuttuneisuuden mekanismi voi olla täysin satunnainen, satunnainen tai ei- satunnainen. Puuttuneisuuden mekanismi vaikuttaa siihen, mitä tilastollisia menetelmiä aineiston mallintamiseen soveltuu. Tässä tutkimuksessa puuttuneisuuden oletettiin olevan ei-satunnaista. Kun puuttuneisuuden mekanismi on ei-satunnainen, puuttuneisuutta käsitellään yleensä satunnai- silmiönä. Tutkimuksen aineistolle ja puuttuneisuutta kuvaavalle puuttuneisuusindikaattorille muo- dostetaan tilastollinen malli, johon voidaan soveltaa uskottavuuspäättelyä. Tutkimuksessa malliksi valittiin Heckmanin valintamalli. Malli on tarkoitettu käytettäväksi silloin, kun aineisto on valikoitunut tutkittavan ilmiön perusteella. Esimerkiksi öljyn kulutus voidaan esti- moida vain öljylämmittäjistä muodostetun aineiston perusteella. Hackmanin mallilla voidaan ottaa huomioon se, että ölyn kulutus puuttuu niiltä taloilta, jotka eivät lämmitä öljyllä. Kun Heckmanin malli oli estimoitu, sen hyvyyttä arvioitiin ristiinvalidoimalla. Ristiinvalidoinnissa ennustettiin öljylämmityksessä pysymistä. Malli ennusti vain noin 58 % tapauksista oikein. Tätä onnistumisprosenttia pidettiin liian pienenä, jotta mallia kannattaisi käyttää Tilastokeskuksessa energiankulutustietojen korjaamiseen. Syitä mallintamisen epäonnistumiselle voi olla esimerkiksi se, että öljylämmityksen vaihtaminen tapahtuu pitkän aikaikkunan sisällä. Mallin selittäjien vaikutus vasteeseen voi vaihdella eri ajan- kohtina. Malli ei ottanut aikaa huomioon, vaan kaikki asuntokunta kuvaavat muuttujat oli keskiar- voistettu. Malliyhtälö saattoi olla väärä myös siitä näkökulmasta, että siitä saattoi puuttua tärkeitä kotitalouskohtaisia selittäjiä, joita ei vain ollut rekisteriaineistosta saatavilla.
  • Bergman, Paula (2017)
    Imputoinnilla tarkoitetaan sellaisia tilastollisia menetelmiä, joiden tarkoitus on täydentää puuttuvuutta sisältävää aineistoa. Puuttuvuus on iso ongelma tutkimuksissa, ja usein puuttuvat havainnot ja jopa kokonaiset havaintorivit jätetään huomiotta analyysejä tehdessä. Tämä voi kuitenkin merkittävästi vääristää analyysien tuloksia. Tässä tutkielmassa esitellään erilaisia puuttuvuuden tyyppejä, käydään läpi puuttuvuuden mahdollisia syitä ja perehdytään erilaisiin imputointimenetelmiin. Imputointimenetelmien käyttöä havainnollistetaan esimerkeillä, jotka liittyvät GeneRISK-tutkimuksen perustietokyselyyn. GeneRISK-tutkimuksella pyritään selvittämään erityisesti sydän- ja verisuonitautien taustalla piileviä perinnöllisiä riskitekijöitä, sekä sitä, kuinka riskitiedon saaminen vaikuttaa yksilöiden myöhempään terveyskäyttäytymiseen. Puuttuvuuden tyyppi vaikuttaa imputointimenetelmän valintaan, ja tutkielmassa esitelläänkin niin täysin satunnainen, satunnainen, kuin ei-satunnainenkin puuttuvuus. Lisäksi sivutaan suunniteltua puuttuvuutta ja aineiston rakentamisvaiheessa syntyvää puuttuvuutta. Jos vastauksia puuttuu yksittäisiltä vastaajilta osasta kysymyksiä, on kyse erävastauskadosta, ja jos aineistosta puuttuu kokonaisia havaintorivejä, puhutaan yksikkövastauskadosta. Tutkielmassa keskitytään erävastauskatoon. Tutkielmassa käytetään GeneRISK-tutkimuksen Kymenlaakson sairaanhoito- ja sosiaalipalvelujen kuntayhtymä Carean perustietokyselyaineistosta 18.1.2016 jäädytettyä otosta, ja sieltä valikoituja 1278 havaintoriviä. Tutkielmaan valikoitiin kiinnostuksen kohteena oleviksi muuttujiksi ruokailuun ja liikuntatottumuksiin liittyviä muuttujia, sekä taustamuuttujia. Aineistosta poistettiin kaikki sellaiset rivit, jotka sisälsivät puuttuvuutta näissä muuttujissa, ja tämän jälkeen täydelliseen aineistoon simuloitiin eri tyyppisiä puuttuvuuksia. Puuttuvuutta pyrittiin korjaamaan niin yksinkertaisilla imputointimenetelmillä kuin kahdella erilaisella moni-imputointimenetelmälläkin. Yksinkertaisiin imputointimenetelmiin lukeutuu mm. mediaani-imputointi. Ehdollisten mallien moni-imputoinnin ja yhdistettyjen mallien moniimputoinnin on osoitettu kirjallisuudessa toimivan paremmin kuin yksinkertaisten imputointimallien, mutta tätä ei tässä tutkielmassa pystytty osoittamaan. Yhtenä syynä tähän saattaa olla kiinnostuksen kohteeksi valikoituneiden muuttujien väliset riippumattomuudet, sekä vastaajien keskinäinen samankaltaisuus. Edelleen hyvin yleinen tapa käsitellä puuttuvuutta on jättää se kokonaan huomiotta. Tutkielmassa kuitenkin huomataan, kuinka radikaaliin aineiston hupenemiseen se voi johtaa. Tutkielmassa osoitetaankin erityisesti se, kuinka tärkeää puuttuvuutta on tarkastella monelta eri kantilta aina puuttuvuuden syistä aineiston jatkokäyttötarkoituksiin asti.
  • Renkonen, Taina (2014)
    How is geopolitical knowledge produced though guided tours? This Master's thesis examines this question by comparing guided walking tours conducted in the Old City of Jerusalem. The theoretical framework of the study combines critical geopolitics, multidisciplinary tourism research, and landscape studies. From this perspective tourism is approached not as a mere industry but as a potentially efficient identity-political tool. The data, which was collected through ethnographic participant observation, included both 'traditional' tours recommended by the Official Tourism Office as well as 'alternative tours' connected to the wider anti-Occupation movement within the Israeli civil society. These tours were compared in the light of the following research questions: (1) What kind of geopolitical visions the tours produced about the city and the wider conflict? (2) How landscape was utilized in order to articulate these viewpoints? (3) How did the answers of the previous questions relate to the wider social and political context? Iconographical framework structured the analysis of these tours and attention was paid to visual landscape texts, verbal narratives as well as corporeal choreographies. The analysis revealed two contrasting narratives of the city. Tours representing the official tourism sector promoted geographical imagination in which Jerusalem is the eternal capital of Israel. This stance was supported by three discursive landscapes. 'Biblical landscape' produced Jerusalem as a part of the Holy land shared by Jews and Christians where Islam and Muslims were presented as outsiders. 'Zionist landscape' established a continuum for it in the context of modern nation-states by focusing on the national narrative behind the State of Israel. 'Orientalist landscape' focused on the present conflict in multiple scales and justified the Israeli policy towards its adversaries. Alternative tours were based on a geographical imagination in which East Jerusalem is perceived as being Israeli-occupied territory and thus part of the larger process of colonizing the historical Palestine. The space of the Old City was divided into two discursive landscapes. 'Lost landscape' illustrated how the historical Palestine had been transformed into the State of Israel; whereas 'Occupied landscape' focused on mapping the expansion of the ongoing occupation and highlighted the asymmetrical power relationships between the conflicting parties. The study demonstrated that guided tours can be utilized both for advocating nationalist agenda and as tools of resistance.
  • Tarnanen, Ainokaisa (2017)
    Transportation in cities is facing the challenges of congestion and environmental impact caused by the increase in traffic flows. These issues can be reduced by promoting more sustainable transport modes, such as cycling. To increase its modal share, cycling has to be an attractive and competitive choice compared to other travel modes. Digital Geography Lab in University of Helsinki has developed comparable measures for modelling accessibility with different travel modes in Helsinki region. However, cycling is missing from the data because it has been previously modelled with simplistic assumptions of constant travel speed. Little research has been carried out to assess the applicability of this assumption. The main objective of this thesis is to develop a more realistic GIS model for calculating optimal routes and travel times of cycling in Helsinki region taking into account the feasibility of the model. Other objectives are to find out what factors affect cyclists' travel speed and can the environmental factors be used as impedances in the travel time model, what kind of spatial differences the cycling speeds have, and how realistic it is to model cyclists' travel times with constant speed on a regional scale. According to previous research, among the various things affecting cycling some of the main environmental factors are slope, junctions and traffic lights. The effects of these factors to cycling speeds in Helsinki region were analysed based on individual cycling routes and on a route and segment level from the whole data with linear regression models. GPS data of cycling was collected from volunteers who had been tracking their cycling in Helsinki region with mobile sports applications. Basic background information of the cyclists was also collected to analyse the variations in speed between different background variables. Road network for cycling and walking by Helsinki Region Transport was used as the modelling network. A GIS-based map-matching method for the cycling GPS data was developed by applying a method developed for map-matching GPS data of cars. Slope was calculated for route segments using NLS 2 meter digital elevation model and the traffic light information was derived from Digiroad. Python scripts used in modelling are available on GitHub. The cycling speeds vary by cycling frequency: cyclists who stated to cycle almost every day of the week, 3-5 times a week, or a few times a week have median speeds of 24 km/h, 22 km/h and 18 km/h, respectively. Uphill slope and signalized junctions decelerate and downhill slopes accelerate cycling speeds on individual routes. Looking at the whole data, speed has a weak negative correlation between slope and different junction types. On a regional scale the effect of signalized junctions is the greatest, whereas uphill slope has the greatest effect on route-based mean speeds. The regression models do not explain the variation in cycling speeds very well (R2 ≈ 0.1) so a travel time model based on constant speeds corresponding to the different median speeds of frequent and less frequent cyclists was implemented on the network. Spatial examination shows that mean cycling speeds in parts of central Helsinki are 0.8 times slower than in rest of the area, so the cycling speeds of the model were slowed down on those segments. Slope, traffic lights and other junctions affect cycling speeds on an individual level but not on the regional scale. Based on model validation the travel times of the constant speed model correlate strongly with the real travel times of the GPS data. The model taking into account the slower parts of central Helsinki is marginally better but the difference is only slight and affecting only the routes going via the city centre. The difference in travel times caused by different constant speeds is much greater. Constant speed can hence be seen as an adequate assumption to model cyclists' travel times in Helsinki region but the personal and spatial differences in cycling speeds should be taken into account.