Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by discipline "Tillämpad matematik"

Sort by: Order: Results:

  • Luhtaniemi, Sandra (2016)
    Opinnäytetyössä tarkastellaan ihmisen papilloomavirus- eli HPV-infektion (Human Papillomavirus) kehittymistä simuloiduilla aineistoilla. Infektion kulkua mallinnetaan Markovilaisella mallilla, jonka tilajoukko koostuu infektion eri terveystiloista. Mallista simuloidaan eri simulointiskenaarioilla aineistot, joista estimoidaan infektion paranemisen hasardi. Simulointiskenaarioissa eri HPV-tyyppien aiheuttamat infektiot jaotellaan nopeasti, keskinopeasti ja hitaasti parantuviin infektioihin. Aineistolle muodostetaan eksponenttifunktioon perustuva uskottavuusfunktio, jonka maksimoiva parametri estimoidaan käyttäen Metropolis-Hastings -algoritmia. Työn tavoitteena on tutkia, kuinka paranemisen hasardiin vaikuttaa, että syövän esiasteeksi edenneet infektiot on havaitsemisen jälkeen hoidettu. Työn muita keskeisiä teemoja on Metropolis-Hastings -algoritmin teoriaan ja toimintaperiaatteisiin perehtyminen. Metropolis-Hastings -algoritmi on Markovin ketjun Monte Carlo eli MCMC-algoritmi, jolla voidaan tuottaa näytteitä jostakin halutusta todennäköisyysjakaumasta. Algoritmia käytetään myös erityisesti, kuten tässä opinnäytetyössä tehdään, uskottavuusfunktion maksimin antavien parametrien estimoimiseen silloin, kun uskottavuusfunktion maksimi on analyyttisesti hankalaa ratkaista. Papillomavirusinfektio on yleisin sukupuoliteitse tarttuva tauti. HPV-tyyppejä tunnetaan yli 100 erilaista, joista 14 pidetään korkean riskin tyyppejä, joiden aiheuttama tulehdus pitkittyessään voi aiheuttaa kohdunkaulansyöpään johtavia solumuutoksia. Infektiolta suojaava rokote on nykyisin useissa maissa osa kansallista rokotusohjelmaa. Suomessa käytössä olevan rokotteen tehoa tutkittiin laajalla kansainvälisellä PATRICIA-rokotetutkimuksella. Tutkimusprotokollan mukaan ne henkilöt, joilla seurannassa havaittiin syövän esiaste, lähetettiin jatkotutkimuksiin tai hoitoon. PATRICIA-tutkimuksessa kerätyn havaintoaineiston pohjalta Terveyden ja hyvinvoinnin laitoksella on lähivuosina tehty HPV-infektion kulun väestötason mallinnus, missä esiasteiden hoitoja ei kuitenkaan huomioitu, sillä niiden vaikutus oletettiin pieneksi. Tämän tutkielman keskeisin tehtävää on PATRICIA-aineistoa jäljittelevää simuloitua aineistoa käyttäen arvioida, että oliko oletus perusteltu, vai onko esiasteiden hoidolla merkittävää vaikutusta infektion paranemisen hasardiin.
  • Komulainen, Tiia Hannele (2014)
    Kokonaiskorvauksella tarkoitetaan korvaussummaa, jonka vakuutusyhtiö maksaa kokonaisuudessaan eri asiakkailleen tietyn ajan kuluessa. Vakuutusyhtiöllä on mahdollisuus varautua kokonaiskorvauksen suuruuteen laskemalla sille todennäköisyysjakauma ja kertymäfunktio. Tässä Pro gradu -tutkielmassa esitellään kolme tapaa laskea henkivakuutusyhtiön kokonaiskorvauksen todennäköisyysjakauma kahdessa eri riskimallissa: Panjerin rekursio kollektiivisessa riskimallissa sekä de Pril'in ja Kornyan rekursio individuaalisessa riskimallissa. Luvussa kaksi on esitelty kollektiivinen ja individuaalinen riskimalli. Luvut kolme ja neljä pitävät sisällään rekursioiden määrittelyt ja niiden todistukset. Viimeinen luku sisältää käytännön esimerkin, jossa näillä kolmella laskentamenetelmällä on laskettu kokonaiskorvauksen kertymäfunktio esimerkin vakuutusjoukolle.
  • Raiko, Henriikka (2013)
    Henkivakuuttajan arvioidessa sopimusten hinnoittelua ja mahdollisiin tuleviin menetyksiin liittyviä riskejä on korko- ja kuolevuusoletuksilla suuri merkitys. Tappio tai menetys on määrä, jolla sopimuksen kulut ylittävät tuotot. Korkoriskillä tarkoitetaan korkojen tulevien muutosten aiheuttamaa epävarmuutta eli toteutuvan tuoton tai kulun poikkeamista odotusarvostaan. Henkivakuutussopimukset ovat tyypillisesti pitkäaikaisia sopimuksia, joten korkoriski on merkittävä sopimusten hinnoitteluun, ja vastuuvelan ollessa markkinaehtoinen, sen hallintaan liittyvä riski. Kuolevuusriskillä tarkoitetaan sitä, että kuolevuus ei toteudu niin kuin on mallinnettu. Tutkielmassa tarkastellaan annuiteettien ja henkivakuutusten arvon määrittämiseen vaikuttavia asioita, joista keskeisimpiä ovat kuolevuusriski sekä korkoriski. Tutkielmassa keskitytään pääasiassa korkoriskiin eli tarkastellaan koron vaikutusta henkivakuutusten hinnoitteluun, vakuuttajan mahdollisiin tuleviin menetyksiin sekä sivutaan lyhyesti vaikutusta markkinaehtoiseen vastuuvelkaan. Tutkielman aluksi tarkastellaan korkoutukseen, kuolevuuteen ja jäljellä olevan elinajan mallintamiseen liittyviä asioita sekä käydään läpi pääoma-arvoja ja annuiteetteja. Henkivakuuttajan vastuiden määrittämisessä olennaista on vakuutetun kuolevuuden mallintaminen. Kuolevuuden ennustamista tarvitaan tulevaisuudessa maksettavan etuuden todennäköisen keston estimointiin, jos etuuden maksaminen riippuu siitä, että vakuutettu on elossa. Toisaalta henkivakuutuksessa korvauksen maksaminen voi olla riippuvainen vakuutetun kuolemasta, jolloin kuolevuuden ennustamista tarvitaan mahdollisen korvauksen maksamisen ennustamiseen. Henkivakuutuksessa pääoma-arvokertoimia taas käytetään muun muassa vakuutusmaksujen ja vastuuvelan laskennassa. Pääoma-arvokertoimet lasketaan vakuutusmatemaattisin menetelmin ottaen huomioon korko, kuolevuus sekä etuuden alkamiseen ja päättymiseen mahdollisesti liittyvät muut tekijät. Kahdessa viimeisessä luvussa tarkastellaan koron vaikutusta hinnoitteluun, jos oletetaan, että korko on riippuvainen sijoituksen kestosta. Tässä hyödynnetään tuottokäyrää. Tulevan koron epävarmuutta mallinnetaan stokastisena korkona. Lisäksi tarkastellaan hajautettavissa olevaa ja ei-hajautettavaa riskiä ja käydään läpi oletukset, joiden nojalla kuolevuusriski voidaan ajatella hajautettavaksi. Esitellään ja käytetään Monte Carlo -menetelmää epävarmojen kassavirtojen jakauman ja tulevien menetysten nykyarvon tutkimiseen simuloimalla jäljellä olevaa elinaikaa ja tulevaa korkoa. Tilanteita havainnollistetaan esimerkein. Lisäksi lopuksi sivutaan lyhyesti EU:n Solvenssi II -direktiivin mukaisessa vakavaraisuuskehikossa mitattavia korkoriskejä. Solvenssi II -direktiivissä varojen ohella myös vastuuvelka arvostetaan markkinaehtoisesti käypään arvoon, jolloin vastuuvelan arvo riippuu merkittävästi korkotasosta. Tällöin myös henkivakuuttajan korkoriskin hallinnan merkitys korostuu.
  • Tuisku, Petri (2013)
    The thesis examines the theory of lattice models used in statistical physics from a mathematical perspective, and provides a case study of box-crossing property by proving Russo-Seymour-Welsh estimates in percolation model and the box-crossing property in the critical FK Ising (random cluster) model. The thesis is self-contained in its use of probability theory, but a general measure theory background is assumed.
  • Meyer, Petter (2016)
    Sijoituspäätösten tekeminen on yritysjohdon keskeisimpiä tehtäviä. Sijoituksiin liittyy aina riskejä, ja niiden hahmottaminen, hallitseminen ja minimoiminen ovat onnistuneen sijoituspäätöksen kannalta ydinasemassa. Tavallisimmissa sijoitusanalyyseissä verrataan ulospäin meneviä kassavirtoja sisään tuleviin. Kustannukset ovat usein deterministisiä, kun taas tulevaisuuden tuottoihin liittyy epävarmuutta. Esimerkiksi osakkeiden tuotto riippuu yrityksen menestyksestä kilpailussa ja markkinan yleisestä kehityksestä. Tässä Pro Gradu-tutkielmassa rajoitumme tilanteeseen, jossa pyrimme ennustamaan ja mallintamaan uuden yrityksen liikevaihtoa tietylle tarkastelujaksolle. Käytämme tähän riskiteoreettisia työkaluja ja vertaamme saavutettua mallia Case-yrityksen dataan. Tutkielma on jaettu kuuteen lukuun. Ensimmäinen luku on johdanto. Toisessa luvussa luodaan matemaattinen perusta tutkielman todennäköisyysteorialle ja stokastisille prosesseille. Kolmannessa luvussa esittelemme asiakkaiden lukumäärää kuvaamiseksi sopiva stokastinen prosessi. Tässä luvussa pääroolissa ovat ns. Poisson-prosessit, jotka ovat vakuutusmatematiikassa yleisesti käytetty laskuriprosessi vahinkojen lukumäärien kuvaamiseksi. Neljännessä luvussa käymme liikevaihdon kimppuun yhdistetyn muuttujan avulla. Kappaleessa esitämme menetelmiä sekä yhdistetyn muuttujan tarkoille todennäköisyyksille, että approksimoimiselle. Yhdistetty muuttuja on yleisesti käytetty riskiteoriassa ja vahinkovakuutuksessa. Viides luku muokkaa teoriaa sopivaksi liikevaihdon mallintamiseen. Asiakkaita jaetaan uusiin ja palaaviin asiakkaisiin, jotta eri lailla käyttäytyviin prosesseihin päästään paremmin käsiksi. Molempien prosessien laskuriprosessina on Poisson-prosessi. Viimeisessä luvussa tarkastelemme teorian sopivuutta tosimaailman case-yrityksen dataan. Hahmotamme todennäköisyyksiä approksimaatioiden ja simulaatioiden avulla.
  • Viherä, Leo (2018)
    Sijoitussidonnaisella säästövakuutuksella tarkoitetaan elämänvaravakuutusta, joka on jollain tavalla sidottu finanssimarkkinoihin, vakuutuksen arvo voi riippua esimerkiksi jostain osakkeesta, rahastosta, tai indeksistä. Täten se kilpailee suoraan myös perinteisen sijoittamisen kanssa. Tässä tutkielmassa perehdytään varsinkin yhtiön kannalta sijoitussidonnaisiin säästövakuutuksiin, kuten siihen, kuinka yhtiön tulee varautua tuleviin velvoitteisiinsa ja kuinka se voi minimoida näistä aiheutuvaa riskiä. Ensimmäisessä luvussa kootaan tutkielmassa tarvittavia määritelmiä ja tuloksia todennäkäisyysteoriasta. Tämän luvun tuloksien todistuksia ei esitä tutkielmassa. Toisessa luvussa käsitellään lyhyesti, kuinka kassavirrat arvostetaan, sekä sitä kuinka ja miksi eri aikaan tapahtuvat suoritukset tulee korkouttaa. Korkoa koskeva teoria on tärkeä kaikessa sijoitus- ja vakuutustoimintaa käsittelevässä teoriassa ja käytännössä. Kassavirtojen käsite on hyödyllinen tapa yhtiölle pohtia, kuinka tuleviin menoihin ja tuloihin tulee varautua sekä vakuutus-, että sijoitustoiminnassa. Kolmanneksi tarkastellaan perinteisiä säästövakuutuksia, jossa ei ole sijoituselementtiä. Esitetään, kuinka jäljellä olevaa elinaikaa voidaan käsitellä matemaattisena satunnaismuuttujana ja kuinka tätä hyödynnetään henkivakuutusten yhteydessä. Käsitellään vakuutusten hinnoittelun periaatteena käytettävää ekvivalenssiperiaatetta ja sen taustaa lyhyesti, ja tätä hyödyntäen lasketaan tämän tutkielman kannalta tärkeimmille henkivakuutustyypeille nettokertamaksut sekä osamaksut. Tämän jälkeen määritellän vastuuvelan käsite, joka on vakuutustoiminnassa tapa määrätä kuinka paljon yhtiöllä on syytä olla varallisuutta vakuutettua kohden. Esitetään sekä tulevaisuuteen, että menneisyyteen perustuvat laskutavat. Tämän lisäksi käsitellään korvauksien lisäksi yhtiölle aiheutuvia kuluja ja kuinka nämä tulee ottaa huomioon vakuutusmaksuissa. Viimeisenä tarkastellaan vakuutussopimuksen muuttamista takaisinostoa lyhyesti. Seuraavaksi siirrytään käsittelemään finanssimarkkinoita. Aluksi esitellään pohja, jolla oletaan markkinoiden toimivan, sekä määritellään merkintöjä mitä tulemme käyttämään. Tämän jälkeen esitellään tapa minimoida sopimukseen liittyvä lokaalin riski, sekä todistetaan tähän liittyviä lauseita. Tämän pohjalta määrätään myös riskin minimoinnin suhteen reilu hinta finanssimarkkinoista riippuville sopimuksille. Viidennessä luvussa tutkitaan sopimuksia, jotka yhdistävät henkivakuutuksen sekä rahallisen riskin. Edellisen luvun tulokset yleistetään tähän ympäristöön, nojaten oletukseen, että arvopaperimarkkinat ovat riippumattomia vakuutettujen elinajoista. Viimeiseksi käsitellään erästä sijoitussidonnaista säästövakuutustyyppiä, universal life- vakuutusta. Vakuutuksen elementit käsitellään, johdetaan vastuuvelka, sekä pohditaan, kuinka tässä tapauksessa minimoidaan lokaali riski.
  • Metso, Markus (2018)
    Lokaalin riskin minimoiva sijoitusstrategia on diskreettiaikainen, arvopapereiden hankkimisesta aiheutuvien kustannusten keskineliöpoikkeaman minimointiin perustuva strategia, jonka avulla finanssimarkkinoilla toimiva pystyy suojautumaan kohtuuttoman suuria tappioita vastaan. Luonnollisesti tällaisella suojautumisella on jonkin hinta, ja mikäli tämä hinta on liian suuri tai liian pieni, päädytään helposti arbitraasitilanteisiin. Tässä tutkielmassa esitetään vaatimukset, jotka finanssimarkkinoiden tulee täyttää ja jotka toimijan tulee arvopapereiden kanssa operoidessaan ottaa huomioon, jotta tällaisia tilanteita ei pääsisi muodostumaan. Lokaalin riskin minimoivan sijoitusstrategian arbitraasivapauden keskeinen vaatimus on minimaalisen martingaalimitan, erään riskineutraalien todennäköisyysmittojen erikoistapauksen, olemassaolo. Minimaalisen martingaalimitan olemassaolo finanssimarkkinoilla ei kuitenkaan ole itsestäänselvyys ja tässä tutkielmassa johdetaan edellytykset sen löytymiselle finanssimarkkinoilta, jotka koostuvat yhdesta riskittömästä ja yhdestä riskillisestä arvopaperista, sekä pohditaan, mitä seikkoja toimijan tulee tarkastella arbitraasin välttämiseksi tilanteessa, jossa minimaalisen martingaalimitan olemassaolon kriteerit eivät täyty. Lopuksi tarkastellaan lokaalin riskin minimoivien sijoitusstrategioiden yhteyksiä sijoitussidonnaisten henkivakuutusten suojaamiseen, sekä esitetään vaihtoehtoinen keino suojata toistettavan arvopaperin arvoon sidotun elämänvaravakuutuksen korvaus tilanteessa, jossa finanssimarkkinoilla ei ole olemassa minimaalista martingaalimittaa.
  • Rautiainen, Antti (2016)
    Tämä työ käsittelee loogisten lauseiden automaattista generointia. Työssä tutkitaan sitä, miten tiedon kerääntymistä voisi hyödyttää automaattisessa todistamisessa. Työssä luodaan tiedon kerääntymistä varten algoritmi, jonka avulla voidaan generoida kaikki tietyssä normaalimuodossa olevat suljetut ja syntaktisesti korrektit kaavat mielivaltaisessa ensimmäisen kertaluvun predikaattilogiikan kielessä. Kurt Gödel loi yksinkertaisen numeroinnin ensimmäisen kertaluvun predikaattilogiikan ensimmäisen epätäydellisyyslauseen todistamista vuonna 1931. Gödelin järjestelmässä monia luonnollisia lukuja vastaa syntaktisesti virheellinen kaava. Tässä työssä Gödelin numerointia parannetaan niin, että jokaista numeroa vastaa tietyssä normaalimuodossa oleva suljettu ja syntaktisesti oikea kaava valitussa ensimmäisen kertaluvun predikaattilogiikan kielessä. Tutkielma rakentuu seuraavasti. Ensimmäinen luku on johdanto. Generointia käsitellään toisessa luvussa. Ensimmäisessä liitteessä on lyhyesti ensimmäisen kertaluvun predikaattilogiikan käsitteitä. Toisessa liitteessä todistetaan käytettyjä teoreemoja.
  • Suotsalo, Kimmo (2015)
    Vector or multivariate autoregression is a statistical model for random processes. It is relatively simple yet flexible enough to describe many real-world phenomena. Stochastic processes modelled by multivariate autoregression are called vector autoregressive (VAR) processes. The structure of a VAR process is determined by the conditional independences of the variables and the lag length that describes the duration of direct influence. Structure discovery in VAR processes refers to finding reasonable candidates for these elements. Learning the structure of a VAR process can be realized using graphical models, where nodes represent variables and edges represent absence of conditional independence. This transforms the problem of learning conditional independences of variables into the problem of finding edges between nodes. This thesis extends previous studies to make inference on the structure of VAR processes involving tens or hundreds of variables, without assuming the underlying Granger causality graphs to be decomposable. A scoring function capable of predicting the Markov blankets of the nodes is derived and proved to be consistent. This scoring function is combined with another scoring function to discover VAR structures from multivariate time series. The performance of the proposed method is tested on synthetic data. In all test cases that are considered, given enough samples and some a priori information, the true lag length can be identified, the true positive rate made higher than 0.94, and the false positive rate kept below 0.01.
  • Pusa, Taneli (2015)
    The objective of this work is to generalize the pseudolikelihood-based inference method from ordinary Markov networks to an extension of the model containing context-specific independencies: the labelled graphical model. Probabilistic graphical models like the Markov and Bayes networks are used to represent the dependence structure of multivariate probability distributions. Machine learning methodology can then be used to learn these dependence structures from sample data. The Markov network is a model, which assigns no directionality to interactions between variables: the probability distribution is represented by an undirected graph, where nodes correspond to variables and edges to direct interactions. A labelled graphical model extends this idea by assigning labels to edges to represent contexts, i.e outcomes of other variables in the distribution, in which the associated variables are independent. Bayesian inference can be used to learn the dependence structure of a set of variables using data. The standard procedure is to consider the posterior probability of a model given the data and aim to maximize this score. This involves explicitly calculating the marginal likelihood of the model. In the case of Markov networks and consequently labelled models, this can not be done analytically and approximation methods must be used. Pseudolikelihood is one such method, which allows for both the analytical calculation of the so-called marginal pseudolikehood replacing the actual marginal likelihood of a model and the computationally very advantageous property of a node-wise factorizable score-function. This thesis presents the general theory behind the labelled graphical models and the basics of Bayesian inference. The pseudolikelihood approximation is introduced and applied to labelled models and the consistency of the score is proved. Lastly a greedy hill climb -algorithm is used to demonstrate the inference in practice by a synthetic and a real data example.
  • Taimouri, Zara (2015)
    Tämä Pro gradu -tutkielma on tehty Helsingin yliopistossa matemaattis-luonnontieteelliselle tiedekunnalle professori Esa Nummelinin luennoimien kurssien matemaattinen taloustiede ja stokastiset prosessit pohjalta. Pro gradu -tutkielman aiheena on Markovin ketjut (MK) ja tutkielman tavoitteena on antaa yleisluonteinen kuva siitä, mikä MK on, minkälaisia ominaisuuksia sillä on ja koota MK:ihin liittyviä olennaisia esimerkkejä ja tuloksia johdonmukaiseksi kokonaisuudeksi. Tutkielmassa käsitellään keskeisintä diskreettiaikaista stokastista prosessia, Markovin ketjua (tai Markov-prosessia) ja yksidimensioista satunnaiskulkua ominaisuuksineen. Markovin ketju on hyvin laaja ja erittäin keskeinen käsite niin matematiikassa, tilastotieteessä, kemiassa, fysiikassa, kuin biologiassakin. Sovelluksissa yleisesti käytetyn ketjun suosio johtuu siitä, että Markovin ketjulla on ns. Markov-ominaisuus eli tulevaisuuden tila riippuu vain nykyhetken tilasta. Jokaisella askeleella tila voi muuttua toiseksi tilaksi tai pysyä samana (vaikka tila pysyy samana, ajatellaan, että sekin on muutosta). Tilan muuttumista kutsutaan siirtymäksi ja vastaavasti muuttumisen todennäköisyyttä siirtymätodennäköisyydeksi. Tutkielma on rakennettu siten, että toisessa luvussa esitellään Markovin ketjun määritelmä ja tutustutaan merkintöihin. Kolmannessa luvussa tarkastellaan Markovin ketjuja ja niiden ominaisuuksia. Neljännessä luvussa käsitellään alkutilaa ja kuinka siirtymätodennäköisyyden ja alkujakauman avulla voidaan määritellä ns. polkutodennäköisyys. Viidennessä luvussa esitellään Markovin ketjun tilojen luokittelut. Kuudennessa luvussa syvennytään käsitteeseen Markovin ketjun absorptioon ja absorptiotodennäköisyyteen. Tämän jälkeen perehdytään käsitteisiin tasapainojakauma ja kääntyvyys. Viimeisessä luvussa tarkastellaan yksinkertaista stokastista prosessia, 1-dimensioista satunnaiskulkua, joka on Markovin ketjun erikoistapaus. Tutkielman päälähteet ovat Esa Nummelinin luennoimien kurssien matemaattinen taloustiede [9] ja stokastiset prosessit [10] luentomuistiinpanot ja lisäksi Samuel Karlinin ja Howard M Taylorin kirja A First Course in Stochastic Processes [5].
  • Aaltonen, Petri (2016)
    Työssä rakennetaan yleisten Markovin ketjujen teoriaa tila-avaruudella, joka on euklidisen avaruuden R^d osajoukko. Määrittelemme uusiutumisprosessit ja rakennamme regeneroituvien Markovin ketjujen teorian. Näytämme, että ergodisuusoletuksen toteuttava Markovin ketju on Harris-palautuva, positiivisesti palautuva ja sen tasapainojakauma on yksikäsitteinen. Regeneroituvalla Markovin ketjulla on tila-avaruuden osajoukko, johon osuessaan sillä on mahdollisuus regeneroitua positiivisella todennäköisyydellä. Regeneraation tapahtuessa Markovin ketju unohtaa historiansa ja sitä voidaan tarkastella kuten se käynnistyisi uudestaan tietyllä regeneraatiokonstruktion määrittämällä alkujakaumalla. Harris-palautuvuus ja positiivinen palautuvuus ovat vahvoja regeneraatioajan äärellisyyttä koskevia tuloksia. Teoriaa hyväksikäyttämällä todistetaan kolme keskeistä konvergenssitulosta Markovin ketjuille: suurten lukujen laki, jakauman suppeneminen kokonaisvariaatioetäisyydessä sekä keskeinen raja-arvolause. Markovin ketjujen teoria rakennetaan siinä laajuudessa, kuin sen avulla on mahdollista ymmärtää Metropolisin ja Hastingsin algoritmin toiminta. On annettu jonkin todennäköisyysjakauman mahdollisesti normalisoimaton tiheysfunktio π ja tehtävänä on muodostaa satunnaisotos kyseisestä jakaumasta. Metropolisin ja Hastingsin algoritmi konstruoi Markovin ketjun, jonka tasapainojakauma on π . Markovin ketjua simuloimalla saadaan siten haluttu otos. Mikäli Markovin ketju toteuttaa riittävät säännöllisyysominaisuudet, on muun muassa suurten lukujen laki ja keskeinen raja-arvolause voimassa, mikä merkitsee, että saatu otos on käytännössä hyödyllinen. Metropolisin ja Hastingsin algoritmi on esimerkki Markovin ketju Monte Carlo eli MCMC-menetelmistä. Ne mahdollistavat simuloinnin hyvin monimutkaisista jakaumista, joiden hallinta muita menetelmiä käyttäen on vaikeaa tai mahdotonta. Bayesiläinen tilastotiede ja tilastollinen mekaniikka ovat esimerkkejä MCMC-menetelmien tärkeistä sovellusaloista. Esittelemme lyhyesti MCMC-menetelmien soveltamisen perusteet ja suoritamme lyhyen katsauksen menetelmien historiaan. Lopuksi esittelemme soveltavan esimerkin, jossa Metropolisin ja Hastingsin algoritmia käytetään salakirjoitetun tekstin selventämiseen.
  • Polvi-Huttunen, Silja (2015)
    This work considers learning meaningful sets of chemical reactions called pathways and groups of species called Operational Taxonomical Units (OTUs) from metagenomic data. The methods are based on Nonnegative Matrix Factorization (NMF). The rows of our data matrix correspond to metagenomic samples and columns correspond to chemical reactions present in the samples. In order to learn both pathways and OTUs as well as relationships between them, we consider ways to factorize the data matrix into three factors instead of two. Denoting the samples times reactions data matrix by V, our factorization problem setting is to find nonnegative matrices W, H and P so that V is approximately WHP. The matrix W tells what OTUs are present in each of the samples, P defines pathways as combinations of reactions while H describes what pathways are implemented by which OTUs. We first discuss two standard NMF algorithms based on different objective functions and four sparsity constrained variants. Sparsity constrained variants are designed to produce output matrices with few values significantly above zero. We are interested in sparser variants because metagenomic pathways are short, thus the method should find a representation where only a small set of reactions is present in each pathway. We describe how using a standard two-factor NMF method twice yields a three-factor representation. We briefly mention an existing method, Nonnegative Matrix Tri-factorization (NMTF), that learns all three matrices W, H and P simultaneously. However, this method applies hard orthogonality constraints, i.e. it only finds solutions where the matrices W and P are orthogonal. Because of this constraint, NMTF is not suitable in our biological problem setting. We introduce an unconstrained method called NMF3 as well as a sparsity constrained variant SNMF3 based on Sparse Nonnegative Matrix Factorization (SNMF) and show how both of these algorithms can be derived. In order to compare the different algorithms' performance, we have built two synthetic data sets. Both sets are based on human intestinal species and pathway information available in an existing biological database. One of the data matrices can be exactly factorized into the underlying matrices used to generate the data. The other data set is built through simulating a sampling process that introduces noise and strictly limits the number of observed reactions per sample. We tested factorization methods discussed in the thesis on both data sets, using 100 to 1500 samples. We compare the methods and show and discuss the results. We found differences between NMF variants that use different objective functions. Many methods perform well on our task, surprisingly even in the case where the number of pathways is greater than the number of samples. Varying the number of samples affected the results less than we expected. Instead, we found that all algorithms performed significantly better on the factorizable data than on the simulated set.We conclude that the number of available metagenomic samples does not dramatically affect the performance of the factorization methods. More important is the quality of the samples.
  • Salminen, Minna (2017)
    Tässä tutkielmassa perehdytään niin sanottuun ylimartingaalin hajotelmaan max–plus-algebrassa ja sovelletaan sitä amerikkalaisiin optioihin. Tulokset esitellään pääosin jatkuvassa aika-avaruudessa, mutta myös diskreetin ajan tuloksia käsitellään. Markkinoilla myytävissä optioissa kiinnostavaa ovat se, milloin optio kannattaa käyttää ja se, milloin option myyjä voi saada voittoa. Amerikkalaisen option haltija voi käyttää option milloin tahansa sen voimassaoloaikana. Ylimartingaalin hajotelma max–plus-algebrassa takaa tietynlaisille stokastisille prosesseille sen, että amerikkalaisen option optimointiongelma voidaan ratkaista laskematta option hintaa, toisin sanoen optimaalisen pysäytyshetken etsiminen helpottuu. Jatkuvan ajan tulokset on esitelty Nicole El Karouin ja Asma Mezioun artikkelissa Max-plus Decomposition of Supermartingales and Convex Order. Application to American Options and Portfolio Insurance vuonna 2007. D. A. Darling, T. Liggett ja H. M. Taylor käsittelivät artikkelissaan Optimal Stopping Time for Partial Sums samaa asiaa diskreetissä ajassa jo vuonna 1972. Max–plus-algebra on eksoottinen algebra, jossa on kaksi operaatiota ⊕ = max ja ⊗ = +. Monet normaalissa algebrassa hankalat laskelmat onnistuvat max–plus-algebrassa helposti. Ylimartingaalin hajotelma max–plus-algebrassa mahdollistaa monenlaisia sovelluksia amerikkalaisen option lisäksi muun muassa matemaattisessa fysiikassa ja tietoliikenneverkoissa. Tutkielma etenee siten, että aluksi määritellään todennäköisyysavaruus ja tuodaan avaruuteen mukaan tarpeellisia ominaisuuksia kuten historia, ja esitellään muun muassa martingaalit. Amerikkalaisiin optioihin perehdytään siinä laajuudessa kuin päätulosten kannalta on tarpeellista. Tämän jälkeen tutustutaan max–plus-algebraan ja sen algebrallisiin ominaisuuksiin sekä ylimartingaalin hajotelmaan max–plus-algebrassa jatkuvassa aika-avaruudessa. Tulosta sovelletaan amerikkalaisiin osto-optioihin sekä jatkuvassa että diskreetissä avaruudessa. Tutkielmassa karakterisoidaan optimaalinen pysäytyshetki ylimartingaalin max–plus-hajotelman indeksiprosessin suhteen, missä oletukseksi tarvitaan multiplikatiivinen eli geometrinen Lévy-prosessi. Ensin osoitetaan se, että arvofunktiota ei tarvitse laskea optimaalisen pysäytyshetken ratkaisemiseksi. Sitten huomataan, että äärellisen maturiteetin tapaus on monimutkaisempi kuin äärettömän tapaus. Esimerkkejä käsitellään sekä geometrisesta Brownin liikkeestä että multiplikatiivisesta Lévy-prosessista. Myyntioptiota käsitellään lyhyesti ja pelkästään jatkuvassa aika-avaruudessa, sillä se saadaan osto-optiosta helpolla todennäköisyysmitan vaihdolla. Viimeiseksi kootaan tutkielman tulokset tiiviisti yhteen.
  • Muhonen, Eija (2015)
    Tutkielman tarkoituksena on esitellä Markovin ketju Monte Carlo -menetelmistä (MCMC) tunnetuin eli Metropolis-Hastings algoritmi. Menetelmää sovelletaan geometrisia muotoja sisältävien kuvien terävöittämisessä. Luku kolme esittelee tilastolliset inversio-ongelmat. Inversio-ongelma on käänteinen ongelma, jossa on saatu data ja halutaan tietää mistä data on peräisin. Tiedetään myös miten data on saatu, mutta data sisältää aina mittausvirhettä, joten lähtötilannetta ei voi laskea suoraan saadusta datasta. Usein alkutilanteesta tiedetään kuitenkin jotain. Tutkielmassa datana on käytetty sumennettua valokuvaa, jossa mustalla taustalla on valkoinen suorakaide. Lähtötilanteesta siis tiedetään, että kyseessä on yksivärinen tausta ja siinä on yksivärinen suorakaide. Neljännessä luvussa esitellään Markovin ketjut ja käydään läpi niiden tärkeimmät ominaisuudet, joita tarvitaan ketjujen konvergointiin. Viides luku esittelee MCMC-menetelmät. Ne perustuvat Markovin ketjujen konvergointiin tasapainojakaumaansa kohti ja suurten lukujen lakiin. Tarkoitus on löytää tiedetylle tasapainojakaumalle sopiva Markovin ketju ja ottaa ketjusta näytejono. Näytejonon keskiarvo suppenee kohti oikeaa tulosta näytejonon kasvaessa. MCMC-teorian mukaan näytejonon ensimmäisen arvon valinnalla ei ole väliä, joten se arvotaan lähtötilanteesta tietämämme perusteella. Tämän jälkeen tehdään alkuarvoon satunnainen muutos. Alkuarvo ja sen muunnos mallinnetaan samalla tavalla, kun tiedämme datan saadun. Mallinnuksista verrataan kumpi on lähempänä saatua dataa. Jos muunnos on lähempänä, se hyväksytään varmasti seuraavalle kierrokselle. Satunnaisella todennäköisyydellä se hyväksytään huononpanakin vaihtoehtona. Seuraava muunnos tehdään aina viimeisimmästä hyväksytystä muunnoksesta. Joka yrityksestä näytejonoon lisätään seuraavalle kierrokselle jatkanut arvo. Lopulta näytejonosta lasketaan keskiarvo, joka on haluttu tulos. Toteutus esitellään kuudennessa luvussa. Toteus on tehty Matlab-ohjelmalla. Toteutusta ajetaan eri arvoilla ja tuloksia vertaillaan vähentämällä oikean kuvan pikselien arvoista saadun kuvan pikselien arvot. Toteutusta on testattu valokuvilla, joissa on yksi tai useampi suorakaide. Menetelmällä on testattu useita eri parametreja toteutukselle ja tuloksissa etsillään luvussa seitsemän. Luvussa kahdeksan käydään läpi johtopäätöksiä.
  • Hägele, Miriam (2016)
    Säännöllinen vaihtelu on paksuhäntäisten jakaumien tarkastelussa tärkeä osa-alue. Tässä työssä tarkastellaan sekä säännöllisesti vaihtelevia satunnaismuuttujia että säännöllisesti vaihtelevia satunnaisvektoreita ja niiden ominaisuuksia. Satunnaismuuttuja on säännöllisesti vaihteleva, jos sen häntäfunktio on säännöllisesti vaihteleva jollain negatiivisella indeksillä. Silloin pätee: mitä isompi on säännöllisen vaihtelun indeksi, sitä enemmän momentteja on olemassa. Satunnaisvektorin säännöllinen vaihtelu määritellään joukon Radon-mitan avulla. Satunnaisvektori on säännöllisesti vaihteleva, jos n kertaa todennäköisyys, että satunnaisvektori kuuluu joukkoon a(n)A, missä a(n) on kasvava jono, suppenee kohti joukon A Radon-mittaa, kun n kasvaa rajatta. Jos satunnaisvektori on säännöllisesti vaihteleva, niin myös jokainen satunnaisvektorin lineaarikombinaatio on säännöllisesti vaihteleva samalla indeksillä, ja sen lisäksi pätee samanlainen indeksin skaalausominaisuus kuin yksiulotteisessa tapauksessa. Alussa määritellään satunnaisvektorin säännöllinen vaihtelu ja todistetaan siihen liittyvä Karamatan lause sekä Fuk-Nagaev-epäyhtälöt, jotka antavat ylärajoja suurien poikkeamien todennäköisyyksille. Karamatan lause antaa muun muassa yhteyden säännöllisesti vaihtelevan tiheysfunktion ja paksuhäntäisyyden välillä. Sitten laajennetaan säännöllinen vaihtelu satunnaisvektoreihin ja tutkitaan erilaisia säännöllisesti vaihtelevien satunnaisvektoreiden ominaisuuksia. Esitetään myös satunnaisvektorin ja sen komponenttien säännöllisen vaihtelun yhteys. Lopuksi todistetaan suurten poikkeamien päälause ja sovelletaan lausetta esimerkkien valossa. Lauseen mukaan voidaan laskea suhde satunnaisvektorien summan rajatodennäköisyyden ja yksittäisten satunnaisvektoreiden rajatodennäköisyyksien välillä.
  • Salminen, Tomi (2013)
    Tässä tutkielmassa tutkitaan matemaattista neuvotteluteoriaa. Päätulokset ovat Nashin aksioomat toteuttavan neuvotteluratkaisun johtaminen ja sen yksikäsitteisyyden todistaminen sekä Rubinsteinin vuorottelevien tarjousten neuvottelupelin alipelitäydellisen tasapainon ratkaiseminen. Johdantolukua seuraavassa luvussa 2 käsitellään hyötyteoriaa. Odotetun hyödyn ominaisuuden täyttävät preferenssirelaatiot esitetään ja niistä johdetaan von Neumann-Morgenstern-hyötyfunktio. Neuvotteluteoria rakennetaan sen oletuksen varaan, että pelaajien preferenssit ovat ilmaistavissa tällaisten hyötyfunktioiden avulla. Kolmannessa luvussa määritellään ensin kahden pelaajan neuvotteluongelma matemaattisesti. Nashin aksioomat esitetään ja osoitetaan, että Nashin neuvotteluratkaisu on ainoa nämä aksioomat toteuttava neuvotteluratkaisu. Tämän jälkeen analysoidaan kieltäytymispisteen ja riskinkaihtamisen vaikutusta Nashin neuvotteluratkaisuun, sekä tutkitaan muita Nashin neuvotteluratkaisun ominaisuuksia. Epäsymmetrinen Nashin neuvotteluratkaisu esitetään ja todistetaan, että se toteuttaa kaikki Nashin aksioomat lukuun ottamatta symmetrisyyttä. Lopuksi Nashin neuvotteluratkaisu yleistetään monen pelaajan neuvotteluongelmille ja tutkitaan monen pelaajan neuvotteluratkaisun erityispiirteitä. Neljäs luku aloitetaan määrittelemällä täydellisen informaation laajan muodon peli, Nashin tasapaino ja alipelitäydellinen tasapaino. Rubinsteinin vuorottelevien tarjousten neuvottelumalli esitetään täydellisen informaation laajan muodon pelinä, jonka alipelitäydellinen ratkaisu esitetään. Tämän tasapainoratkaisun ominaisuuksia tutkitaan. Lopuksi todetaan, että kun tarjousten välinen aika lähestyy nollaa, niin tämä alipelitäydellinen ratkaisu lähestyy tiettyihin neuvotteluvoimiin liittyvää epäsymmetristä Nashin neuvotteluratkaisua.
  • Djurabekova, Nargiza (2017)
    Sparse and limited angle tomography are common techniques used in computerized tomography to understand the inner working of live and inanimate objects with a reduced radiation dose. Unfortunately due to the lack of full data, these problems are often severely ill-posed and need powerful regularization strategies to create good reconstructions. One such tool is total variation, which creates good but patchy reconstructions. In this paper we analyze the use of non-local total variation as a way to improve the reconstruction quality. The analysis involves using both, simulated and real world data and comparing the TV reconstructions with the NLTV ones. The results leas us to believe that NLTV is particularly efficient and superior tool in sparse tomography, but further research is required to improve TV's limited-angle reconstructions.
  • Tyrväinen, Sanna (2013)
    The push for cameras integrated into mobile devices has created strict size constraints for the hardware. This results in large compromises in lens quality, causing blur that can be modelled by using the convolution operator. We explore ways of reducing this blur via algorithms, a process that is also known as deconvolution. The deconvolution problem is considered ill-posed. According to Hadamard, an ill-posed problem is one that fails at least one of the following conditions: the solution is unique, the solution exist for any given data and the solution depends with continuity on the data. Traditional approaches to solve the deconvolution problem are Tikhonov and total variation regularization, but these methods have problems with fine structures and patterns in images, because they compare only points next to each other. Nonlocal methods were developed to alleviate these problems. They base on texture synthesis and neighbourhood filters. The main idea is that similar or repeating structures exist in the image. These structures can be used when reconstructing the unclear part of the image. The similarity between points is measured by comparing their environments with a weight function. This thesis presents the theory of total variation regularization, some properties of the total variation functional and the existence of the minimizer. Nonlocal operators and a weight function are then used to define nonlocal total variation regularization. We present an algorithm for solving the deconvolution problem by nonlocal total variation regularization using gradient descent. We compare our implementation to the code by Yifei, Zhang, Osher and Bertozzi (2010). Numerical examples using three different images with different added blur and noise show no significant difference between nonlocal methods, but they show great advance from local to nonlocal methods. Results are compared using the signal to noise ratio (SNR) and an ocular measuring. Tikhonov regularization turns out to be insufficient when measuring SNR.
  • Liesipohja, Susanna (2014)
    Logaritmisk kapacitet är viktigt inom flera områden av tillämpad matematik och kan ha olika benämningar beroende på forskningsområdet. T.ex. inom talteorin kallas den logaritmiska kapaciteten för transfinit diameter och inom approximering av polynom är den känd som Chebyshevs konstant. Inom potentialteorin definieras den logaritmiska kapaciteten som måttet på storleken av en kompakt mängd i C. Men trots att den logaritmiska kapaciteten är så viktig inom många forskningsområden, så är den ytterst svår att beräkna. Tack vare dess samband till Greens funktioner går det att beräkna den logaritmiska kapaciteten analytiskt för vissa enklare mängder, såsom ellipser och kvadrater, men när det gäller mer komplicerade mängder så kan man endast uppskatta övre och nedre gränser. På grund av detta har det utvecklats flera numeriska metoder för detta syfte. I början av denna avhandling kommer vi att presentera nödvändig bakgrundsinformation för definiering och beräkning av logaritmisk kapacitet. I kapitel 4 presenterar vi definitionen av logaritmisk kapacitet och dess samband till Greens funktioner, samt hur man genom detta samband kan beräkna den logaritmiska kapaciteten analytiskt. Här presenterar vi även några gränser för den logaritmiska kapaciteten, samt definitionen för transfinit diameter och dess samband till den logaritmiska kapaciteten. I kapitel 5 kommer vi att presentera fyra olika numeriska metoder för approximering av logaritmisk kapacitet: Dijkstra-Hochstenbachs metod, Rostands metod, Ransford-Rostands metod, samt hur man kan använda Schwarz-Christoffel avbildningar för beräkning av logaritmisk kapacitet. Vi tillämpar även Rostands metod som ett MATLAB-program.