Browsing by Subject "koneoppiminen"

Now showing items 1-20 of 31

Aihemallinnus rasismin kehystämisestä Suomi24-keskustelufoorumilla

Latva-Hirvelä, Markus (2022)

Tutkielmassa pyritään ensinnäkin vastaamaan kysymykseen siitä, minkälaisia rasismin kehystämisen tapoja havaitaan Suomi24-foorumilta sekä miltä kehystäminen näyttää rasismin tutkimuskirjallisuuden valossa. Toiseksi tutkielmassa tarkastellaan aihemallinnusalgoritmin kyvykkyyttä tuottaa ”aiheita” suomalaisesta puhekielisestä keskustelufoorumista sekä voiko näitä ”aiheita” käsitellä entmanilaisina ”kehyksinä” Aineistona tutkielmassa käytetään kielipankin Suomi24-korpusta, joka on rajattu sisältämään Rasismi-keskustelualueen keskustelunavaukset kahtena ajanjaksona: 2007–2011 & 2012–2016. Aineiston analyysissä on käytetty laskennallisiin koneoppimismenetelmiin kuuluvaa aihemallinnusta. Sen tuottamat ”aiheet” on analysoitu laadullisella kehysanalyysillä entmanilaisina ”kehyksinä”. Kehyksiä arvioidaan Entmanin mukaisesti retorisena operaationa, jolla pyritään vaikuttamaan muiden toimintaan. Aihemallinnuksen tulosten perusteella molemmilta ajanjaksoilta nousseet yleisimmät kehykset on nimetty seuraavasti: ”taloudellinen taakka”, ”seksuaalirikokset & väkivaltaisuus”, ”kulttuurien yhteensopimattomuus & terrorismi” sekä ”rasismin määrittelykamppailu & sananvapaus”. Tutkielman keskeinen tulos on, että Suomi24-foorumilla Rasismi-foorumin keskustelunavaukset koskevat valtaosin ei- haluttujen maiden maahanmuuttajia, kuten somaleja tai Lähi-idän pakolaisia. Näkemykset näitä ihmisryhmiä kohtaan ovat korostuneen negatiivisia. Kehyksistä havaitaan monentyyppistä rasismia, joiden tarkoituksena vaikuttaa olevan institutionaalisen rasismin lisääminen: maahanmuuttajien sosiaalisen turvan leikkaaminen ja maahanmuuttajataustaisten ajaminen pois Suomesta. Toinen keskeinen tulos on, että aihemallinnus kykenee tuottamaan suomenkielisestä arkikielisestä aineistosta tuloksena ”aiheita”, jotka voidaan tulkita entmanilaisina kehyksinä. Kehystyksissä esiintyy vanhaa rasismia (maahanmuuttajat esitetään laiskoina, vaistojen varaisina ja väkivaltaisina), uusrasismia (islaminusko esitetään väkivaltaisena sortavana uskontona) ja arkielämän rasismia (maahanmuuttajista puhutaan pahaan, nimitellään ja loukataan). Noin viidesosa Suomi24:n käyttäjistä saapuu foorumille oppimaan uutta tietoa. Tutkielmassa tästä näkökulmasta koetaan ongelmallisena, että foorumilla puututaan vain rasismin räikeimpiin ulostuloihin. Rasismista uskalletaan yhteiskunnassa puhua vain ”turvallisilla termeillä”, joista osa on äärioikeiston itse määrittämiä. Rasistinen vihapuhe lisää epätasa-arvoista kohtelua ja suurentaa vihapuheen kohteen riskiä väkivallan uhriksi joutumisesta. Vihapuheen lisäämä polarisaatio on myös uhka koko poliittisen järjestelmän ja kulttuurin toiminnalle.
Aihemallinnus rasismin kehystämisestä Suomi24-keskustelufoorumilla

Latva-Hirvelä, Markus (2022)

Tutkielmassa pyritään ensinnäkin vastaamaan kysymykseen siitä, minkälaisia rasismin kehystämisen tapoja havaitaan Suomi24-foorumilta sekä miltä kehystäminen näyttää rasismin tutkimuskirjallisuuden valossa. Toiseksi tutkielmassa tarkastellaan aihemallinnusalgoritmin kyvykkyyttä tuottaa ”aiheita” suomalaisesta puhekielisestä keskustelufoorumista sekä voiko näitä ”aiheita” käsitellä entmanilaisina ”kehyksinä” Aineistona tutkielmassa käytetään kielipankin Suomi24-korpusta, joka on rajattu sisältämään Rasismi-keskustelualueen keskustelunavaukset kahtena ajanjaksona: 2007–2011 & 2012–2016. Aineiston analyysissä on käytetty laskennallisiin koneoppimismenetelmiin kuuluvaa aihemallinnusta. Sen tuottamat ”aiheet” on analysoitu laadullisella kehysanalyysillä entmanilaisina ”kehyksinä”. Kehyksiä arvioidaan Entmanin mukaisesti retorisena operaationa, jolla pyritään vaikuttamaan muiden toimintaan. Aihemallinnuksen tulosten perusteella molemmilta ajanjaksoilta nousseet yleisimmät kehykset on nimetty seuraavasti: ”taloudellinen taakka”, ”seksuaalirikokset & väkivaltaisuus”, ”kulttuurien yhteensopimattomuus & terrorismi” sekä ”rasismin määrittelykamppailu & sananvapaus”. Tutkielman keskeinen tulos on, että Suomi24-foorumilla Rasismi-foorumin keskustelunavaukset koskevat valtaosin ei- haluttujen maiden maahanmuuttajia, kuten somaleja tai Lähi-idän pakolaisia. Näkemykset näitä ihmisryhmiä kohtaan ovat korostuneen negatiivisia. Kehyksistä havaitaan monentyyppistä rasismia, joiden tarkoituksena vaikuttaa olevan institutionaalisen rasismin lisääminen: maahanmuuttajien sosiaalisen turvan leikkaaminen ja maahanmuuttajataustaisten ajaminen pois Suomesta. Toinen keskeinen tulos on, että aihemallinnus kykenee tuottamaan suomenkielisestä arkikielisestä aineistosta tuloksena ”aiheita”, jotka voidaan tulkita entmanilaisina kehyksinä. Kehystyksissä esiintyy vanhaa rasismia (maahanmuuttajat esitetään laiskoina, vaistojen varaisina ja väkivaltaisina), uusrasismia (islaminusko esitetään väkivaltaisena sortavana uskontona) ja arkielämän rasismia (maahanmuuttajista puhutaan pahaan, nimitellään ja loukataan). Noin viidesosa Suomi24:n käyttäjistä saapuu foorumille oppimaan uutta tietoa. Tutkielmassa tästä näkökulmasta koetaan ongelmallisena, että foorumilla puututaan vain rasismin räikeimpiin ulostuloihin. Rasismista uskalletaan yhteiskunnassa puhua vain ”turvallisilla termeillä”, joista osa on äärioikeiston itse määrittämiä. Rasistinen vihapuhe lisää epätasa-arvoista kohtelua ja suurentaa vihapuheen kohteen riskiä väkivallan uhriksi joutumisesta. Vihapuheen lisäämä polarisaatio on myös uhka koko poliittisen järjestelmän ja kulttuurin toiminnalle.
Artificial Neural Networks for Parametrisation of a Kinetic Monte Carlo Model of Surface Diffusion

Romppainen, Jonna (2020)

Surface diffusion in metals can be simulated with the atomistic kinetic Monte Carlo (KMC) method, where the evolution of a system is modeled by successive atomic jumps. The parametrisation of the method requires calculating the energy barriers of the different jumps that can occur in the system, which poses a limitation to its use. A promising solution to this are machine learning methods, such as artificial neural networks, which can be trained to predict barriers based on a set of pre-calculated ones. In this work, an existing neural network based parametrisation scheme is enhanced by expanding the atomic environment of the jump to include more atoms. A set of surface diffusion jumps was selected and their barriers were calculated with the nudged elastic band method. Artificial neural networks were then trained on the calculated barriers. Finally, KMC simulations of nanotip flattening were run using barriers which were predicted by the neural networks. The simulations were compared to the KMC results obtained with the existing scheme. The additional atoms in the jump environment caused significant changes to the barriers, which cannot be described by the existing model. The trained networks also showed a good prediction accuracy. However, the KMC results were in some cases more realistic or as realistic as the previous results, but often worse. The quality of the results also depended strongly on the selection of training barriers. We suggest that, for example, active learning methods can be used in the future to select the training data optimally.
Assuring Model Documentation in Continuous Machine Learning System Development

Holopainen, Markus (2023)

Context: Over the past years, the development of machine learning (ML) enabled software has seen a rise in popularity. Alongside this trend, new challenges have been identified, such as growing concerns about the use, including the ethical concerns, of ML models, as misuse can lead to severe consequences for human beings. To alleviate this problem, more comprehensive model documentation has been suggested, but how can that documentation be made part of a modern, continuous development process? Objective: We design and develop a solution, which consists of a software artefact and its surrounding process, which enables and moderates continuous documentation of ML models. The solution needs to comply with the modern way-of-working of software development. Method: We apply the design science research methodology to divide the design and development into six separate tasks, i.e., problem identification, objective definition, design and development, demonstration, evaluation, and communication. Results: The solution uses model cards for storing model details. These model cards are tested automatically and manually, forming a quality gate and ensuring integrity of the documentation. The software artefact is implemented in the form of a GitHub Action. Conclusion: We conclude that the software artefact supports and assures proper model documentation in the form of a model card. The artefact allows for customization by the user, thereby supporting domain-specific use cases.
Classification automatique des SMS : analyse des caractéristiques langagières de deux groupes d’âge

Poutanen, Julia (2018)

Tämän tutkielman tarkoituksena on tutkia aikuisten ja nuorten kielenkäytön välisiä eroja ranskankielisessä tekstiviestiaineistossa. Eroja tutkitaan luomalla koneoppimista hyödyntävä automaattinen luokittelija, joka kykenee erottelemaan aikuisten ja nuorten tekstiviestit toisistaan. Työssä tarkastellaan luokittelijan antamia tuloksia ja pyritään selvittämään, miten luokittelijan toimintaa voidaan parantaa kielenkäytöstä saatujen tietojen valossa esimerkiksi tutkielmassa määritellyillä piirteillä (engl. feature). Teoriaosassa käsitellään tekstiviestikielen piirteiden lisäksi iän ja kielenkäytön välistä suhdetta sekä kieliteknologialle ja korpuslingvistiikalle tärkeitä käsitteitä. Menetelmänä käytetystä tilastollisesta luokittelijasta esitellään siihen liittyvä olennainen teoria sekä muita tutkielman kannalta tärkeitä käsitteitä. Tutkielman aineisto on kerätty Montpellier’ssä, Ranskassa vuonna 2011, ja se koostuu silloiseen tutkimukseen osallistuneiden lähettämistä tekstiviesteistä. Tekstiviestejä on yhteensä 88 000, ja niistä noin 70 000 käytetään tutkielmassa. Analyysissä keskitytään sekä kielellisiin että teknisiin piirteisiin: tarkastelun kohteina ovat täten sekä malli että aineiston kielelliset piirteet. Tutkimustuloksista selviää, että luokittelija toimii varsin hyvin tekstiviestien erottelussa, mutta tutkielmassa erikseen määritellyt piirteet eivät paranna merkittävästi luokittelijan toimintaa. Piirteistä voidaan kuitenkin tehdä joitakin johtopäätöksiä: tekstiviesteille on tyypillistä keskustelunomainen kielenkäyttö viestin lähettäjän ja vastaanottajan välillä sekä puhekieli. Analysoitujen viestien perusteella voidaan nähdä, että tekstiviestikielen ominaispiirteisiin kuuluvat ääntämistä ja foneettista muotoa heijastavat sanamuodot ja että tekstiviesti muodostanee oman rekisterinsä ranskan kielessä.
Classification automatique des SMS – analyse des caractéristiques langagières de deux groupes d’âge

Poutanen, Julia (2018)

Tämän tutkielman tarkoituksena on tutkia aikuisten ja nuorten kielenkäytön välisiä eroja ranskankielisessä tekstiviestiaineistossa. Eroja tutkitaan luomalla koneoppimista hyödyntävä automaattinen luokittelija, joka kykenee erottelemaan aikuisten ja nuorten tekstiviestit toisistaan. Työssä tarkastellaan luokittelijan antamia tuloksia ja pyritään selvittämään, miten luokittelijan toimintaa voidaan parantaa kielenkäytöstä saatujen tietojen valossa esimerkiksi tutkielmassa määritellyillä piirteillä (engl. feature). Teoriaosassa käsitellään tekstiviestikielen piirteiden lisäksi iän ja kielenkäytön välistä suhdetta sekä kieliteknologialle ja korpuslingvistiikalle tärkeitä käsitteitä. Menetelmänä käytetystä tilastollisesta luokittelijasta esitellään siihen liittyvä olennainen teoria sekä muita tutkielman kannalta tärkeitä käsitteitä. Tutkielman aineisto on kerätty Montpellier’ssä, Ranskassa vuonna 2011, ja se koostuu silloiseen tutkimukseen osallistuneiden lähettämistä tekstiviesteistä. Tekstiviestejä on yhteensä 88 000, ja niistä noin 70 000 käytetään tutkielmassa. Analyysissä keskitytään sekä kielellisiin että teknisiin piirteisiin: tarkastelun kohteina ovat täten sekä malli että aineiston kielelliset piirteet. Tutkimustuloksista selviää, että luokittelija toimii varsin hyvin tekstiviestien erottelussa, mutta tutkielmassa erikseen määritellyt piirteet eivät paranna merkittävästi luokittelijan toimintaa. Piirteistä voidaan kuitenkin tehdä joitakin johtopäätöksiä: tekstiviesteille on tyypillistä keskustelunomainen kielenkäyttö viestin lähettäjän ja vastaanottajan välillä sekä puhekieli. Analysoitujen viestien perusteella voidaan nähdä, että tekstiviestikielen ominaispiirteisiin kuuluvat ääntämistä ja foneettista muotoa heijastavat sanamuodot ja että tekstiviesti muodostanee oman rekisterinsä ranskan kielessä.
Development of a Deep Learning Algorithm for the Detection of Meningioma from Non-Contrast Head CTs

Pirinen, Riku (2023)

In recent years, there has been a surge of interest in the application of machine learning (ML) within the medical field. This development has been made possible by the emergence of high-performance modern computers. Deep learning (DL), a subfield of ML, uses advanced computer algorithms to solve complex tasks that would normally require the cognitive capabilities of the human brain. Meningiomas are the most common intracranial tumor excluding metastases. They are usually diagnosed on head magnetic resonance imaging (MRI). Meningiomas can also be visible on computed tomography (CT) although detecting them on non-contrast enhanced head CT is challenging. Notably, CT is more readily available than MRI and head CTs far outnumber head MRIs. This means many meningiomas are not detected on head CT. DL has shown capability in tasks that are difficult for humans, and we hypothesized that a DL algorithm could detect meningiomas from non-contrast-enhanced head CTs. In this thesis, we developed a deep learning algorithm for the detection of clinically relevant meningiomas in non-contrast-enhanced head CT scans and assessed its performance on previously unseen data. All images were from patients who required neurosurgical intervention for the treatment of their meningiomas. They were sourced from the Helsinki University Hospital (HUH) Picture Archiving and Communication System (PACS), a database of over 21 million imaging studies. We found that our algorithm has a good positive predictive value in detecting meningiomas. In other words, the algorithm rarely predicts abnormal findings in normal head CT scans. On the other hand, a positive prediction is likely to be correct. Such an algorithm, in theory, could aid radiologists and clinicians in image interpretation especially during busy on-call hours as it gives few false alerts.
Development of a Deep Learning Algorithm for the Detection of Meningioma from Non-Contrast Head CTs

Pirinen, Riku (2023)

In recent years, there has been a surge of interest in the application of machine learning (ML) within the medical field. This development has been made possible by the emergence of high-performance modern computers. Deep learning (DL), a subfield of ML, uses advanced computer algorithms to solve complex tasks that would normally require the cognitive capabilities of the human brain. Meningiomas are the most common intracranial tumor excluding metastases. They are usually diagnosed on head magnetic resonance imaging (MRI). Meningiomas can also be visible on computed tomography (CT) although detecting them on non-contrast enhanced head CT is challenging. Notably, CT is more readily available than MRI and head CTs far outnumber head MRIs. This means many meningiomas are not detected on head CT. DL has shown capability in tasks that are difficult for humans, and we hypothesized that a DL algorithm could detect meningiomas from non-contrast-enhanced head CTs. In this thesis, we developed a deep learning algorithm for the detection of clinically relevant meningiomas in non-contrast-enhanced head CT scans and assessed its performance on previously unseen data. All images were from patients who required neurosurgical intervention for the treatment of their meningiomas. They were sourced from the Helsinki University Hospital (HUH) Picture Archiving and Communication System (PACS), a database of over 21 million imaging studies. We found that our algorithm has a good positive predictive value in detecting meningiomas. In other words, the algorithm rarely predicts abnormal findings in normal head CT scans. On the other hand, a positive prediction is likely to be correct. Such an algorithm, in theory, could aid radiologists and clinicians in image interpretation especially during busy on-call hours as it gives few false alerts.
Euroopan unionin tietosuojasääntelyn tavoitteiden intressi-tasapainon juuret ja sen vaikutus tekoälyyn ja erityisesti koneoppimiseen liittyvän tietosuojasääntelyn ongelmiin ”right to explanation”-oikeuden näkökulmasta

Alopaeus, Pilvi (2020)

Sen vaikutukset ulottuvat kaikkialle yhteiskuntaan. Digitalisaatio näkyy esimerkiksi tehokkaampana terveydenhuoltona ja tuo esimerkiksi mukanaan enemmän ja tasa-arvoisemmin mahdollisuuksia koulutukseen. Tekoälyn ja erityisesti koneoppimisen keksiminen on merkinnyt digitalisaatiolle yhtä suurta mullistusta kuin mitä digitalisaatio oli yhteiskunnalle. Tämän merkityksen on tunnistanut niin yritykset kuin lainsäätäjäkin. Datasta on tekoälyn kehittymisen myötä toden totta tullut uusi öljy. Jos data on modernin yhteiskunnan uusi öljy, on tietosuoja sen ilmastonmuutos. Tietystä kulmasta katsottuna sen voi katsoa olevan uhka öljylle, mutta se voi myös tarjota mahdollisuuksia uudistaa datan päälle rakentuvien liiketoiminnan tapoja toimia kestävämmällä pohjalla. Henkilötietojen suojan voi nähdä liiketoimintaa rajoittavana tekijänä tai sen voi ottaa liiketoiminnan parhaaksi kilpailuvaltiksi. Tässä tutkielmassa pureudutaan Euroopan unionin tietosuojasääntelyn tavoitteiden intressitasapainon juuriin ja sen vaikutukseen tekoälyyn ja erityisesti koneoppimiseen liittyvän tietosuojasääntelyn ongelmiin ”right to explanation”-oikeuden näkökulmasta. Tutkimus tarkastelee ensin tietosuojalainsäädännön historiaa 1970-luvulta eteenpäin sitä leimaavan ja hallitsevan kahden vahvan intressin, digitaalisten sisämarkkinoiden kasvattamisen ja perusoikeuksien suojan, tasapainottelun näkökulmasta. Kun paino 1970-luvulla oli selvästi enemmän taloudellisten intressien edistämisessä, on se sittemmin siirtynyt toiseen päähän tavoitteenaan tehdä vahvasta perusoikeuksien suojasta kilpailuetu, jolla EU voi kilpailla erityisesti Yhdysvaltojen ja Kiinan kanssa. Sen jälkeen tutkielma siirtyy käsittelemään Euroopan unionin tekoälystrategian ensiaskelia ja saman intressien tasapainottelun vaikutuksia siihen. Keskeiseksi nousee jälleen tietosuojasta tutut arvot: teknologian läpinäkyvyyden ja luottamuksen painottaminen perusoikeuksien vakuutena. Samalla unioni strategiaksi muodostuu luoda globaali standardi eettiselle tekoälylle. Kehitykseen on vaikuttanut ympäröivässä maailmassa tapahtuneet muutokset ja se voima, millä teknologian kehitys on yhteiskuntaa ajanut. Teknologian kehityksen luonne on voimakas, rimpuileva ja ennakoimaton, joka asettaa lainsäätäjän kilpajuoksuun, jossa se on aina muutaman askeleen jäljessä. Tasapainottelun tarkastelu on tärkeää, sillä siitä on seurannut yritys luoda "joustavaa" lainsäädäntöä unionin lainsäädäntöinstrumenteilla. Tällä yrityksellä on ollut seurauksensa, joka näkyy hyvin koneoppimista koskevassa tietosuojasääntelyssä ja sen oikeusvarmuudessa. Keskeinen ongelma on right to explanation -oikeuden olemassaolon epävarmuus, joka on keskeinen elementti koneoppimisen innovaatiolle. Erityisesti, kuin tietosuojalainsäädännön mukana tulee myös mahdollisesti merkittävät sanktiot. Oikeusvarmuus on myös keskeistä unionin taloudellisten intressien saavuttamiselle. Näyttääkin siltä, että unionin intressitasapainottelun tuloksena syntynyt lainsäädäntö onkin johtanut tilanteeseen, joka voi potentiaalisesti estää unionin tavoitteiden saavuttamista.
Impact of a CE-Marked Medical Software Sensor on COVID- 19 Pandemic Progression Prediction : a Register Study Using Machine Learning Methods

Limingoja, Leevi; Antila, Kari; Jormanainen, Vesa; Röntynen, Joel; Jägerroos, Vilma; Soinen, Leena; Nordlund, Hanna; Vepsäläinen, Kristian; Kaikkonen, Risto; Lallukka, Tea (2022)

Abstract Background: To address the current COVID-19 and any future pandemic, we need a robust, real-time, and population-scale collection and analysis of data. Rapid and comprehensive knowledge on the trends in reported symptoms in populations provides an earlier window into the progression of the viral spread and helps to predict the needs and timing of professional healthcare. Objective: The objective of this study was to use a CE-marked medical online symptom checker service, ©Omaolo, and validate the data against the national demand for COVID- 19-related care to predict the pandemic progression in Finland. Methods: Our data comprised real-time ©Omaolo COVID-19 symptom checker responses (414,477 in total) and daily admission counts in nationwide inpatient and outpatient registers provided by the Finnish Institute for Health and Welfare (THL) from March 16th to June 15th, 2020 (the first wave of the pandemic in Finland). The symptom checker responses provide self-triage information input to a medically qualified algorithm that produces a personalised probability of having COVID-19, and provides graded recommendations for further actions. We trained linear regression and XGBoost models together with F-score and mutual information feature pre-selectors to predict the admissions once a week, one week in advance. Results: Our models reached a MAPE (mean absolute percentage error) between 24.2% and 36.4% in predicting the national daily patient admissions. The best result was achieved by combining both ©Omaolo and historical patient admission counts. Our best predictor was linear regression with mutual information as the feature pre-selector. Conclusions: Accurate short-term predictions of COVID-19 patient admissions can be made, and both the symptom check questionnaires and the daily admissions data contribute to the accuracy of the predictions. Thus, symptom checkers can be used to estimate the progression of the pandemic, which can be considered when predicting the healthcare burden in a future pandemic.
Impact of a CE-Marked Medical Software Sensor on COVID- 19 Pandemic Progression Prediction: a Register Study Using Machine Learning Methods

Limingoja, Leevi; Antila, Kari; Jormanainen, Vesa; Röntynen, Joel; Jägerroos, Vilma; Soinen, Leena; Nordlund, Hanna; Vepsäläinen, Kristian; Kaikkonen, Risto; Lallukka, Tea (2022)

Abstract Background: To address the current COVID-19 and any future pandemic, we need a robust, real-time, and population-scale collection and analysis of data. Rapid and comprehensive knowledge on the trends in reported symptoms in populations provides an earlier window into the progression of the viral spread and helps to predict the needs and timing of professional healthcare. Objective: The objective of this study was to use a CE-marked medical online symptom checker service, ©Omaolo, and validate the data against the national demand for COVID- 19-related care to predict the pandemic progression in Finland. Methods: Our data comprised real-time ©Omaolo COVID-19 symptom checker responses (414,477 in total) and daily admission counts in nationwide inpatient and outpatient registers provided by the Finnish Institute for Health and Welfare (THL) from March 16th to June 15th, 2020 (the first wave of the pandemic in Finland). The symptom checker responses provide self-triage information input to a medically qualified algorithm that produces a personalised probability of having COVID-19, and provides graded recommendations for further actions. We trained linear regression and XGBoost models together with F-score and mutual information feature pre-selectors to predict the admissions once a week, one week in advance. Results: Our models reached a MAPE (mean absolute percentage error) between 24.2% and 36.4% in predicting the national daily patient admissions. The best result was achieved by combining both ©Omaolo and historical patient admission counts. Our best predictor was linear regression with mutual information as the feature pre-selector. Conclusions: Accurate short-term predictions of COVID-19 patient admissions can be made, and both the symptom check questionnaires and the daily admissions data contribute to the accuracy of the predictions. Thus, symptom checkers can be used to estimate the progression of the pandemic, which can be considered when predicting the healthcare burden in a future pandemic.
Inflaation ennustaminen neuroverkkomallilla taloudellisen taantuman aikana

Korhonen, Markus (2019)

Hintavakauden saavuttamisesta on tullut keskuspankkien tärkeimpiä tehtäviä kaikkialla maailmassa, ja useat keskuspankit pyrkivät tiettyyn, hyvin määriteltyyn inflaatiotavoitteeseen. Samoin Euroopan keskuspankki pyrkii rahapolitiikallaan pitämään inflaation kahden prosentin tuntumassa. Inflaatiotavoite kuitenkin vaatii sen, että inflaatiota voidaan ennustaa mahdollisimman tarkasti. Koneoppimismetodeihin kuuluvat neuroverkkomallit ovat osoittautuneet olemaan monilla aloilla hyviä ennustemalleja. Inflaation ennustamisessa neuroverkkomallien tulokset ovat kuitenkin olleet ristiriitaisia. Aiempi tutkimus inflaation ennustamisesta on myös keskittynyt lähinnä Yhdysvaltojen ja muiden yksittäisten maiden inflaatioon. Tutkimusta ei ole myöskään tehty inflaation ennustamisesta eri suhdannetilanteissa neuroverkkomallien avulla. Tässä tutkielmassa tutkittiinkin neuroverkkomallin kykyä ennustaa inflaatiota koko euroalueella vuosien 2008-2009 taantuman aikana. Tutkielman aineistona käytettiin euroalueen harmonisoidusta kuluttajahintaindeksistä muodostettua inflaatioaikasarjaa vuosilta 1997-2010. Tutkielmassa epälineaarinen neuroverkko rakennettiin aiemmasta kirjallisuudesta vakiintuneella metodilla, jossa mallin valinta suoritettiin käyttämällä erillistä aineistoa. Valitulla mallilla simuloitiin aitoa ennustetilannetta käyttämällä euroalueen taantuman aikaista testiaineistoa. Ennusteet tehtiin myös taantuman jälkeiselle noususuhdanteelle, jotta eri suhdannetilanteita voitiin vertailla. Lisäksi samat ennusteet tehtiin ekonometriassa vakiintuneella lineaarisella mallilla, johon neuroverkkomallia verrattiin käyttämällä aiemmasta kirjallisuudesta tuttuja arviointikriteerejä ja tilastollisia testejä. Tutkielmassa selvisi, että neuroverkkomalli tuottaa hyvin tarkkoja ennusteita inflaatiolle kaikilla tutkielmassa käytetyillä ennusteväleillä. Neuroverkkomallin ennusteet ovat myös parempia, jos käytettävä aineisto on kausitasoitettu. Neuroverkkomalli tekee pienempiä ennustevirheitä noususuhdanteen aikana kuin taantumassa, mutta erot eri suhdannetilanteissa eivät ole kovin suuria. Neuroverkkomallin ennusteet eivät kuitenkaan poikkea yksinkertaisen lineaarisen mallin tekemistä ennusteista tilastollisesti merkitsevästi kummassakaan suhdannetilanteessa. Näin ollen neuroverkkomallin ei voida päätellä toimivan eri tavalla taloudellisessa taantumassa kuin muissa suhdannetilanteissa. Tutkielman tulosten perusteella neuroverkkomallia ei voida suositella keskuspankkien inflaatioennustemalliksi, koska mallin valinta ja testaaminen vievät yksinkertaista lineaarista mallia enemmän aikaa, mutta ennustetulokset eivät ole lineaarista mallia parempia. Tulokset antavatkin todisteita siitä, että inflaatio on euroalueella lineaarinen prosessi, jolloin epälineaariset mallit eivät tuota ennusteisiin lisähyötyä. Neuroverkkomallit voivat kuitenkin antaa hyvän työkalun keskuspankkien toiminnan arvioimiseen, koska niiden tuottamat ennusteet ovat tarkkoja pitemmillekin aikaväleille.
Inflaation ennustaminen neuroverkkomallilla taloudellisen taantuman aikana

Korhonen, Markus (2019)

Hintavakauden saavuttamisesta on tullut keskuspankkien tärkeimpiä tehtäviä kaikkialla maailmassa, ja useat keskuspankit pyrkivät tiettyyn, hyvin määriteltyyn inflaatiotavoitteeseen. Samoin Euroopan keskuspankki pyrkii rahapolitiikallaan pitämään inflaation kahden prosentin tuntumassa. Inflaatiotavoite kuitenkin vaatii sen, että inflaatiota voidaan ennustaa mahdollisimman tarkasti. Koneoppimismetodeihin kuuluvat neuroverkkomallit ovat osoittautuneet olemaan monilla aloilla hyviä ennustemalleja. Inflaation ennustamisessa neuroverkkomallien tulokset ovat kuitenkin olleet ristiriitaisia. Aiempi tutkimus inflaation ennustamisesta on myös keskittynyt lähinnä Yhdysvaltojen ja muiden yksittäisten maiden inflaatioon. Tutkimusta ei ole myöskään tehty inflaation ennustamisesta eri suhdannetilanteissa neuroverkkomallien avulla. Tässä tutkielmassa tutkittiinkin neuroverkkomallin kykyä ennustaa inflaatiota koko euroalueella vuosien 2008-2009 taantuman aikana. Tutkielman aineistona käytettiin euroalueen harmonisoidusta kuluttajahintaindeksistä muodostettua inflaatioaikasarjaa vuosilta 1997-2010. Tutkielmassa epälineaarinen neuroverkko rakennettiin aiemmasta kirjallisuudesta vakiintuneella metodilla, jossa mallin valinta suoritettiin käyttämällä erillistä aineistoa. Valitulla mallilla simuloitiin aitoa ennustetilannetta käyttämällä euroalueen taantuman aikaista testiaineistoa. Ennusteet tehtiin myös taantuman jälkeiselle noususuhdanteelle, jotta eri suhdannetilanteita voitiin vertailla. Lisäksi samat ennusteet tehtiin ekonometriassa vakiintuneella lineaarisella mallilla, johon neuroverkkomallia verrattiin käyttämällä aiemmasta kirjallisuudesta tuttuja arviointikriteerejä ja tilastollisia testejä. Tutkielmassa selvisi, että neuroverkkomalli tuottaa hyvin tarkkoja ennusteita inflaatiolle kaikilla tutkielmassa käytetyillä ennusteväleillä. Neuroverkkomallin ennusteet ovat myös parempia, jos käytettävä aineisto on kausitasoitettu. Neuroverkkomalli tekee pienempiä ennustevirheitä noususuhdanteen aikana kuin taantumassa, mutta erot eri suhdannetilanteissa eivät ole kovin suuria. Neuroverkkomallin ennusteet eivät kuitenkaan poikkea yksinkertaisen lineaarisen mallin tekemistä ennusteista tilastollisesti merkitsevästi kummassakaan suhdannetilanteessa. Näin ollen neuroverkkomallin ei voida päätellä toimivan eri tavalla taloudellisessa taantumassa kuin muissa suhdannetilanteissa. Tutkielman tulosten perusteella neuroverkkomallia ei voida suositella keskuspankkien inflaatioennustemalliksi, koska mallin valinta ja testaaminen vievät yksinkertaista lineaarista mallia enemmän aikaa, mutta ennustetulokset eivät ole lineaarista mallia parempia. Tulokset antavatkin todisteita siitä, että inflaatio on euroalueella lineaarinen prosessi, jolloin epälineaariset mallit eivät tuota ennusteisiin lisähyötyä. Neuroverkkomallit voivat kuitenkin antaa hyvän työkalun keskuspankkien toiminnan arvioimiseen, koska niiden tuottamat ennusteet ovat tarkkoja pitemmillekin aikaväleille.
Jatkuva integraatio ja mallien yhteistoiminta koneoppimissovelluksissa

Räsänen, Toni (2020)

Jatkuvan integraation ja julkaisun (CI/CD) käytänteet ovat tulleet osaksi ohjelmistojenkehitystä osin ketterien ohjelmistokehityskäytänteiden leviämisen myötä. Jatkuva integraatio ja julkaisu pyrkivät tuomaan läpinäkyvyyttä ja seurattavuutta ohjelmistojen kehitykseen. Ne mahdollistavat ohjelmistojen kehityksen pienissä paloissa ja tukevat uusien ominaisuuksien tai korjauksien mahdollisimman vaivatonta julkaisua ja integrointia olemassa olevaan sovellukseen. Koneoppimismallien yleistyessä ohjelmistoissa ohjelmistokehityksessä tarvitaan uusia käytänteitä tukemaan mallien kehityksen tuomia uusia työvaiheita. Koneoppimismallien kehityksessä oleellisessa osassa on opetukseen käytetty data ja mallien opettamistarpeen havainnointi. Useamman mallin hyödyntäminen ohjelmistossa monimutkaistaa ohjelmiston kehitystä ja mallien toiminnan havainnointia, esimerkiksi opetustarpeen päättelyä. Jäljitettävyyden ja toistettavuuden merkitys korostuu, kun mukana on koneoppimismalleja ja niiden mukanaan tuomia uusia työvaiheita. Tässä työssä tarkastellaan miten koneoppimismallien hyödyntäminen ohjelmistoissa vaikuttaa ohjelmistonkehityksen työnkulkuun. Pyritään selvittämään minkälaisia vaatimuksia koneoppimismallien mukaantulo asettaa jatkuvan integroinnin ja julkaisun käytänteille ja niitä tukeville CI/CD-järjestelmille. Lähemmin tarkastellaan asetelmaa, jossa kehitettävässä ohjelmistossa on kaksi koneoppimismallia. Pohditaan, miten useamman mallin keskinäinen toiminta sujuu ja minkälaisia vaikutuksia mallien vuorovaikutuksella on esimerkiksi mallien opettamiseen ja opetustarpeen päättelyyn.
Käyttötarkoitussidonnaisuus ja tietojen minimointi koneoppimisjärjestelmän kouluttamisvaiheessa

Bonnici, Belinda (2022)

Koneoppimista, joka on yksi tekoälyn alalajeista, hyödynnetään enenevässä määrin yhteiskunnan eri osa-alueilla. Koneoppimisen yhteydessä saatetaan usein hyödyntää myös henkilötietoja. Henkilötietoja voidaan hyödyntää ensinnäkin koneoppimisjärjestelmän kouluttamisvaiheessa, eli algoritmisen mallin luomisessa. Lisäksi valmista koneoppimisjärjestelmää voidaan soveltaa henkilötietoihin esimerkiksi ennusteiden tai päätelmien tekemiseksi tietystä henkilöstä. Tällöin keskeiseksi nousee EU:n yleinen tietosuoja-asetus, jossa muun muassa henkilötietojen käsittelyssä noudatettavilla tietosuojaperiaatteilla on tärkeä rooli. Tutkielmassa keskitytään systematisoimaan ja tulkitsemaan käyttötarkoitussidonnaisuuden ja tietojen minimoinnin periaatteita koneoppimisjärjestelmän kouluttamisen kontekstissa. Erityisesti tavoitteena on arvioida haasteita, joita kyseiset periaatteet asettavat koneoppimisjärjestelmien kehittämiselle ja esittää periaatteiden tulkinnasta kannanottoja, jotka eivät asettaisi esteitä kyseisten järjestelmien kehittämiselle. Laadukas ja laaja koulutusdatajoukko on edellytys sille, että koneoppimisjärjestelmä toimii oikein ja sen tulevaisuudessa tekemät ennusteet ovat asianmukaisia. Tutkimuksen keskiössä olevat periaatteet saattavat kuitenkin rajoittaa koneoppimisjärjestelmän kouluttamistarkoitukseen käytettävissä olevan datan määrää. Tekoälyteknologioiden tärkeys on tunnistettu myös Euroopan unionissa, ja Euroopan komissio onkin julkaissut huhtikuussa 2021 tekoälysäädösehdotuksen. Ehdotuksen tarkoituksena olisi edistää tekoälyn kehitystä ja torjua turvallisuuteen ja perusoikeuksiin kohdistuvia riskejä. Ensisijaisesti ehdotuksen tavoitteena olisi taata mahdollisimman toimivat ja vapaat sisämarkkinat asettamalla yhdenmukaistetut säännöt tekoälyn kehittämiselle, markkinoille saattamiselle ja käytölle EU:n alueella. Koska ehdotetulla tekoälysäädöksellä olisi risteämäkohtia myös tietosuojalainsäädännön kanssa, tutkielmassa huomioidaan toissijaisesti myös tutkielman aiheen kannalta relevanttien tekoälysäädösehdotuksen säännösten mahdolliset vaikutukset. EU:n tietosuojalainsäädäntö on teknologianeutraali ja sen tarkoituksena on edistää erilaisten teknologiaratkaisujen soveltamista henkilötietojen käsittelyyn eurooppalaisia arvoja ja perusoikeuksia kunnioittaen. Tästä huolimatta käyttötarkoitussidonnaisuuden ja tietojen minimoinnin periaatteet eivät ole välttämättä helposti yhteensovitettavissa koneoppimisjärjestelmän kouluttamistarkoituksen kanssa. Kyseiset periaatteet ovat kuitenkin joustavia ja mahdollistavat erilaisia tulkintoja. Periaatteita tulisikin tulkita tavalla, joka ei koneoppimiskontekstissa johda tietosuoja-asetuksen tavoitteiden kannalta ristiriitaiseen lopputulokseen, vaan sovittaa yhteen henkilötietojen suojaan ja hyödyllisten koneoppimisjärjestelmien kehittämiseen liittyvät tavoitteet ja intressit.
Koneoppiminen ja matematiikka : johdanto aiheeseen ja kertausmateriaali

Hautala, Anni (2020)

Tekoälyä ja koneoppimista hyödynnetään yhä useammilla tieteen ja liike-elämän aloilla ja tekoälyteknologioiden kehittyessä niiden käyttämisestä tulee yhä helpompaa ja yleisempää. Koneoppimisessa käytettävissä malleissa on taustalla paljon erilaista matematiikkaa ja tilastotiedettä. Menetelmien syvällinen ymmärtäminen ja soveltaminen vaatii ymmärrystä taustalla olevista matemaattisista rajoitteista ja sovellusmahdollisuuksista. Tässä tutkielmassa tarkastellaan koneoppimisen matemaattista perustaa. Työ on jaettu kahteen osaan. Ensimmäisessä osassa esitellään muutamia koneoppimisessa tarvittavia matematiikan osa-alueita, joita tarvitaan koneoppimisessa: lineaarialgebran ja matriisilaskennan sekä todennäköisyyslaskennan perusteita. Tämä osa toimii johdantona tai kertausmateriaalina kyseisiin matematiikan osa-alueisiin. Työn toisessa osassa esitellään yleisesti koneoppimisen peruskäsitteitä ja muotoillaan koneoppimisprosessia matemaattisesti. Sitten käydään läpi kaksi koneoppimismenetelmää, lineaarinen regressioanalyysi ja pääkomponenttianalyysi (PCA). Molemmista menetelmistä esitetään perusperiaate, matemaattista taustaa ja käytännön esimerkkejä Python-ohjelmointikielellä. Tutkielma perustuu kirjallisuuskatsaukseen.
Laskennallisesti raskaan simulointiohjelmistokomponentin korvaaminen reaaliaikasovelluksessa koneoppimismenetelmällä

Erälaukko, Hannu (2022)

Ilmataistelussa on keskeistä pystyä laskemaan, missä kulkee raja sille, milloin kohteen on mahdollista altistua vihollisen ohjusuhalle eli missä sijaistee kohteen ja vihollisen välissä olevan maantieteellisen LAR-alueen (Launch Acceptability Region) raja. Tämä raja voidaan laskea ohjuksen lentämistä simuloivalla simulointiohjelmistokomponentilla. Tämän tutkielman tavoitteena oli löytää ratkaisu, joka mahdollistaisi rajojen sijaintien laskemisen eräässä reaaliaikasovelluksessa siten, että laskeminen perustuisi tällaisen simulointiohjelmistokomponentin tuloksiin, vaikka komponentti itse on liian hidas käytettäväksi kyseisessä reaaliaikasovelluksessa. Päätettiin, että simulointiohjelmistokomponentti korvattaisiin koneoppimismenetelmällä, joka on opetettu jäljittelemään simulointiohjelmistokomponenttia. Ratkaisun löytämiseksi perehdyttiin erilaisiin koneoppimismenetelmiin, joista yksi valittiin alustavaksi ratkaisuksi. Valitun koneoppimismenetelmän, neuroverkon, teoriaan perehdyttiin kirjallisuuskatsauksella, jotta sen kehittämisen tueksi saatiin tietämystä. Neuroverkosta kehitettiin lopullinen ratkaisu Design Science Research -prosessilla. Neuroverkko osoittautui riittävän nopeaksi, että sitä voidaan käyttää halutussa reaaliaikasovelluksessa. Neroverkon kyky jäljitellä simulointiohjelmistokomponentin tuloksia osoittautui myös riittävän tarkaksi.
Lasten seksuaalisen hyväksikäytön tunnistaminen koneoppimisen avulla

Pihlapuro, Aki (2020)

Tavoitteet: Tutkimuksen tavoitteena oli selvittää, pystytäänkö koneoppimisen avulla luomaan ennustetyökalu, joka auttaa tunnistamaan lasten seksuaaliseen hyväksikäyttöön liittyviä tekijöitä ja joka pystyy luotettavasti arvioimaan seksuaalisen hyväksikäytön todennäköisyyttä. Suoriutumiseltaan kyvykästä tilastollista työkalua voidaan käyttää seksuaalisen hyväksikäytön selvitystyössä ja koulutuksessa. Menetelmät: Tilastollisen työkalun luomisessa käytettiin vuonna 2013 kerättyä Lapsiuhritutkimuksen aineistoa. Aineisto sisälsi 10665 10-17- vuotiaan lapsen ja nuoren vastaukset 52 eri kysymyksestä. Tilastollisena menetelmänä käytettiin luokittelu- ja regressiopuuta (CART) ennustetyökalun rakentamisessa. Tilastollisen työkalun suoriutumista arvioitiin sensitiivisyyden, spesifisyyden, AUC:n ja Brierin pisteiden avulla. Tulokset: Lasten seksuaalisen hyväksikäytön todennäköisyyttä ennustavia päätöspuita onnistuttiin luomaan useissa eri aineiston osajoukoissa. Seksuaalisen hyväksikäytön luokitteluun tunnistettiin ydinkysymyksiä, jotka liittyivät lapsen lähiympäristöön, fyysisen kypsymisen vaikutuksiin, aikaisempiin uhrikokemuksiin sekä mielenterveyden ja käyttäytymisen oireiluun. Tilastollisen ennustetyökalun suoriutuminen todettiin olevan arvausta parempi, mutta luokittelijana epätarkka. Johtopäätökset: Tutkimuksen avulla löydettiin seksuaaliseen hyväksikäyttöön liittyviä ydinkysymyksiä, jotka tukivat aiempien tutkimusten löydöksiä. Tilastollisen ennustetyökalun suoriutuminen todettiin olevan riittämättömällä tasolla siihen nähden, että työkalu olisi valmis otettavaksi käyttöön sellaisenaan. Jatkotutkimusta tarvitaan niin vaihtoehtoisten tilastollisten menetelmien soveltuvuudesta kuin erilaisten aineistojen käytöstä.
Lasten seksuaalisen hyväksikäytön tunnistaminen koneoppimisen avulla

Pihlapuro, Aki (2020)

Tavoitteet: Tutkimuksen tavoitteena oli selvittää, pystytäänkö koneoppimisen avulla luomaan ennustetyökalu, joka auttaa tunnistamaan lasten seksuaaliseen hyväksikäyttöön liittyviä tekijöitä ja joka pystyy luotettavasti arvioimaan seksuaalisen hyväksikäytön todennäköisyyttä. Suoriutumiseltaan kyvykästä tilastollista työkalua voidaan käyttää seksuaalisen hyväksikäytön selvitystyössä ja koulutuksessa. Menetelmät: Tilastollisen työkalun luomisessa käytettiin vuonna 2013 kerättyä Lapsiuhritutkimuksen aineistoa. Aineisto sisälsi 10665 10-17- vuotiaan lapsen ja nuoren vastaukset 52 eri kysymyksestä. Tilastollisena menetelmänä käytettiin luokittelu- ja regressiopuuta (CART) ennustetyökalun rakentamisessa. Tilastollisen työkalun suoriutumista arvioitiin sensitiivisyyden, spesifisyyden, AUC:n ja Brierin pisteiden avulla. Tulokset: Lasten seksuaalisen hyväksikäytön todennäköisyyttä ennustavia päätöspuita onnistuttiin luomaan useissa eri aineiston osajoukoissa. Seksuaalisen hyväksikäytön luokitteluun tunnistettiin ydinkysymyksiä, jotka liittyivät lapsen lähiympäristöön, fyysisen kypsymisen vaikutuksiin, aikaisempiin uhrikokemuksiin sekä mielenterveyden ja käyttäytymisen oireiluun. Tilastollisen ennustetyökalun suoriutuminen todettiin olevan arvausta parempi, mutta luokittelijana epätarkka. Johtopäätökset: Tutkimuksen avulla löydettiin seksuaaliseen hyväksikäyttöön liittyviä ydinkysymyksiä, jotka tukivat aiempien tutkimusten löydöksiä. Tilastollisen ennustetyökalun suoriutuminen todettiin olevan riittämättömällä tasolla siihen nähden, että työkalu olisi valmis otettavaksi käyttöön sellaisenaan. Jatkotutkimusta tarvitaan niin vaihtoehtoisten tilastollisten menetelmien soveltuvuudesta kuin erilaisten aineistojen käytöstä.
Markkinaliikkeiden ennustaminen ohjatun oppimisen ja teknisen analyysin kautta

Huttunen, Mika (2021)

Arvopaperin tulevan hinnanmuodostuksen ennustaminen on mielenkiintoista niin sijoittajan kuin aktiivisesti kauppaa tekevän markkinatoimijan näkökulmasta. Tarpeeksi hyvällä tarkkuudella arvopaperin tulevaa hinnanmuodostusta ennustamalla voi markkinatoimija ostaa arvopaperia ennen sen mahdollista markkinahinnan nousua, tai suojata salkkuaan sitä jo omistaessaan, mikäli on vaara, että arvopaperin markkinahinta laskee ajan mittaan merkittävästi. Tutkielmassani käsittelen koneoppimisen soveltamista tekniseen analyysiin. Tutkin, voidaanko tekniseen analyysiin pohjautuen markkinan tai arvopaperin tulevaa hinnanmuodostusta ennustaa lyhyellä aikavälillä tarpeeksi hyvällä tarkkuudella. Selvitän arvopaperimarkkinoiden toimintaa ja käyn läpi, miten tarkasteltavan markkinan tulevaa kysynnän ja tarjonnan suhdetta voidaan teknistä analyysiä hyödyntäen pyrkiä ennustamaan. Taustoitan myös omassa tutkimuksessa käyttämieni teknisen analyysin indikaattorien sekä koneoppimisen menetelmien toimintaa ja esitän aiempaa tutkimusta ongelman parissa. Havaitsin, että markkinoiden tulevan hinnanmuodostuksen ennustaminen on haastavaa. Käyttämilläni ohjatun oppimisen menetelmillä en onnistunut generoimaan mallia, joka olisi osannut ennustaa S&P 500-osakeindeksille, onko tarkasteltavaa ajanhetkeä seuraavan lyhyen aikavälin päätteeksi markkinahinta korkeammalla vai enintään yhtä korkealla kuin tarkasteluajankohtana. Opetetut mallit saavuttivat parhaimmillaan vain 50.8 − 51.4 % ennustetarkkuuden, kun taas naiivi luokittelija, joka ennustaa jokaisen aikavälin päätteeksi markkinahinnan kohonneen saavuttaa 53.0 %:n tarkkuuden. Vehnäfutuurisopimusmarkkinalle saamani tulokset olivat lupaavampia ja opetetut mallit saavuttivat edellä mainitun ongelmanratkaisuun parhaimmillaan 51.7 − 52.5 % ennustetarkkuuden, joka ylitti naiivin luokittelijan 50.9 % tarkkuuden. Analysoin saamiani tuloksia ja esitin jatkotutkimusmahdollisuuksia mallien tehostamiseksi.

Now showing items 1-20 of 31

Browsing by Subject "koneoppiminen"

Yhteystiedot

HELSINGIN YLIOPISTO