Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by Author "Törnroos, Juha"

Sort by: Order: Results:

  • Törnroos, Juha (2012)
    Perinteinen tekstihaku vertaa toisiinsa tekstistä löytyviä merkkijonoja, jolloin esimerkiksi hakusanalla 'Nokia' voidaan tulokseksi saada dokumentteja matkapuhelinvalmistajasta, Nokian kaupungista tai F.E Sillanpään Ihmiset suviyössä teoksen päähenkilöstä. Tässä tutkielmassa esitetään informaation haussa (engl. Information Retrieval, IR) käytettävä menetelmä, jolla on mahdollista hakea tekstidokumentteja tarkasti määritellyllä käsitteellä. Tarkasti määritellyllä käsitteellä tarkoitetaan ontologiassa, koneymmärrettävässä sanastossa, määriteltyä käsitettä. Tässä tutkielmassa keskitytään erityisesti historiaontologiassa määriteltyihin tapahtumiin. Tutkielmassa esitetty menetelmä pyrkii tunnistamaan dokumentissa esiintyvät käsitteet sanoja ympäröivän semantiikan perusteella. Täsmällisesti sanaa ympäröivä semantiikka saadaan niin kutsutusta semanttisesta avaruudesta, joka muodostetaan piilevän semantiikan analyysiksi (engl. Latent Semantic Analysis, LSA) kutsutulla matemaattisella menetelmällä, ja ympäröivää semantiikkaa sovelletaan ontologiseen kyselyn laajentamiseen. Mallin toimivuutta pyrittiin arvioimaan koejärjestelyllä, jossa aineistona käytetään Suomalaista historiaontologiaa ja suomenkielisen Wikipedia-tietosanakirjan artikkeleita. Koejärjestelyssä ilmenneiden vaikeuksien vuoksi toimivuuden arviointi jäi puutteelliseksi. Tutkielman lopussa on pohdittu menetelmän merkitystä informaation haussa yleisesti, sillä tutkielmassa kuvattu menetelmä ontologiassa määriteltyjen käsitteiden kuvaamisesta tekstidokumenttien määräämään semanttiseen avaruuteen on uusi, eikä aiempaa tutkimusta menetelmän toiminnasta tai kehittämisestä ole tehty.