dc.date.accessioned |
2010-11-25T12:19:23Z |
und |
dc.date.accessioned |
2017-11-06T12:17:15Z |
|
dc.date.available |
2010-11-25T12:19:23Z |
und |
dc.date.available |
2017-11-06T12:17:15Z |
|
dc.date.issued |
1998-11 |
|
dc.identifier.uri |
http://hdl.handle.net/10138/21406 |
|
dc.publisher |
Helsingin yliopisto |
fi |
dc.publisher |
University of Helsinki |
en |
dc.publisher |
Helsingfors universitet |
sv |
dc.title |
Suomenkielisten lehtiartikkelien luokittelu |
fi |
ethesis.department.URI |
http://data.hulib.helsinki.fi/id/225405e8-3362-4197-a7fd-6e7b79e52d14 |
|
ethesis.department |
Institutionen för datavetenskap |
sv |
ethesis.department |
Department of Computer Science |
en |
ethesis.department |
Tietojenkäsittelytieteen laitos |
fi |
ethesis.faculty |
Matematisk-naturvetenskapliga fakulteten |
sv |
ethesis.faculty |
Matemaattis-luonnontieteellinen tiedekunta |
fi |
ethesis.faculty |
Faculty of Science |
en |
ethesis.faculty.URI |
http://data.hulib.helsinki.fi/id/8d59209f-6614-4edd-9744-1ebdaf1d13ca |
|
ethesis.university.URI |
http://data.hulib.helsinki.fi/id/50ae46d8-7ba9-4821-877c-c994c78b0d97 |
|
ethesis.university |
Helsingfors universitet |
sv |
ethesis.university |
University of Helsinki |
en |
ethesis.university |
Helsingin yliopisto |
fi |
dct.creator |
Silvonen, Mikko |
|
dct.issued |
1998 |
|
dct.language.ISO639-2 |
fin |
|
dct.abstract |
Dokumenttien luokittelua eli tekstin aihepiirin automaattista tunnistusta on aikaisemmin sovellettu pääasiassa englanninkielisiin dokumentteihin. Tutkimuksen tarkoituksena oli mahdollistaa suomenkielisiä lehtiartikkeleita luokittelevan ohjelman kehittäminen. Tutkielma alkaa lyhyellä katsauksella aikaisempaan tutkimukseen. Pääaiheena on kolmen ohjattuun oppimiseen perustuvan luokittelualgoritmin (naiivin Bayesin luokittimen, tasapainotetun Winnow+:n ja assosiaatiosääntöjen) vertailu Helsingin Sanomien aineiston avulla. Dokumenttien esikäsittelyyn ja luokittelupiirteiden valintaan käytetään FINCG-nimistä suomen kielen jäsennysohjelmaa. Parhaiten toimivaksi vaihtoehdoksi osoittautui perusmuotoon palautettuja substantiiveja käyttävä naiivi Bayesin luokitin. |
fi |
dct.subject |
dokumenttien luokittelu |
fi |
dct.subject |
naiivi Bayesin luokitin |
fi |
dct.subject |
Winnow |
|
dct.subject |
assosiaatiosäännöt |
fi |
dct.subject |
suomen kieli |
fi |
dct.language |
fi |
|
ethesis.language.URI |
http://data.hulib.helsinki.fi/id/languages/fin |
|
ethesis.language |
Finnish |
en |
ethesis.language |
suomi |
fi |
ethesis.language |
finska |
sv |
ethesis.thesistype |
pro gradu-avhandlingar |
sv |
ethesis.thesistype |
pro gradu -tutkielmat |
fi |
ethesis.thesistype |
master's thesis |
en |
ethesis.thesistype.URI |
http://data.hulib.helsinki.fi/id/thesistypes/mastersthesis |
|
dct.identifier.urn |
URN:NBN:fi-fe20021348 |
|
dc.type.dcmitype |
Text |
|
dct.rights |
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. |
en |
dct.rights |
Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden. |
sv |
dct.rights |
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. |
fi |