Skip to main content
Login | Suomeksi | På svenska | In English

Suomenkielisten lehtiartikkelien luokittelu

Show simple item record

dc.date.accessioned 2010-11-25T12:19:23Z und
dc.date.accessioned 2017-11-06T12:17:15Z
dc.date.available 2010-11-25T12:19:23Z und
dc.date.available 2017-11-06T12:17:15Z
dc.date.issued 1998-11
dc.identifier.uri http://hdl.handle.net/10138/21406
dc.publisher Helsingin yliopisto fi
dc.publisher University of Helsinki en
dc.publisher Helsingfors universitet sv
dc.title Suomenkielisten lehtiartikkelien luokittelu fi
ethesis.department.URI http://data.hulib.helsinki.fi/id/225405e8-3362-4197-a7fd-6e7b79e52d14
ethesis.department Institutionen för datavetenskap sv
ethesis.department Department of Computer Science en
ethesis.department Tietojenkäsittelytieteen laitos fi
ethesis.faculty Matematisk-naturvetenskapliga fakulteten sv
ethesis.faculty Matemaattis-luonnontieteellinen tiedekunta fi
ethesis.faculty Faculty of Science en
ethesis.faculty.URI http://data.hulib.helsinki.fi/id/8d59209f-6614-4edd-9744-1ebdaf1d13ca
ethesis.university.URI http://data.hulib.helsinki.fi/id/50ae46d8-7ba9-4821-877c-c994c78b0d97
ethesis.university Helsingfors universitet sv
ethesis.university University of Helsinki en
ethesis.university Helsingin yliopisto fi
dct.creator Silvonen, Mikko
dct.issued 1998
dct.language.ISO639-2 fin
dct.abstract Dokumenttien luokittelua eli tekstin aihepiirin automaattista tunnistusta on aikaisemmin sovellettu pääasiassa englanninkielisiin dokumentteihin. Tutkimuksen tarkoituksena oli mahdollistaa suomenkielisiä lehtiartikkeleita luokittelevan ohjelman kehittäminen. Tutkielma alkaa lyhyellä katsauksella aikaisempaan tutkimukseen. Pääaiheena on kolmen ohjattuun oppimiseen perustuvan luokittelualgoritmin (naiivin Bayesin luokittimen, tasapainotetun Winnow+:n ja assosiaatiosääntöjen) vertailu Helsingin Sanomien aineiston avulla. Dokumenttien esikäsittelyyn ja luokittelupiirteiden valintaan käytetään FINCG-nimistä suomen kielen jäsennysohjelmaa. Parhaiten toimivaksi vaihtoehdoksi osoittautui perusmuotoon palautettuja substantiiveja käyttävä naiivi Bayesin luokitin. fi
dct.subject dokumenttien luokittelu fi
dct.subject naiivi Bayesin luokitin fi
dct.subject Winnow
dct.subject assosiaatiosäännöt fi
dct.subject suomen kieli fi
dct.language fi
ethesis.language.URI http://data.hulib.helsinki.fi/id/languages/fin
ethesis.language Finnish en
ethesis.language suomi fi
ethesis.language finska sv
ethesis.thesistype pro gradu-avhandlingar sv
ethesis.thesistype pro gradu -tutkielmat fi
ethesis.thesistype master's thesis en
ethesis.thesistype.URI http://data.hulib.helsinki.fi/id/thesistypes/mastersthesis
dct.identifier.urn URN:NBN:fi-fe20021348
dc.type.dcmitype Text
dct.rights This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. en
dct.rights Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden. sv
dct.rights Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. fi

Files in this item

Files Size Format View
suomenki.pdf 980.1Kb PDF
tiiviste.pdf 95.19Kb PDF

This item appears in the following Collection(s)

Show simple item record