Skip to main content
Login | Suomeksi | På svenska | In English

Hajautetun tietovaraston kyselynoptimointi

Show simple item record

dc.date.accessioned 2014-10-07T10:16:26Z und
dc.date.accessioned 2017-10-24T12:23:53Z
dc.date.available 2014-10-07T10:16:26Z und
dc.date.available 2017-10-24T12:23:53Z
dc.date.issued 2014-10-07T10:16:26Z
dc.identifier.uri http://radr.hulib.helsinki.fi/handle/10138.1/4213 und
dc.identifier.uri http://hdl.handle.net/10138.1/4213
dc.title Hajautetun tietovaraston kyselynoptimointi fi
ethesis.discipline Computer science en
ethesis.discipline Tietojenkäsittelytiede fi
ethesis.discipline Datavetenskap sv
ethesis.discipline.URI http://data.hulib.helsinki.fi/id/1dcabbeb-f422-4eec-aaff-bb11d7501348
ethesis.department.URI http://data.hulib.helsinki.fi/id/225405e8-3362-4197-a7fd-6e7b79e52d14
ethesis.department Institutionen för datavetenskap sv
ethesis.department Department of Computer Science en
ethesis.department Tietojenkäsittelytieteen laitos fi
ethesis.faculty Matematisk-naturvetenskapliga fakulteten sv
ethesis.faculty Matemaattis-luonnontieteellinen tiedekunta fi
ethesis.faculty Faculty of Science en
ethesis.faculty.URI http://data.hulib.helsinki.fi/id/8d59209f-6614-4edd-9744-1ebdaf1d13ca
ethesis.university.URI http://data.hulib.helsinki.fi/id/50ae46d8-7ba9-4821-877c-c994c78b0d97
ethesis.university Helsingfors universitet sv
ethesis.university University of Helsinki en
ethesis.university Helsingin yliopisto fi
dct.creator Hirvonen, Anna
dct.issued 2014
dct.language.ISO639-2 fin
dct.abstract Suurten tietomäärien käsittely peräkkäisessä tietovarastossa on tehotonta, minkä seurauksena käyttäjän kyselyiden vasteajat ovat kohtuuttoman pitkät. Viime vuosina markkinoille on ilmestynyt joukko massiivisesti rinnakkaisia tietovarastoja, joissa kysely käsitellään rinnakkain useassa pisteessä. Hajautetuissa tietovarastoissa tiedon määrän lisääntyessä kyselyiden vasteaikojen tulisi pysyä ennallaan lisäämällä pisteiden määrää. Kyselynoptimoinnin tavoitteena on lyhentää kyselyiden vasteaikoja. Täten hajautetun tietovaraston kyselynoptimoinnissa optimoidaan kyselynkäsittelyn lisäksi tietovaraston skaalautuvuutta. Kyselynoptimoinnissa minimoidaan leyoperaatioiden ja kommunikoinnin määrää. Hajautetussa tietovarastossa kyselyn käsittely on optimaalista, kun pisteet käsittelevät kyselyn relaatioiden erillisiä paloja täysin itsenäisesti. Tällöin kyselyn käsittelyssä ei esiinny kommunikoinnin eikä laskennan toistoa. Käytännössä monimutkaisten kyselyiden käsittely vaatii kuitenkin tiedon hajauttamista uudelleen kyselynkäsittelyn aikana useaan kertaan. Kommunikoinnin ja laskennan toistoa voidaan vähentää optimoimalla tietovaraston hajautuskaavioita ja kyselynkäsittelyn algoritmeja. Tietoanalyyseissa tietovarasto mallinnetaan usein tietokuutiona, jonka koosteista materialisoidaan osa kyselynkäsittelyn nopeuttamiseksi. Materialisoituvat näkymät ja hakemistot luodaan tiettyjen kyselyiden käsittelyä varten, minkä takia ne tukevat heikosti ad-hoc-kyselyitä. Materialisoituvat näkymät vaativat myös paljon tallennustilaa ja ne kallistavat huomattavasti tietovaraston päivitystä. Kaupallisissa massiivisesti rinnakkaisissa tietovarastoissa, kuten Redshiftissä ja Verticassa, tieto tallennetaankin sarakkeittain, mikä parantaa kyselynkäsittelyn suorituskykyä yleisesti. Kyseiset tietovarastot eivät käytä lainkaan materialisoituvia näkymiä. Tässä tutkielmassa tarkastellaan kyselynoptimoinnin menetelmiä hajautettuihin tietovarastoihin, jotka on toteutettu yksityislevyjärjestelminä. Akateemisista tutkimuksista ja kaupallisista järjestelmistä päätellen hajautetun relaatiopohjaisen tietovaraston suorituskyvyn kannalta tärkeimpiä optimoinnin kohteita ovat tiedon hajauttaminen ja rinnakkainen kyselynkäsittely. Täten tutkielmani pääpaino on tiedon hajauttamisen ja rinnakkaisen kyselynkäsittelyn optimoinnissa. Tietovaraston kyselyiden yleisimmistä operaatioista käsitellään liitokset ja ryhmittely. Tosiaikaisen tiedonjalostuksen menetelmistä tarkastellaan kuutiointioperaation ja tietokuution rinnakkaista laskentaa. fi
dct.language fi
ethesis.language.URI http://data.hulib.helsinki.fi/id/languages/fin
ethesis.language Finnish en
ethesis.language suomi fi
ethesis.language finska sv
ethesis.thesistype pro gradu-avhandlingar sv
ethesis.thesistype pro gradu -tutkielmat fi
ethesis.thesistype master's thesis en
ethesis.thesistype.URI http://data.hulib.helsinki.fi/id/thesistypes/mastersthesis
dct.identifier.urn URN:NBN:fi-fe2017112251843
dc.type.dcmitype Text

Files in this item

Files Size Format View
annaHirvonen.pdf 860.1Kb PDF

This item appears in the following Collection(s)

Show simple item record