Skip to main content
Login | Suomeksi | På svenska | In English

Browsing by Author "Ruoho, Matti"

Sort by: Order: Results:

  • Ruoho, Matti (2017)
    Datakeskukset koostuvat suuresta joukosta palvelimia jotka tallentavat ja käsittelevät suuria datamääriä. Niiden avulla on mahdollista toteuttaa suuria laskennallisia operaatioita hajauttamalla ne tehokkaasti eri palvelimien kesken, laskemalla yhteen eri palvelimien palauttamat tulokset ja palauttamalla lopputulos käyttäjälle tai palvelun pyytäjälle. Esimerkkejä tästä ovat Googlen ja Yahoon kaltaisten yhtiöiden käyttämät ohjelmistot ja algoritmit kuten MapReduce ja Search. Datakeskukset ovat monin osin erilaisia verrattuna Internetiin, esimerkiksi kun puhutaan verkkojen topologisesta rakenteesta, siirtonopeuksista ja muista verkkoliikenteen ominaisuuksista, minkä vuoksi datakeskuksista on tullut merkittävä tutkimuskohde. Koska erot Internetiin ovat huomattavia, datakeskuksissa joudutaan tekemään toisenlaisia ratkaisuja tietoliikenteen ruuhkautumisen välttämiseksi. Internetin kuljetusprotokolla TCP ei sellaisenaan sovi datakeskuksen kaltaiseen ympäristöön; tämän vuoksi TCP:stä on jouduttu kehittämään datakeskuksia varten erilaisia muunnoksia. Ohjelmistot, joita ajetaan datakeskuksissa, voidaan pääasiassa jakaa kahteen kategoriaan kun vertaillaan millaista niiden tietoliikenne on: 1) Toisille on ominaista korkea läpisyöttö jossa lähetetään suurikokoisia viestejä, toisin sanoen verkon linkit ovat jatkuvasti puskuroitu täyteen siirrettävästä datasta; 2) toisenlaisissa sovelluksissa on tärkeää että tieto siirtyy ilman viivytyksiä (toisin sanoen vastausajat ovat pieniä) ja siirrettävät viestit ovat näin ollen pienempiä. TCP Incast on tilanne jossa suuri joukko palvelimia lähettää tietoa yhdelle käyttäjälle samanaikaisesti ja dataa on niin paljon ettei vastaanottaja pysty puskuroimaan kaikkea dataa; tämä johtaa datapakettien häviämiseen ja uudelleen lähettämiseen. TCP Outcast on edellistä vastakkainen tilanne jossa suuret tietovirrat ja pienemmät tietovirrat ovat matkalla samaan aikaan samasta verkon portista ulos ja pienemmät tietovirrat joutuvat jonottamaan isompien tietovirtojen takana. Kun toteutetaan tiedonsiirtoa datakeskuksessa, joudutaan tekemään kompromissi sen välillä minkä tyyppistä tietoliikennettä datakeskuksessa ajettavat ohjelmistot harjoittavat. Siksi haasteena onkin toteuttaa yleinen protokolla joka pystyy mukautumaan erilaisiin tilanteisiin ilman että verkon laitteistoon tarvitsisi tehdä muutoksia. Tässä tukielmassa luodaan yleiskatsaus siihen miten datakeskusten ruuhkanhallintaa on tutkittu viime vuosina. Ruuhkan syitä esitellään käymällä läpi datakeskusten topologioiden erityisiä ominaisuuksia ja sitä kautta datakeskusten ja Internetin tietoliikenteen välisiä eroavaisuuksia. Eri ruuhkanhallinta- algoritmeja esitellään ja lopuksi suoritetaan vertailu jossa eri algoritmien etuja ja heikkouksia pohditaan. ACM Computing Classification System (CCS): • Networks~Data center networks • Networks~Transport protocols