Grafiikkaprosessorin avustama järjestäminen on hyödyllistä tilanteissa, joissa keskusyksikkö ei pysty järjestämään syötettä riittävän nopeasti, tai jos syöte on jo valmiiksi grafiikkaprosessorin muistissa muun laskennan yhteydessä. Tässä työssä käydään läpi pikajärjestämisen, kantalukujärjestämisen ja lomitusjärjestämisen peräkkäin toimivat algoritmit ja selitetään uusimpien tutkimusten perusteella, kuinka niitä sovelletaan grafiikkaprosessorille rinnakkain suoritettavaksi.
Lomitusvaihtojärjestäminen toteutettiin CUDA-alustalle ja sen suorituskykyä verrattiin Thrust-kirjaston lomitus- ja kantalukujärjestämistoteutuksiin. Mittausten mukaan lomitusvaihtojärjestäminen on keskusyksikössä toimivaa pikajärjestämistä nopeampi, mutta se ei pärjää suorituskyvyssä kirjaston toteutuksiin, kun syötteen alkioiden lukumäärä kasvatetaan. Lisäksi mitattiin, miten syötteen alkioiden koon muuttaminen vaikuttaa mainittujen kolmen toteutuksen järjestämisnopeuksiin. Kokeiden mukaan kantalukujärjestäminen on nopein, kun alkiot ovat muutaman tavun kokoisia, mutta alkioiden koon kasvaessa lomitusjärjestäminen menee suorituskyvyssä edelle.