Skip to main content
Login | Suomeksi | På svenska | In English

HIV integrase binding sites in host cell genome

Show full item record

Title: HIV integrase binding sites in host cell genome
Author(s): Rossi, Katriina
Contributor: University of Helsinki, Faculty of Biological and Environmental Sciences, Faculty of Biological and Environmental Sciences
Discipline: Biochemistry
Language: English
Acceptance year: 2020
Abstract:
Tyypin 1 HI-viruksen aiheuttamasta immuunipuutossairaudesta, AIDS:sta, kärsii lähes 38 miljoonaa ihmistä maailmassa. Kuten kaikki retrovirukset, myös HI-virus pystyy liittämään kopion genomistaan isäntäsolun DNA:han. Tällä tavoin infektion vaikutus kestää koko eliniän. Infektoidessaan virus käänteiskopioi kahtena identtisenä RNA-juosteena olevan genominsa. Tämän jälkeen viruksen sisältämä proteiini nimeltään integraasi liittää DNA-molekyylit osaksi ihmisen immuunijärjestelmässä toimivien T-solujen genomia. Tutkimukset ovat osoittaneet, että monet retrovirukset suosivat integraatioprosessissa tiettyjä genomin alueita. Retrovirusten suosimia integraatiopaikkoja ovat esimerkiksi aktiiviset transkriptiopaikat sekä promoottorialueet. Integraation suorittavan integraasin rakenteesta löytyy tuman lokalisaatiosignaali, ja sillä on kyky sitoutua ihmisen genomiin. Nämä ominaisuudet saavat pohtimaan, voisiko integraasilla olla integraation lisäksi muitakin tehtäviä. Esimerkiksi tiettyjen geenien säätely voisi auttaa virusta erilaisissa lisääntymiseen liittyvissä elinkierron vaiheissa. Tämän tutkimuksen tavoitteena oli selvittää, eroavatko HI-viruksen integraatiopaikat integraasin sitoutumispaikoista ihmisen genomissa. Eroavaisuudet voisivat viitata siihen, että integraasilla on muitakin tehtäviä, kuin viruksen DNA-molekyylin liittäminen isäntäsolun genomiin. Tutkimus aloitettiin menetelmien optimoinnilla. Päämenetelmänä käytettiin ChIP-sekvensointia, jota varten kahta erilaista menetelmää testattiin kromatiinin pilkkomiseksi: sonikointia sekä endo-eksonukleaasikäsittelyä. Näiden menetelmien optimoinnin jälkeen kaksi eri solulinjaa infektoitiin HI-viruksella. Solujen genominen DNA kerättiin integraatiopaikkojen selvittämistä varten. Integraasin sitoutumispaikat selvitettiin ChIP-sekvensoinnilla. Uuden sukupolven sekvensointi ulkoistettiin bioteknologiayritykselle. Tuloksena saadut sekvenssit käsiteltiin bioinformatiikkatyökalujen, kuten Galaxyn ja Homerin, avulla. Lisäksi tutkimuksessa optimoitiin menetelmää, jolla integraasiproteiini voidaan transfektoida solun sisälle. Kromatiinin pilkkominen endo-eksonukleaasilla onnistui menestyksekkäästi, kun DNA oli ensin puhdistettu. Sitä vastoin solulysaatissa sopivan MNaasi-konsentraation etsiminen oli haastavaa, vaikka optimoinnissa käytettiin useita solunhajotusmenetelmiä sekä lyysipuskureita. Tästä syystä integraasin sitoutumispaikat käsiteltiin sonikaattorilla, jotta DNA-fragmentit saatiin sopivan pituisiksi sekvensointia varten. MRC-5-solunäytteestä sekvensoitiin yli kaksi miljoonaa sekvenssifragmenttia, joista löytyi 289 linjattua, yksilöllistä integraatiopaikkaa. Samasta solulinjasta löytyi hieman alle kaksi miljoonaa referenssigenomiin rinnastettua integraasin sitoutumispaikkaa. Tutkimuksen pääpaino oli biokemiallisissa menetelmissä ja niiden optimoinnissa, joten sekvensointituloksia analysoitiin kevyesti. Esimerkiksi sekvenssien sijoittuminen kromosomien sisällä sekä geeniontologiatermit paljastivat, että integraasin sitoutumispaikat genomissa eroavat integraatiopaikoista. Sitoutumispaikat erosivat tilastollisesti merkittävästi myös satunnaisesta aineistosta. Nämä tulokset osoittivat ennen kaikkea sen, että tutkimusmenetelmä on toistettavissa, sillä tulokset olivat yhteneviä aiemmin toteutetun samansuuntaisen tutkimuksen kanssa. Lisäksi tulokset vahvistivat menetelmien optimoinnin onnistuneen odotetusti, sekä tukivat aiemman tutkimuksen perusteella muodostettua hypoteesia. Koska bioinformatiikan menetelmiä ei optimoitu, tarjoaa tutkimus aineistoa aiheen syvempää tutkimusta varten. Lisätutkimukset voivat puolestaan paljastaa lisää yksityiskohtia integraasin sitoutumisesta ja sitoutumisen mahdollisista funktioista.
HIV-1 is a lentivirus causing a serious immunodeficiency disease called AIDS to almost 38 million people in the world. Like all retroviruses, HIV has an ability to insert a copy of its genome into the host cell DNA thus having a lifelong effect on the host cell. Two identical copies of single-stranded RNA are first reverse transcribed, and then a protein called integrase inserts the DNA into the genome of T-cells of the human immune system. Studies have shown that in some retroviruses the integrase protein has a unique integration pattern favoring certain areas of the host cell genome. For example, active transcription units or promoter units are found to attract integration activity. On the other hand, with nuclear localization signals in its structure and an ability to attach to the human genome, it raises a question if the integrase could have additional functions. Regulating certain gene expression levels could support viral replication and the survival of the virus. The aim of the study was to determine whether integration sites differ from integrase genomic contact sites, which could be an indication of integrase’s additional role. Study was started by method optimization. Two chromatin fragmentation methods, sonication and endo-exonuclease treatment, were tested in order to achieve optimal sized DNA fragments for ChIP-sequencing. Two cell lines were infected with HIV-1. Genomic DNA was collected for integration site sequencing. Integrase genomic contact sites were studied with ChIP-sequencing. Next generation sequencing for both, integration sites and integrase genomic contact sites, was carried out by an outsource biotechnology company. Sequences were processed with bioinformatics platforms, such as Galaxy and Homer. Study of the effects of transfected integrase was also initiated by transfection method optimization. Treatment with endo-exonuclease resulted in correctly sized DNA fragments when DNA was first purified. In a cell lysate, a correct ratio of MNase and cells was not found, although several cell lysis methods and buffers were tried. This is why actual integrase genomic contact site samples were fragmented by sonication. In MRC-5 cell line, integration site sequencing resulted in over 2 M reads with 289 aligned, unique integration sites. Integrase genomic contact site sequencing resulted in 1.8E+6 Bowtie mapped reads. A brief analysis of the sequences including sequence visualization, comparison of localization in the genome and GO terms, showed that integrase genomic contact sites have certain patterns that differ from integration sites. Therefore, it was confirmed that the study is repeatable, as the results were in line with the study conducted several years earlier. These results also suggest that method optimization had been successful. As bioinformatics methods were used with default parameters only, more attention should be payed when sequences are analyzed more deeply. This will offer a more thorough understanding of the functions of integrase.
Keyword(s): HIV integrase ChIP-sequencing


Files in this item

Files Size Format View
Rossi_Katriina_pro_gradu_2020.pdf 1.725Mb PDF

This item appears in the following Collection(s)

Show full item record