Ontwikkeling van Illumina data analyse pipeline voor resequencing

Svenn
D'Hert

 

Analyse helpt recyclage bacteriën beter te werken in de ruimte

Bij SCK-CEN (studiecentrum voor kernenergie, Mol) is een nieuwe analyse gebouwd om sneller de resultaten van DNA onderzoek te vergelijken met reeds gekende DNA sequenties. Met behulp van deze nieuwe methode kan het onderzoek nu sneller bepalen of de bacterie Rhodospirillum rubrum geschikt is voor lange bemande ruimtereizen, als deel van het recyclage systeem (MELliSA).

De nieuwe analyse is ontwikkeld met het oog op de nieuwe DNA sequencing technologie, de zogenaamde next-generation sequencing technologie. Deze nieuwe technologie heeft een ware revolutie veroorzaakt in de moleculaire biologie. Het bepalen van een volledig genoom van een organisme of individu kan nu in een aantal uren, in tegenstelling tot oudere technologieën zoals Sanger sequencing waarvoor meerdere jaren nodig zijn om te achterhalen hoe het organisme er genetisch uitziet. De bottleneck zit niet meer in het produceren van de sequentie, maar in de gigabytes aan data die deze technologieën produceren en de data te analyseren en in een nuttige vorm bij de onderzoeker brengen.

Bij de next-generation sequencing technologie wordt het genoom in korte fragmenten geknipt (reads) en vervolgens gesequeneerd. Elk fragment is een klein stukje van de puzzel die we het genoom noemen. Omdat het genoom uit amper vier verschillende basen bestaat (ATCG) is de kans groot dat er fragmenten meermaals voorkomen, hierdoor is het maken van de puzzel een computationeel zware taak. Voor nieuwe genomen is deze manier van werken niet ideaal. Om een accurate DNA sequentie te bekomen moet men meermaals sequeneren en zelfs dan nog, zijn fouten aanwezig. Voor veel onderzoeken is dit een langdurige en dure aangelegenheid, daarom zijn er al sinds de jaren ‘90 databanken opgezet van gesequeneerde organismen. Door gebruik te maken van deze bestaande kennis kan de analyse sneller informatie uit de databrei halen door gebruik te maken van nauw verwante organismen. Bij deze manier van werken spreekt men dan ook van re-sequencing of herseqeunering omdat reeds een ruwe schets van het onderzochte organisme bekend is. 

Resequencing

Zo zijn de mens en aap voor 95-99% genetisch aan elkaar verwant. Het is dus niet ondenkbaar dat onderzoekers hiervan gebruik proberen te maken. Met behulp van de in SCK-CEN ontwikkelde analyse kan dit nu volautomatisch gebeuren. Daarvoor maken de onderzoekers gebruik van de enkele eigenschappen van de next-gen technologie. Zo bestaan er  een techniek die paired-end reads produceerd, dit zijn reads, die een gekende afstand (insert size) hebben van elkaar in het genoom. Met behulp van een referentie sequentie -van een nauw verwant organisme- kan men deze eenvoudiger ‘puzzelen’. Wanneer de insert size evenwel niet voldoet aan de gekende lengte wijst dit op een variatie ten opzichte van de referentie en het zijn net deze variaties waar onderzoekers naar zijn geïnteresseerd. Dat kan namelijk wijzen op het al dan niet aanwezig of afwezig zijn van een gen. Op deze manier kunnen deleties (verdwenen stukken DNA) en inserties (nieuwe stukken DNA) worden gedetecteerd.

MELliSSA

De ontwikkeling van de pipeline kaderde in het onderzoek MELliSSA (Micro-Ecological Life Support Sytem Alternative) ,  een artificieel ecosysteem die bestaat uit bacteriën en hogere planten. Dit ecosysteem zal gebruikt worden in toekomstige langdurige ruimtereizen. Hierbij is de bacterie Rhodospirillum rubrum van belang bij de omzetting van koolstoffen in zuurstofloze (anaerobe) omstandigheden. Deze bacterie is gekozen omdat ze naast de omzetting ook als extra voedselbron kan worden gebruikt. Het is belangrijk de genetische code van deze bacterie te kennen. Gezien constante stralingsbombardementen in de ruimte eventueel genen zou kunnen “deactiveren” waardoor deze bacterie haar werk niet of minder kan uitvoeren en bijgevolg het leven in gevaar kan brengen van de crew.

Mars express

De sequentie van de bacterie is vergeleken met meerdere nauw verwante soorten. Hierdoor is de bacterie nu beter gekend en kan men de resultaten verder analyseren of deze al dan de astronauten in problemen kunnen brengen tijdens hun verblijf op de rode planeet.

Download scriptie (1.85 MB)
Universiteit of Hogeschool
Hogeschool West-Vlaanderen
Thesis jaar
2012
Promotor(en)
dhr. Raphael Kiekens
Thema('s)