In december 2018 zijn er zeven artikelen ‘back-to-back’ gepubliceerd in het wetenschappelijk tijdschrift Science over de pathogenese van psychiatrische stoornissen. Eén artikel in Science is natuurlijk al prachtig. Een droom voor elke onderzoeker. Maar zeven artikelen die allemaal op elkaar aansluiten in één keer publiceren? Dat is ongekend. Wat staat er dan in dat het zo bijzonder maakt?
Vandaag het zesde artikel: Comprehensive functional genomic resource and integrative model for the human brain
Achtergrond: Op zoek naar de stand van zaken als het gaat om complexe genetica in psychiatrie, focust dit laatste artikel op de integratie van de verschillende (gekende) lagen genetische informatie die in een cel vervat kunnen zitten. In dit laatste artikel worden de limieten opgezocht, wordt alle informatie die tot nu toe reeds verzameld werd, geïntegreerd en verbouwd tot een zo volledig mogelijk model. De lezer en wetenschap worden meegenomen naar een ongekende diepgang en het domein van functionele genomica in het menselijke brein. We kijken naar een dataset waarmee, vanuit een integratief netwerk, verbanden kunnen worden onderzocht die onbereikbaar zijn wanneer enkel genetische subdomeinen in acht worden genomen. De verzameling van regulerende genetische informatie, laat toe zicht te krijgen op de ‘knoppen’ die op een andere plaats in het DNA de machinerie aan het werk zetten. Het doel is onderliggende moleculaire mechanismen, in hun complexiteit en ondanks hun complexiteit, te proberen begrijpen: hoe kan het dat variant A, typisch niet in de buurt van een gen, een ‘non-coding’ variant, een rol speelt in de expressie van gen B, hoewel er op het eerste zicht geen verband lijkt te bestaan? Het antwoord wordt gezocht in een dataset die alle gekende informatie verzamelt, gaande van de harde code, het A-C-G-T-DNA, over alle tussenliggende niveaus, tot en met de impact van de 3D kronkels van het DNA op genexpressie, en het eventuele verband van deze informatiekluwens met psychiatrische aandoeningen wil onderzoeken.
Methode: Informatie vanuit bestaande databanken, zoals ‘epigenetic roadmap’, ‘GTEx’, ENCODE en PsychENCODE, maar ook single-cell informatie, wordt geïntegreerd op het niveau van ruwe data. Het betreft onder andere informatie de prefrontale cortex van 1866 individuen, maar evengoed 3810 datasets met informatie over genotype, transcriptoom, chromatine en Hi-C. Verder wordt nog RNA-seq van zo’n 30 000 single cells mee in rekening genomen. Aan psychiatrische beelde zijn schizofrenie (SCZ), bipolaire stoornis (BPD) en autismespectrumstoornis (ASD) vertegenwoordigd. Vervolgens worden analyses toegepast op de verschillende lagen van informatie en wordt toegewerkt naar een grote netwerkanalyse. Hierbij worden onder andere machine learning technieken toegepast, waarbij op zoek gegaan wordt naar genetische parameters die bepaalde kenmerken bepalen die een rol zouden kunnen spelen bij de ontwikkeling van psychiatrische ziekten.
Uitkomst: Als gevolg van de vele verschillende analyses, worden ook verschillende resultaten beschreven:
- De analyse van het transcriptoom(genexpressie-data, inclusief eQTLs en single-cell informatie) bracht nieuwe non-coding transciptieregio’s aan het licht, net als nieuwe sets van genen die al dan niet samen tot expressie komen. Niet onbelangrijk voor de verdere interpretatie van resultaten, valt op dat de variatie tussen (hersen)celtypes groter is dan de variatie tussen individuen. Deze redenering kon ook worden omgedraaid: op basis van expressie-profielen kan geschat worden om welke celtypes het gaat. Er wordt geschat dat de variatie in celtypes 88% van de variatie tussen gen-expressiestalen kan verklaren. In een volgende stap konden ook, op basis van deze informatie, bij de verschillende ziektebeelden (SCZ, BPD, ASD) en tussen mannen en vrouwen, maar ook in functie van leeftijd, verschillende celsamenstellingen achterhaald worden.
- De analyse van enhancers, stukjes DNA die transcriptie verderop doen toenemen, wordt onderzocht door de ‘openheid’ van het DNA na te gaan (via H3K27ac). Op deze manier werden voor 50 individuen de prefrontale cortex, de temporale cortex en het cerebellum vergeleken. De activiteit tussen prefrontale en temporale cortex was meer vergelijkbaar dan het cerebellum. Deze bevinding is consistent met voorgaand onderzoek en het vermoeden dat zich in het cerebellum meer andere celltypes bevinden. Gemiddeld waren bovendien slechts 70% van deze enhancersactief.
- De gecombineerde componentenanalyse van het transcriptoom en het epigenoom toonde, niet onverwacht, dat de weefselspecifieke handtekening van hersenregio’s behoorlijk verschillend is van andere weefsels.
- Voor de analyse van QTLs, quantitative trait loci, varianten in het DNA die expressie op een andere plaats in het genoom kunnen beïnvloeden, werden meerdere soorten QTLs geïdentificeerd: eQTLs (expressie), cQTLs (chromatine), fQTLs (cell-fracties) en isoQTLs (splicing-isovormen). Deze analyses laten toe een schatting te maken van het belang van non-coding varianten. Varianten in het DNA die voorheen als ‘bulk’ werden omschreven, maar waarvan hoe langer hoe meer duidelijk wordt dat ze wel degelijk een (belangrijke) functie hebben.
- De integratie van het geheel is de netwerk-analyse die op zoek gaat naar regulerende netwerken. Hierbij worden ookHi-Cen TADs(topologically associating domains) in rekening gebracht: de 3D kronkels waarin het DNA zich beweegt opdat regio’s die op de streng ver van elkaar liggen, toch dicht bij elkaar kunnen komen om te interageren. Zo ontstaat weer een nieuw niveau van controle op gen-expressie. In lijn met de verwachtingen vonden 75% van de enhancer-promotor interacties plaats binnen 1 TAD. Verder blijft de chromatinestructuur verschillend tussen de weefsels en wordt ook een groot verschil gezien tussen foetaal en volwassen hersenweefsel. Bovendien schijnen slechts 30% van deze 3D-interacties ook aanwezig in de foetale dataset. Het lijkt dat het verschil tussen adult en foetaal brein groter is dan het verschil tussen verschillende weefsels bij een volwassene. In een volgende stap blijkt dat deze netwerkanalyse met regulerende elementen ook toelaat de expressie van de uiteindelijke genen te voorspellen.
- De apotheose, het uiteindelijke verband met de psychiatrische ziektebeelden, de proef op de som… wanneer de 142 geïdentificeerde schizofrenie-loci bekeken worden in het licht van deze netwerkanalyse, kunnen 1111 schizofrenie-geassocieerde genen geïdentificeerd worden. 321 van deze genen worden door meer dan een parameter (uit de netwerkanalyse) ondersteund, vb. zowel door QTLs als door Hi-C. Verder wordt nog maar eens aangetoond dat SNPs, DNA-strengs-gewijs, niet in de buurt moeten liggen van genen waarop ze invloed hebben om op deze genen een effect te hebben. En dat deze regulerende verbanden moeilijk af te leiden zijn van de organisatie van het DNA op eerste zicht: hiervoor zijn integrerende en complexe modellen nodig. De genen die geïdentificeerd werden, spelen een rol in de verwachte pathways, zoals calciumkanalen, cholinerge receptors, synapsvorming etc., wat ook inhoudelijk het verhaal ondersteunt.
- Tot slot onderlijnt het machine-learning model (‘deep-structured phenotype network’; DSPN) nogmaals de meerwaarde om deze vele lagen genomische informatie te combineren om het verband tussen genen en ziekten beter te begrijpen. Waar geschat wordt dat op basis van SNPs zo’n 20-25% van de genetische variantie voor schizofrenie, bipolaire stoornis en autismespectrumstoornissen verklaard wordt, verklaart deze gecombineerde dataset ongeveer 30-35% van de genetische variantie voor schizofrenie en bipolaire stoornis; wonderwel slechts 10% voor autismespectrumstoornissen.
Wat betekent dit:
Dit veelgelaagde model laat toe uit te zoomen van de gebruikelijke A-C-G-T-code en toont het potentieel van genomische interacties aan. Dit gaat zowel over de inzichten die volgen uit de integratie van de informatie, maar ook over het begrijpen van de onderliggende moleculaire interacties. Dit model laat enerzijds toe celfracties te voorspellen op basis van expressie-informatie, anderzijds brengt het diepgang in de reeds geïdentificeerde SNPs die een rol zouden kunnen spelen bij schizofrenie en brengt deze ‘functionele genomica’ een veel uitgebreider netwerk van interagerende genen aan het licht.
Waar DNA enkele jaren geleden beperkt bleef tot de dubbele helix, krijgen we nu meer en meer zicht op de complexitet rond deze helix. Allicht kennen we nog maar een fractie van wat er te kennen valt. Studies als deze tonen deze gelaagdheid overtuigend aan en laten toe beetje bij beetje het kluwen te ontwarren…
De zeven artikelen in Science (zie referenties onderaan) beschrijven onderzoek van het PsychEncode consortium. Dit consortium heeft zich als doel gesteld om te begrijpen hoe de geïdentificeerde genetische risicofactoren voor psychiatrische ziekten hersenontwikkeling en hersenfunctie beïnvloeden. Voor dit onderzoek werd hersenmateriaal van 2000 individuen op verschillende manieren onderzocht en dit werd weer gekoppeld aan de genetische risicofactoren.
De inhoud van deze artikelen is, net als de materie waarover ze gaan, uiterst complex. Begrippen als noncoding RNA, eQTL, chromosomal connectomes, epigenome landscapes, differential splicing, vliegen de lezer om de oren. Voor wie het wat te ver gaat om in deze donkere dagen met deze editie van Science lekker voor het haardvuur te kruipen, zullen we ze in de maand maart 2019 één voor één samenvatten. We zullen hierbij proberen om de hoofdboodschap simpel uit te leggen zodat elke psychiater, jong dan wel oud, kan meegenieten.
Referenties (met link origineel artikel en DJP bespreking)
- An, J.-Y. et al. Genome-wide de novo risk score implicates promoter variation in autism spectrum disorder. (Origineel ; DJP)
- Rajarajan, P. et al. Neuron-specific signatures in the chromosomal connectome associated with schizophrenia risk. (Origineel ; DJP)
- Amiri, A. et al. Transcriptome and epigenome landscape of human cortical development modeled in organoids. (Origineel ; DJP)
- Gandal, M. J. et al. Transcriptome-wide isoform-level dysregulation in ASD, schizophrenia, and bipolar disorder. (Origineel ; DJP)
- Zhu, Y. et al. Spatiotemporal transcriptomic divergence across human and macaque brain development. (Origineel ; DJP)
- Wang, D. et al. Comprehensive functional genomic resource and integrative model for the human brain. (Origineel ; DJP)
- Li, M. et al. Integrative functional genomic analysis of human brain development and neuropsychiatric risks. (Origineel ; DJP)