Stel je voor dat je een kaart hebt van een stad, die niet alleen de straten toont, maar ook elke beweging van auto’s, bussen en voetgangers. Zo’n kaart helpt je begrijpen hoe de stad functioneert. Iets soortgelijks gebeurt ook in je cellen. RNA-moleculen zijn de "auto's" van je cel, met elk automerk en -model een ander gen, elk met hun eigen route en bestemming. RNA is veel meer dan alleen een boodschapper voor eiwitten – de plek waar het zich in de cel bevindt, bepaalt vaak wat het doet. Dankzij mijn master-scriptie, kunnen we nu grootschalig in kaart brengen waar RNA van verschillende genen zich bevindt en hoe veranderingen in die locatie het gedrag van onze cellen beïnvloeden.
RNA is vooral bekend als de boodschapper die de genetische code van het DNA naar de eiwitfabrieken van de cel brengt. Maar RNA doet meer dan alleen boodschappen afleveren. Het zoekt vaak specifieke plekken in de cel op, zoals een Ferrari die in een andere buurt zal parkeren dan een Fiat. Sommige RNA-moleculen gaan naar de rand van de cel, andere blijven dicht bij de kern. Dit noemen we "RNA-lokalisatie“.
Bij ziektes zoals kanker en Alzheimer komt RNA vaak op de verkeerde plek terecht, wat leidt tot problemen in de werking van de cel. De locatie van RNA in de cel kan ons dus veel vertellen over hoe cellen normaal functioneren, hoe ziektes ontstaan en mogelijk hoe we die kunnen behandelen.
Mijn onderzoeksgroep (onder leiding van Alejandro Sifrim) heeft een computermodel ontwikkeld dat de belangrijkste ruimtelijke info filtert uit een foto van RNA in een cel. Je zou denken dat het dan simpel is: we hebben microscopische technieken om binnenin cellen te kijken, maar het opsporen van RNA-locaties blijkt lastiger dan gedacht. Cellen zijn als drukke steden, vol met duizenden RNA-moleculen die constant bewegen. Het is alsof je probeert te zien of alle voetgangers met rode mutsen dezelfde winkels bezoeken, maar dan in drie dimensies en op microscopische schaal. Voor een paar genen in een beperkt aantal cellen lukt dat nog handmatig, maar voor grote aantallen cellen en genen is dit onmogelijk zonder technologische hulp.
In mijn thesis-onderzoek heb ik een methode ontwikkeld die het op grote schaal mogelijk maakt om de gefilterde ruimtelijke informatie te gebruiken om automatisch RNA-lokalisaties te detecteren. Ik heb hiervoor de statistiek ontwikkeld die werkt als een soort “RNA-detective”. Het kijkt voor elk gen naar een groot aantal cellen en detecteert patronen: waar het RNA naartoe gaat, en of dit patroon consistent is over duizenden cellen.
Als je RNA-lokalisaties in verschillende cellen bestudeert, wil je weten of wat je ziet toeval is of een patroon. Stel dat mensen met rode mutsen vaak naar dezelfde koffiewinkel gaan. Is dat een toevalstreffer, of vertelt het ons iets belangrijks? Door grootschalig te analyseren, kunnen we onderscheid maken tussen toevallige afwijkingen en relevante biologische patronen, bijvoorbeeld tussen gezonde cellen en kankercellen.
Ik heb twee verschillende manieren ontwikkeld om automatisch RNA-lokalisaties te detecteren: één gebaseerd op kunstmatige intelligentie (een techniek genaamd "Random Forests") en een andere op een complexe wiskundige methode die de afstanden tussen verschillende RNA-locaties meet. Beide methoden werkten verrassend goed en bevestigden elkaars uitkomst: we kunnen nu voorspellen of de RNA-lokalisatie een patroon of een toevalstreffer is. Sterker nog, we kunnen dit niet alleen succesvol voorspellen voor grote, opvallende RNA-patronen, maar ook voor hele subtiele patronen ontdekken die we met het blote oog niet konden zien. Deze kleine, bijna onzichtbare verplaatsingen zouden mogelijk nieuwe inzichten kunnen geven in hoe cellen werken.
Dit klinkt misschien als een technische prestatie (en dat is het ook!), maar de implicaties zijn enorm. Doordat tot nog toe al het onderzoek naar RNA-lokalisatie met handmatig werk gedaan werd, is RNA-lokalisatie nog maar voor een beperkt aantal genen onderzocht. Dit onderzoek opent de deur naar grootschalige analyse van RNA-lokalisatie, zonder dat het handmatig werk vereist.
Dit betekent dat onderzoekers uit allerlei verschillende velden dankzij mijn techniek nieuwe vragen kunnen stellen. Hoeveel genen hebben eigenlijk een specifieke RNA-lokalisatie? Wordt RNA-lokalisatie beïnvloed door onze biologische klok? Hoe zit het eigenlijk met ziektes? In kankercellen bevindt het RNA van sommige genen zich bijvoorbeeld op heel andere plekken dan in gezonde cellen. Dit inzicht kan ons helpen beter te begrijpen hoe ziektes zoals kanker ontstaan en hoe we ze kunnen behandelen.
Wat mij zo enorm enthousiast maakt is dat we pas aan het begin van een nieuw tijdperk staan in het onderzoek naar RNA-lokalisatie. Mijn techniek kan verder verfijnd worden en toegepast worden op allerlei verschillende celtypes en weefsels. Stel je voor dat we deze techniek gebruiken om RNA te bestuderen in kankercellen, levercellen of zelfs hersencellen – de mogelijkheden zijn eindeloos.
RNA veel meer is dan een simpele boodschapper. Het is een dynamische speler in de cel, die zijn eigen unieke route kiest en daarmee invloed heeft op hoe een cel werkt. Dankzij dit thesis-onderzoek kunnen we deze routes nu in kaart brengen en begrijpen. En wie weet, misschien ligt op een van die routes wel de sleutel tot het oplossen van ziektes waar we vandaag de dag nog geen antwoord op hebben.
1. Marx, V. Method of the Year: spatially resolved transcriptomics. Nat. Methods 18, 9–14 (2021).
2. Das, S., Vera, M., Gandin, V., Singer, R. H. & Tutucci, E. Intracellular mRNA transport and localized translation. Nat. Rev. Mol. Cell Biol. 22, 483–504 (2021).
3. Engel, K. L., Arora, A., Goering, R., Lo, H. G. & Taliaferro, J. M. Mechanisms and consequences of subcellular RNA localization across diverse cell types. Traffic 21, 404–418 (2020).
4. Jeffery, W. R., Tomlinson, C. R. & Brodeur, R. D. Localization of actin messenger RNA during early ascidian development. Dev. Biol. 99, 408–417 (1983).
5. Cabili, M. N. et al. Localization and abundance analysis of human lncRNAs at single-cell and single-molecule resolution. Genome Biol. 16, 20 (2015).
6. Clark, M. B. et al. Genome-wide analysis of long noncoding RNA stability. Genome Res. 22, 885–898 (2012).
7. Mili, S., Moissoglu, K. & Macara, I. G. Genome-wide screen reveals APC-associated RNAs enriched in cell protrusions. Nature 453, 115–119 (2008).
8. Buxbaum, A. R., Wu, B. & Singer, R. H. Single β-actin mRNA detection in neurons reveals a mechanism for regulating its translatability. Science 343, 419–422 (2014).
9. Cornelison, G. L., Levy, S. A., Jenson, T. & Frost, B. Tau-induced nuclear envelope invagination causes a toxic accumulation of mRNA in Drosophila. Aging Cell 18, e12847 (2019).
10. Fazal, F. M. et al. Atlas of Subcellular RNA Localization Revealed by APEX-Seq. Cell 178, 473-490.e26 (2019).
11. Ashley, J. et al. Retrovirus-like Gag Protein Arc1 Binds RNA and Traffics across Synaptic Boutons. Cell 172, 262-274.e11 (2018).
12. Alhowikan, A. M. Activity-Regulated Cytoskeleton-Associated Protein Dysfunction May Contribute to Memory Disorder and Earlier Detection of Autism Spectrum Disorders. Med. Princ. Pract. Int. J. Kuwait Univ. Health Sci. Cent. 25, 350–354 (2016).
13. Fromer, M. et al. De novo mutations in schizophrenia implicate synaptic networks. Nature 506, 179–184 (2014).
14. Wang, J., Horlacher, M., Cheng, L. & Winther, O. RNA trafficking and subcellular localization-a review of mechanisms, experimental and predictive methodologies. Brief. Bioinform.24, bbad249 (2023).
15. Ioannou, M. S. & McPherson, P. S. Regulation of Cancer Cell Behavior by the Small GTPase Rab13. J. Biol. Chem.291, 9929–9937 (2016).
16. Nousiainen, H. O. et al. Mutations in mRNA export mediator GLE1 result in a fetal motoneuron disease. Nat. Genet. 40, 155–157 (2008).
17. Lessel, D. et al. De Novo Missense Mutations in DHX30 Impair Global Translation and Cause a Neurodevelopmental Disorder. Am. J. Hum. Genet. 101, 716–724 (2017).
18. Patel, A. et al. A Liquid-to-Solid Phase Transition of the ALS Protein FUS Accelerated by Disease Mutation. Cell 162, 1066–1077 (2015).
19. Lester, E. et al. Tau aggregates are RNA-protein assemblies that mislocalize multiple nuclear speckle components. Neuron 109, 1675-1691.e9 (2021).
20. Johnstone, O. & Lasko, P. Translational regulation and RNA localization in Drosophila oocytes and embryos. Annu. Rev. Genet. 35, 365–406 (2001).
21. Wang, C., Han, B., Zhou, R. & Zhuang, X. Real-Time Imaging of Translation on Single mRNA Transcripts in Live Cells. Cell 165, 990–1001 (2016).
22. Batada, N. N., Shepp, L. A. & Siegmund, D. O. Stochastic model of protein–protein interaction: Why signaling proteins need to be colocalized. Proc. Natl. Acad. Sci. 101, 6445–6449 (2004).
23. Fernandopulle, M. S., Lippincott-Schwartz, J. & Ward, M. E. RNA transport and local translation in neurodevelopmental and neurodegenerative disease. Nat. Neurosci. 24, 622–632 (2021).
24. Formicola, N., Vijayakumar, J. & Besse, F. Neuronal ribonucleoprotein granules: Dynamic sensors of localized signals. Traffic Cph. Den. 20, 639–649 (2019).
25. Gasset-Rosa, F. et al. Cytoplasmic TDP-43 De-mixing Independent of Stress Granules Drives Inhibition of Nuclear Import, Loss of Nuclear TDP-43, and Cell Death. Neuron 102, 339-357.e7 (2019).
26. Yasuda, K., Clatterbuck-Soper, S. F., Jackrel, M. E., Shorter, J. & Mili, S. FUS inclusions disrupt RNA localization by sequestering kinesin-1 and inhibiting microtubule detyrosination. J. Cell Biol. 216, 1015–1034 (2017).
27. Jenny, A. et al. A translation-independent role of oskar RNA in early Drosophila oogenesis. Development 133, 2827–2833 (2006).
28. Crerar, H. et al. Regulation of NGF Signaling by an Axonal Untranslated mRNA. Neuron 102, 553-563.e8 (2019).
29. Moissoglu, K. et al. RNA localization and co-translational interactions control RAB13 GTPase function and cell migration. EMBO J. 39, e104958 (2020).
30. Ioannou, M. S. et al. DENND2B activates Rab13 at the leading edge of migrating cells and promotes metastatic behavior. J. Cell Biol. 208, 629–648 (2015).
31. Buxbaum, A. R., Haimovich, G. & Singer, R. H. In the right place at the right time: visualizing and understanding mRNA localization. Nat. Rev. Mol. Cell Biol. 16, 95–109 (2015).
32. Gao, Y., Tatavarty, V., Korza, G., Levin, M. K. & Carson, J. H. Multiplexed Dendritic Targeting of α Calcium Calmodulin-dependent Protein Kinase II, Neurogranin, and Activity-regulated Cytoskeleton-associated Protein RNAs by the A2 Pathway. Mol. Biol. Cell 19, 2311–2327 (2008).
33. Liao, Y.-C. et al. RNA Granules Hitchhike on Lysosomes for Long-Distance Transport, Using Annexin A11 as a Molecular Tether. Cell 179, 147-164.e20 (2019).
34. Baumann, S., König, J., Koepke, J. & Feldbrügge, M. Endosomal transport of septin mRNA and protein indicates local translation on endosomes and is required for correct septin filamentation. EMBO Rep. 15, 94–102 (2014).
35. Cohen, B. et al. Co-transport of the nuclear-encoded Cox7c mRNA with mitochondria along axons occurs through a coding-region-dependent mechanism. J. Cell Sci. 135, jcs259436 (2022).
36. Krichevsky, A. M. & Kosik, K. S. Neuronal RNA granules: a link between RNA localization and stimulation-dependent translation. Neuron 32, 683–696 (2001).
37. Adivarahan, S. et al. Spatial Organization of Single mRNPs at Different Stages of the Gene Expression Pathway. Mol. Cell 72, 727-738.e5 (2018).
38. Liu, B. & Qian, S.-B. Translational reprogramming in cellular stress response. Wiley Interdiscip. Rev. RNA 5, 301–315 (2014).
39. Tauber, D., Tauber, G. & Parker, R. Mechanisms and Regulation of RNA Condensation in RNP Granule Formation. Trends Biochem. Sci. 45, 764–778 (2020).
40. Roden, C. & Gladfelter, A. S. RNA contributions to the form and function of biomolecular condensates. Nat. Rev. Mol. Cell Biol. 22, 183–195 (2021).
41. Wilbertz, J. H. et al. Single-Molecule Imaging of mRNA Localization and Regulation during the Integrated Stress Response. Mol. Cell 73, 946-958.e7 (2019).
42. Bashirullah, A. et al. Joint action of two RNA degradation pathways controls the timing of maternal transcript elimination at the midblastula transition in Drosophila melanogaster. EMBO J. 18, 2610–2620 (1999).
43. Semotok, J. L. et al. Drosophila maternal Hsp83 mRNA destabilization is directed by multiple SMAUG recognition elements in the open reading frame. Mol. Cell. Biol. 28, 6757–6772 (2008).
44. Semotok, J. L. et al. Smaug recruits the CCR4/POP2/NOT deadenylase complex to trigger maternal transcript localization in the early Drosophila embryo. Curr. Biol. CB 15, 284–294 (2005).
45. Zaessinger, S., Busseau, I. & Simonelig, M. Oskar allows nanos mRNA translation in Drosophila embryos by preventing its deadenylation by Smaug/CCR4. Dev. Camb. Engl. 133, 4573–4583 (2006).
46. Long, R. M. et al. Mating Type Switching in Yeast Controlled by Asymmetric Localization of ASH1 mRNA. Science277, 383–387 (1997).
47. Gu, W., Deng, Y., Zenklusen, D. & Singer, R. H. A new yeast PUF family protein, Puf6p, represses ASH1 mRNA translation and is required for its localization. Genes Dev. 18, 1452–1465 (2004).
48. Irie, K. The Khd1 protein, which has three KH RNA-binding motifs, is required for proper localization of ASH1 mRNA in yeast. EMBO J. 21, 1158–1167 (2002).
49. Femino, A. M., Fay, F. S., Fogarty, K. & Singer, R. H. Visualization of single RNA transcripts in situ. Science280, 585–590 (1998).
50. Xia, C., Fan, J., Emanuel, G., Hao, J. & Zhuang, X. Spatial transcriptome profiling by MERFISH reveals subcellular RNA compartmentalization and cell cycle-dependent gene expression. Proc. Natl. Acad. Sci. U. S. A. 116, 19490–19499 (2019).
51. Chen, K. H., Boettiger, A. N., Moffitt, J. R., Wang, S. & Zhuang, X. RNA imaging. Spatially resolved, highly multiplexed RNA profiling in single cells. Science 348, aaa6090 (2015).
52. Piovesan, A. et al. Human protein-coding genes and gene feature statistics in 2019. BMC Res. Notes12, 315 (2019).
53. Wang, J., Horlacher, M., Cheng, L. & Winther, O. DeepLocRNA: an interpretable deep learning model for predicting RNA subcellular localization with domain-specific transfer-learning. Bioinformatics 40, btae065 (2024).
54. Yan, Z., Lécuyer, E. & Blanchette, M. Prediction of mRNA subcellular localization using deep recurrent neural networks. Bioinforma. Oxf. Engl. 35, i333–i342 (2019).
55. Zhang, Z.-Y. et al. Design powerful predictor for mRNA subcellular location prediction in Homo sapiens. Brief. Bioinform. 22, 526–535 (2021).
56. Garg, A., Singhal, N., Kumar, R. & Kumar, M. mRNALoc: a novel machine-learning based in-silico tool to predict mRNA subcellular localization. Nucleic Acids Res. 48, W239–W243 (2020).
57. Li, J., Zhang, L., He, S., Guo, F. & Zou, Q. SubLocEP: a novel ensemble predictor of subcellular localization of eukaryotic mRNA based on machine learning. Brief. Bioinform. 22, bbaa401 (2021).
58. Wang, D. et al. DM3Loc: multi-label mRNA subcellular localization prediction and analysis based on multi-head self-attention mechanism. Nucleic Acids Res. 49, e46 (2021).
59. Bi, Y. et al. Clarion is a multi-label problem transformation method for identifying mRNA subcellular localizations. Brief. Bioinform. 23, bbac467 (2022).
60. Chen, Y. et al. mRNA-CLA: An interpretable deep learning approach for predicting mRNA subcellular localization. Methods 227, 17–26 (2024).
61. Li, F. et al. Advancing mRNA subcellular localization prediction with graph neural network and RNA structure. Preprint at https://doi.org/10.1101/2023.12.14.571762 (2023).
62. Imbert, A. et al. FISH-quant v2: a scalable and modular tool for smFISH image analysis. RNA N. Y. N 28, 786–795 (2022).
63. Mah, C. K. et al. Bento: a toolkit for subcellular analysis of spatial transcriptomics data. Genome Biol. 25, 82 (2024).
64. Samacoits, A. et al. A computational framework to study sub-cellular RNA localization. Nat. Commun.9, 4584 (2018).
65. Chouaib, R. et al. A Dual Protein-mRNA Localization Screen Reveals Compartmentalized Translation and Widespread Co-translational RNA Targeting. Dev. Cell 54, 773-791.e5 (2020).
66. Imbert, A., Mueller, F. & Walter, T. PointFISH -- learning point cloud representations for RNA localization patterns. Preprint at https://doi.org/10.48550/ARXIV.2302.10923 (2023).
67. Savulescu, A. F. et al. Interrogating RNA and protein spatial subcellular distribution in smFISH data with DypFISH. Cell Rep. Methods 1, 100068 (2021).
68. Dubois, R. et al. A Deep Learning Approach To Identify MRNA Localization Patterns. in 2019 IEEE 16th International Symposium on Biomedical Imaging (ISBI 2019) 1386–1390 (IEEE, Venice, Italy, 2019). doi:10.1109/ISBI.2019.8759235.
69. Iandola, F. N. et al. SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size. Preprint at https://doi.org/10.48550/ARXIV.1602.07360 (2016).
70. Walter, F. C., Stegle, O. & Velten, B. FISHFactor: a probabilistic factor model for spatial transcriptomics data with subcellular resolution. Bioinforma. Oxf. Engl. 39, btad183 (2023).
71. Stoyan, D., Chiu, S. N., Kendall, W. S. & Mecke, J. Stochastic Geometry and Its Applications. (John Wiley & Sons Inc, Chichester, West Sussex, United Kingdom, 2013).
72. Illian, J., Penttinen, A., Stoyan, H. & Stoyan, D. Statistical Analysis and Modelling of Spatial Point Patterns. (Wiley, 2007). doi:10.1002/9780470725160.
73. Laboratory for Systems Physiology | ETH Zurich. https://bsse.ethz.ch/lsp (2024).
74. Kingma, D. P. & Ba, J. Adam: A Method for Stochastic Optimization. Preprint at https://doi.org/10.48550/ARXIV.1412.6980 (2014).
75. Pedregosa, F. et al. Scikit-learn: Machine Learning in Python. (2012) doi:10.48550/ARXIV.1201.0490.
76. Christensen, W. F. & Zabriskie, B. N. When Your Permutation Test is Doomed to Fail. Am. Stat. 76, 53–63 (2022).
77. Virtanen, P. et al. SciPy 1.0: fundamental algorithms for scientific computing in Python. Nat. Methods 17, 261–272 (2020).
78. Phipson, B. & Smyth, G. K. Permutation P-values should never be zero: calculating exact P-values when permutations are randomly drawn. Stat. Appl. Genet. Mol. Biol. 9, Article39 (2010).
79. Ernst, M. D. Permutation Methods: A Basis for Exact Inference. Stat. Sci. 19, (2004).
80. Wu, T. et al. Density-aware Chamfer Distance as a Comprehensive Metric for Point Cloud Completion. Preprint at https://doi.org/10.48550/ARXIV.2111.12702 (2021).
81. Liu, M., Sheng, L., Yang, S., Shao, J. & Hu, S.-M. Morphing and Sampling Network for Dense Point Cloud Completion. Proc. AAAI Conf. Artif. Intell. 34, 11596–11603 (2020).
82. Baumgartner, D. & Kolassa, J. Power considerations for Kolmogorov–Smirnov and Anderson–Darling two-sample tests. Commun. Stat. - Simul. Comput. 52, 3137–3145 (2023).
83. McInnes, L., Healy, J. & Melville, J. UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction. Preprint at https://doi.org/10.48550/ARXIV.1802.03426 (2018).
84. Statistical Power Analysis for the Behavioral Sciences. (L. Erlbaum Associates, Hillsdale, N.J, 1988).
85. Sander, J., Ester, M., Kriegel, H.-P. & Xu, X. Density-Based Clustering in Spatial Databases: The Algorithm GDBSCAN and Its Applications. Data Min. Knowl. Discov. 2, 169–194 (1998).