Plasma-instabiliteiten in nucleaire fusie detecteren met behulp van AI

Casper
Haems
  • Mateo
    Van Damme

Inleiding

Nucleaire fusie is een alternatief voor nucleaire splitsing om grote hoeveelheden energie te genereren voor onze samenleving. In tegenstelling tot splijting produceert fusie weinig gevaarlijke afvalproducten. Bovendien is er geen mogelijkheid voor een onbeheersbare reactor meltdown, aangezien het fusieproces vanzelf uitdooft wanneer het niet actief in stand wordt gehouden.

Een tokamak is een donutvormig apparaat waar plasma wordt verhit en beheerst. Deze wordt bediend in een operationele modus genaamd H-mode. Deze modus gaat gepaard met het optreden van Edge-Localized Modes (ELMs), plotselinge uitbarstingen van energie die de reactorwand kunnen beschadigen, vergelijkbaar met stoom die vrijkomt uit een snelkookpan.

Veel onderzoek is gewijd aan de studie van ELMs, waarvoor de ELMS eerst moeten worden aangeduid. Dit is een tijdrovend en moeilijk proces. Bestaande automatische methoden blijken onvoldoende effectief voor de detectie van kleine en onregelmatige ELMs. Deze scriptie heeft als hoofddoel de ontwikkeling van algoritmen die in staat zijn om diverse ELM-types, inclusief de uitdagende varianten, te detecteren."

ELMs zijn moeilijk te modelleren op basis van fundamentele natuurkundige principes. Daarom vertrouwen studies ook op empirische gegevens uit grootschalige internationale experimenten, zoals JET (Joint European Torus), ASDEX-Upgrade en DIII-D.

De binnenkant van de JET tokamak reactor. De buitenwand die beschadigd wordt door ELMs is zichtbaar.

Bovenstaande foto toont de binnenkant van de JET tokamak reactor. De buitenwand die beschadigd wordt door ELMs is zichtbaar. Bron: EUROfusion/CC BY 4.0, https://www.euro-fusion.org/media-library/fusion-experiments/


Gedetailleerde beschrijving van de gegevens

Definiëren van shots

Tokamaks werken niet continu, maar in meerdere pulsen, die shots worden genoemd. De gegevens die in deze masterproef worden gebruikt, zijn verzameld vanuit JET. Voor elke shot wordt een verzameling signalen vastgelegd, waarvan er twee in deze masterproef worden gebruikt om ELMs te detecteren. Het eerste signaal meet de lichtemissiviteit van het plasma, dit is handig want een ELM gaat altijd samen met een piek in dit signaal. Het tweede signaal meet hoeveel energie er in het plasma zit. Bij een ELM verliest het plasma energie, en het is juist deze energie die de reactorwand beschadigt. Hoewel het plasma-energiesignaal waardevolle informatie bevat, is het niet altijd beschikbaar, daarom is het belangrijk om ook ELM-detectiemethoden te ontwikkelen die zonder dit signaal kunnen functioneren.

Uitvoerformaat

Gedetecteerde ELMs in dit werk worden weergegeven met behulp van eenvoudige intervallen. Elk interval bestaat uit een begin- en eindtijd, waarbij effectief de tijdsduur van een ELM-evenement wordt vastgelegd.

Metrieken

Voor de training en evaluatie van de ELM-detectiemethoden zijn metrieken vereist. Het vinden van bestaande metrieken was uitdagend, omdat de meeste metrieken voor machine learning gericht zijn op classificatie en niet direct toepasbaar zijn op pieken gepresenteerd als intervallen. Daarom zijn specifieke metrieken ontwikkeld die afgestemd zijn op de datastructuur van dit werk, welke de gebruikelijke confusionmatrix toepast op intervallen.

Methoden

Hieronder volgt een overzicht van de methodes die we hebben ontworpen. 

Robust Optimal Threshold

De Robust Optimal Threshold (ROT) is een eenvoudige bestaande methode die gebruikt wordt als maatstaf voor de nieuwe methoden. 

MACD

De MACD-methode maakt gebruik van de moving average convergence/divergence (MACD) filter om een nieuw signaal te verkrijgen uit het emissiviteitssignaal met minder ruis en onderscheidende kenmerken. Dit signaal wordt vervolgens door een algoritme geleid om pieken/ELMs te verkrijgen.


Rolling Z-score

De Rolling Z-score-methode berekent de Z-score over een schuivend venster. Vervolgens wordt een algoritme gebruikt om pieken/ELMs te vinden in dit gefilterde emissiviteitssignaal.


LOG

De LoG-methode voor ELM-detectie houdt in dat het emissiviteitssignaal gefilterd wordt met behulp van een Laplacian of Gaussian-kernel. Pieken/ELMs worden verkregen door het gefilterde signaal te thresholden.


LoGDoG

LoGDoG bouwt voort op de LoG-methode. In deze methode wordt het emissiviteitssignaal afgezwakt op basis van de afgeleide van het plasma-energiesignaal. De afgeleide wordt verkregen door het plasma-energiesignaal te filteren met een afgeleide van Gaussische kernel. Hierdoor worden pieken alleen gedetecteerd wanneer er een daling in de plasma-energie optreedt.


CustomKernel

De CustomKernel-methode detecteert pieken door het signaal te filteren met een op maat gemaakte kernel. Deze kernel wordt automatisch bepaald door de methode te trainen op het invoersignaal.


RNN

De RNN-methode maakt gebruik van een combinatie van filters op het emissiviteitssignaal en het plasma-energiesignaal, maakt sequenties en leidt deze door een recurrent neuraal netwerk (RNN). De voorspellingen worden vervolgens gethreshold om de ELMs te verkrijgen.


CNN

De CNN werkt op dezelfde manier als de RNN-methode, maar maakt gebruik van een convolutioneel neuraal netwerk (CNN).


Deconvolution

De Deconvolution-methode is gebaseerd op een recent gepubliceerd artikel. Hierbij wordt een deconvolutieproces toegepast om het signaal te ontbinden in een superpositie van individuele pulsen.

Bespreking van de resultaten

Alle ontwikkelde methoden in deze masterproef presteren beter dan de bestaande ROT-methode. We hebben echter opgemerkt dat de deconvolutiemethode niet geschikt is voor de specifieke kenmerken van de ELMs die in dit onderzoek zijn aangetroffen. Elke methode heeft zijn eigen sterke en zwakke punten. De RNN- en CNN-modellen zijn bijvoorbeeld getraind met specifieke parameters die mogelijk moeten worden aangepast voor gebruik op andere datasets. Over het algemeen presteren de LoG, CustomKernel, CNN en RNN methoden het beste.

Conclusie

Deze masterproef heeft de uitdagingen in het detecteren van ELMs in tokamak-reactoren vereenvoudigd voor de onderzoekers van ELMs, door het ontwikkelen van robuuste methoden. Elke methode heeft zijn eigen sterktes en zwaktes. Deze bevindingen dragen bij aan efficiënter ELM-onderzoek en dragen bij aan het uiteindelijke doel van fusie-energie.

Bibliografie

[1] Sunflowers. Licensed under CC0 1.0 Universal (CC0 1.0). [Online]. Available: https://cleanpublicdomain.com/downloads/ sunflowers-2/

[2] H. Zohm, “Edge localized modes (elms),” Plasma Physics and Controlled Fusion, vol. 38, no. 2, p. 105, feb 1996. [Online]. Available: https://dx.doi.org/10.1088/0741-3335/38/2/001

[3] Verdoolaege, Geert and Frassinetti, L., “Statistical analysis of edge-localized mode timing in JET,” in Proceedings of the 45th EPS Conference on Plasma Physics. European Physical Society, 2018, p. 4. [Online]. Available: http: //ocs.ciemat.es/EPS2018ABS/pdf/P2.1078.pdf

[4] H. Guo, G. Matthews, I. Coffey, S. Erents, M. Groth, P. Harbour, M. Von Hellermann, D. Hillis, J. Hogan, L. Horton, L. Ingesson, K. Lawson, J. Lingertat, C. Maggi, G. McCracken, R. Monk, P. Morgan, M. Stamp, P. Stangeby, and G. Vlases, “Effects of divertor geometry and chemical sputtering on impurity behaviour and plasma performance in jet,” Nuclear Fusion, vol. 40, p. 379, 05 2002.

[5] L. Wang, G. Xu, H. Guo, H. Wang, S. Liu, K. Gan, X. Gong, Y. Liang, N. Yan, L. Chen, J. Liu, W. Zhang, R. Chen, L. Shao, H. Xiong, J. Qian, B. Shen, G. Liu, R. Ding, X. Zhang, C. Qin, S. Ding, L. Xiang, G. Hu, Z. Wu, G. Luo, J. Chen, L. Hu, X. Gao, B. Wan, J. Li, and the EAST Team, “Characterizations of power loads on divertor targets for type-i, compound and small elms in the east superconducting tokamak,” Nuclear Fusion, vol. 53, no. 7, p. 073028, jun 2013. [Online]. Available: https://dx.doi.org/10.1088/0029-5515/53/7/073028

[6] J. Sen, Ed., Machine Learning - Algorithms, Models and Applications. IntechOpen, dec 2021. [Online]. Available: https://doi.org/10.5772%2Fintechopen.94615

[7] L. Budach, M. Feuerpfeil, N. Ihde, A. Nathansen, N. Noack, H. Patzlaff, F. Naumann, and H. Harmouch, “The effects of data quality on machine learning performance,” 2022.

[8] D. G. Lowe, “Object recognition from local scale-invariant features,” in Proceedings of the seventh IEEE international conference on computer vision, vol. 2. Ieee, 1999, pp. 1150–1157.

[9] “scikit-image blob detection,” https://scikit-image.org/docs/0.21.x/auto_examples/features_detection/p…, scikit-image, accessed on 2023-06-05.

[10] M. Lind, “Deep dive into python mixins and multiple inheritance,” 2019, accessed: 2023-06-04. [Online]. Available: https://coderbook.com/@marcus/deep-dive-into-python-mixins-and-multiple…

[11] R. Hyndman, Moving Averages. Springer Berlin, Heidelberg, 01 2010, pp. 866–869.

[12] P. Virtanen, R. Gommers, T. E. Oliphant, M. Haberland, T. Reddy, D. Cournapeau, E. Burovski, P. Peterson, W. Weckesser, J. Bright, S. J. van der Walt, M. Brett, J. Wilson, K. J. Millman, N. Mayorov, A. R. J. Nelson, E. Jones, R. Kern, E. Larson, C. J. Carey, İ. Polat, Y. Feng, E. W. Moore, J. VanderPlas, D. Laxalde, J. Perktold, R. Cimrman, I. Henriksen, E. A. Quintero, C. R. Harris, A. M. Archibald, A. H. Ribeiro, F. Pedregosa, P. van Mulbregt, and SciPy 1.0 Contributors, “SciPy 1.0: Fundamental Algorithms for Scientific Computing in Python,” Nature Methods, vol. 17, pp. 261–272, 2020. 95 11 References

[13] C. R. Harris, K. J. Millman, S. J. van der Walt, R. Gommers, P. Virtanen, D. Cournapeau, E. Wieser, J. Taylor, S. Berg, N. J. Smith, R. Kern, M. Picus, S. Hoyer, M. H. van Kerkwijk, M. Brett, A. Haldane, J. F. del Río, M. Wiebe, P. Peterson, P. Gérard-Marchant, K. Sheppard, T. Reddy, W. Weckesser, H. Abbasi, C. Gohlke, and T. E. Oliphant, “Array programming with NumPy,” Nature, vol. 585, no. 7825, pp. 357–362, Sep. 2020. [Online]. Available: https://doi.org/10.1038/s41586-020-2649-2

[14] F. Klinker, “Exponential moving average versus moving exponential average,” Mathematische Semesterberichte, vol. 58, no. 1, pp. 97–107, dec 2010. [Online]. Available: https://doi.org/10.1007/s00591-010-0080-8

[15] S. A. Kassam and T. L. Lim, “Robust wiener filters,” Journal of the Franklin Institute, vol. 304, no. 4, pp. 171–185, 1977. [Online]. Available: https://www.sciencedirect.com/science/article/pii/0016003277900114

[16] A. M. Kabe and B. H. Sako, “Chapter 5 - analysis of continuous and discrete time signals,” in Structural Dynamics Fundamentals and Advanced Applications, A. M. Kabe and B. H. Sako, Eds. Academic Press, 2020, pp. 271–427. [Online]. Available: https://www.sciencedirect.com/science/article/pii/B9780128216156000058

[17] H. Hsu, Schaum’s Outline of Signals and Systems, Fourth Edition. McGraw Hill LLC, 2019. [Online]. Available: https://books.google.be/books?id=8wWSDwAAQBAJ

[18] E. W. Weisstein, “Gradient,” https://mathworld.wolfram.com/Gradient.html, accessed on 2023-06-01.

[19] A. Savitzky and M. J. E. Golay, “Smoothing and differentiation of data by simplified least squares procedures.” Analytical Chemistry, vol. 36, no. 8, pp. 1627–1639, 1964. [Online]. Available: https://doi.org/10.1021/ac60214a047

[20] C. Andrade, “Z scores, standard scores, and composite test scores explained,” Indian Journal of Psychological Medicine, vol. 43, no. 6, pp. 555–557, 2021, pMID: 35210687. [Online]. Available: https://doi.org/10.1177/02537176211046525

[21] G. Appel, The moving average convergence-divergence trading method: advanced version. Scientific Investment Systems, 1985.

[22] G. Bradski, “The OpenCV Library,” Dr. Dobb’s Journal of Software Tools, 2000. [23] R. Okuta, Y. Unno, D. Nishino, S. Hido, and C. Loomis, “Cupy: A numpy-compatible library for nvidia gpu calculations,” in Proceedings of Workshop on Machine Learning Systems (LearningSys) in The Thirty-first Annual Conference on Neural Information Processing Systems (NIPS), 2017. [Online]. Available: http://learningsys.org/nips17/assets/papers/paper_16. pdf

24] “Opencv: Smoothing images,” https://docs.opencv.org/4.x/d4/d13/tutorial_py_filtering.html, OpenCV, accessed on 2023- 06-05.

25] N. Snavely. Cs6670: Computer vision. Cornell University. Slides 35-45. [Online]. Available: https://www.cs.cornell.edu/ courses/cs6670/2011sp/lectures/lec02_filter.pdf

26] M. Abadi, A. Agarwal, P. Barham, E. Brevdo, Z. Chen, C. Citro, G. S. Corrado, A. Davis, J. Dean, M. Devin, S. Ghemawat, I. Goodfellow, A. Harp, G. Irving, M. Isard, Y. Jia, R. Jozefowicz, L. Kaiser, M. Kudlur, J. Levenberg, D. Mané, R. Monga, S. Moore, D. Murray, C. Olah, M. Schuster, J. Shlens, B. Steiner, I. Sutskever, K. Talwar, P. Tucker, V. Vanhoucke, V. Vasudevan, F. Viégas, O. Vinyals, P. Warden, M. Wattenberg, M. Wicke, Y. Yu, and X. Zheng, “TensorFlow: Large-scale 96 11 References machine learning on heterogeneous systems,” 2015, software available from tensorflow.org. [Online]. Available: https://www.tensorflow.org/

27] “Cuda toolkit documentation 12.1,” https://docs.nvidia.com/cuda/archive/12.1.0/, NVIDIA, accessed on 2023-06-07.

28] J. Chung, C. Gulcehre, K. Cho, and Y. Bengio, “Empirical evaluation of gated recurrent neural networks on sequence modeling,” 2014.

29] N. Srivastava, G. Hinton, A. Krizhevsky, I. Sutskever, and R. Salakhutdinov, “Dropout: A simple way to prevent neural networks from overfitting,” Journal of Machine Learning Research, vol. 15, no. 56, pp. 1929–1958, 2014. [Online]. Available: http://jmlr.org/papers/v15/srivastava14a.html

30] S. R. Dubey, S. K. Singh, and B. B. Chaudhuri, “Activation functions in deep learning: A comprehensive survey and benchmark,” 2022.

31] A. Kensert, E. Bosten, G. Collaerts, K. Efthymiadis, P. Van Broeck, G. Desmet, and D. Cabooter, “Convolutional neural network for automated peak detection in reversed-phase liquid chromatography,” Journal of Chromatography A, vol. 1672, p. 463005, 2022. [Online]. Available: https://www.sciencedirect.com/science/article/pii/S0021967322002035

32] S. Ahmed, O. E. Garcia, and A. Theodorsen, “Reconstruction of intermittent data time series as a superposition of pulses,” 2023.

33] ——, “Deconvolution methods,” https://github.com/uit-cosmo/fpp-analysis-tools/blob/ fd2edaacf41df7d04ec2950e444ed0f0fb607f66/fppanalysis/deconvolution_methods.py, accessed on 2023-06- 06.

[34] “Scipy find peaks documentation,” https://docs.scipy.org/doc/scipy-1.10.1/reference/generated/scipy.signa…. html, SciPy, accessed on 2023-06-06.

[35] “Diii-d national fusion facility | general atomics,” https://www.ga.com/magnetic-fusion/diii-d, General Atomics, accessed on 2023-06-06.

[36] A. Bahrini, M. Khamoshifar, H. Abbasimehr, R. J. Riggs, M. Esmaeili, R. M. Majdabadkohne, and M. Pasehvar, “Chatgpt: Applications, opportunities, and threats,” 2023.

[37] A. M. Dakhel, V. Majdinasab, A. Nikanjam, F. Khomh, M. C. Desmarais, Z. Ming, and Jiang, “Github copilot ai pair programmer: Asset or liability?” 2023.

Download scriptie (12.58 MB)
Genomineerde shortlist Eosprijs
Universiteit of Hogeschool
Universiteit Gent
Thesis jaar
2023
Promotor(en)
prof. dr. Geert Verdoolaege