Machine Learning Small Datasets for Cu Nanoparticles: enhancing Experimental and Computational lab-scale data
Universiteit Hasselt
2025
Koper-nanodeeltjes (Cu NP's) hebben een brede toepasbaarheid, maar hun synthese is gevoelig voor kleine veranderingen in reactieparameters. Deze gevoeligheid, in combinatie met het tijdrovende en arbeidsintensieve karakter van experimentele optimalisatie, vormt een grote uitdaging voor reproduceerbare synthese met gecontroleerde deeltjesgrootte. Bovendien is Machine Learning (ML) weliswaar veelbelovend gebleken voor materiaalonderzoek, maar wordt toepassing ervan vaak beperkt door gebrek aan hoogwaardige experimentele datasets. Deze studie onderzoekt ML om de grootte van Cu NP’s gevormd met microgolf geassisteerde polyolsynthese te voorspellen met kleine datasets, gegenereerd uit 25 intern uitgevoerde syntheses. Latin Hypercube Sampling wordt gebruikt om de parameterruimte van precursorconcentratie, temperatuur en reactietijd efficiënt te samplen. Ensemble-regressiemodellen, gebouwd met het AMADEUS-framework, voorspellen met hoge nauwkeurigheid de deeltjesgrootte en presteren daarmee beter dan klassieke statistische benaderingen. Featureselectie vermindert complexiteit van het model en verbetert generaliseerbaarheid. Daarnaast worden classificatiemodellen, gebaseerd op zowel traditionele random forests als Large Language Modellen (LLM’s), geëvalueerd om onderscheid te maken tussen grote en kleine deeltjes. Terwijl random forests matig presteren, bieden LLM’s geen duidelijke verbeteringen in omstandigheden met weinig gegevens. Over het algemeen toont dit onderzoek dat zorgvuldig samengestelde kleine datasets, in combinatie met robuuste klassieke ML, synthese van Cu NP's effectief kan voorspellen en dat voor laboratoriumonderzoek complexe LLM's geen voordelen bieden.
Meer lezen