High-Throughput CCSDS Baseband Modem with GPU Support for Satellite SDR Modem Application
Satellietcommunicatiesystemen hebben af te rekenen met verschillende vormen van interferentie en vereisen robuuste communicatiemethoden om betrouwbare dataoverdracht te kunnen garanderen. Dit leidt tot extra complexiteit bij zowel de zender als de ontvanger, die hiervoor vaak specifieke hardware nodig hebben om rekenintensieve bewerkingen uit te voeren. Software-defined radio (SDR) modems vormen een software-gebaseerde alternatief dat meer flexibiliteit biedt. Het nadeel is echter dat ze doorgaans minder goed presteren.
Deze thesis onderzoekt of een graphics processing unit (GPU) ingezet kan worden om een snellere dataverwerking toe te laten in een SDR-modem, met als doel de prestaties aanzienlijk te verbeteren. De focus ligt hierbij op een suppressed carrier demodulator, een veelgebruikte maar rekenintensieve stap binnen SDR-ontvangers.
Er werd uitgebreid onderzoek gedaan naar de werking van de suppressed carrier demodulator, een belangrijke stap bij het optimaliseren ervan. Daarnaast werd de GPU-technologie bestudeerd, met aandacht voor architectuur, geheugenhiërarchie, programmeermodellen en de selectie van een geschikte GPU-kaart. SYCL werd gekozen als programmeermodel vanwege zijn flexibiliteit, platformonafhankelijkheid en ontwikkeld ecosysteem.
De bestaande demodulator werd geanalyseerd om knelpunten en kritische componenten in kaart te brengen. Op basis daarvan zijn twee parallellisatiestrategieën voorgesteld, elk met een verschillend niveau van parallelisme. Voor één van deze strategieën werd een proof of concept ontwikkeld, waarbij vier belangrijke componenten van de demodulator werden geparallelliseerd. Aan de hand van testbenches werden deze componenten afzonderlijk geëvalueerd. Hierbij werd het potentieel van GPU-parallellisatie duidelijk aangetoond, met snelheidsverbeteringen tot 12,5 keer onder de typische werkomstandigheden van de demodulator. Tijdens de integratie in de demodulator werd echter een onverwachte overhead vastgesteld, wat de prestaties negatief beïnvloedde. Door deze te compenseren werd de snelheidslimiet van 8 Msym/s op 11 Msym/s gebracht, wat overeenkomt met een versnelling van 37,5%.
Ondanks de beperkte prestatiewinst bij de integratie, toonden de afzonderlijke componenten aan dat door GPU-parallellisatie aanzienlijke datasnelheden behaald kunnen worden. De aparte componenten zijn momenteel al in staat tot deze hogere prestaties, maar worden beperkt door de architectuur van de demodulator. Deze studie vormt daarmee een stevige basis voor verdere ontwikkeling, waarbij het upgraden van dit proof of concept naar de tweede parallellisatiestrategie aanbevolen wordt om het volledig potentieel van de GPU te benutten.
Meer lezen