Monitoring Financial Transactions: Efficient Algorithms for Streaming Data

Miel Verkerken
Ontwikkeling en implementatie van een efficiënt algoritme om real-time fraud detectie te doen op een stream van data. Hierbij ligt de focus op een zo hoog mogelijk aantal fraudulente transacties te detecteren met zo weinig mogelijk valse alarmen.

Technologische (r)evolutie, kan dit blijven duren?

Je kan er niet om geen, de technologische evolutie raakt ieders leven. Robots die onze jobs dreigen over te nemen, wereldwijde testen met zelf-rijdende auto's tot AI chips in onze nieuwste smartphones. Maar kunnen wij ons leven zomaar zorgeloos overlaten aan de Googles van deze wereld?

De handen in elkaar slaan met artificiële intelligentie.

Artificiële intelligentie ondervindt in het algemeen een negatieve sociale perceptie, bekrachtigd door het populaire gezegde “machines will take over”. Historisch gezien is dit geen unicum, mensen hebben zich altijd al verzet tegen zaken die ze niet kunnen verklaren en hun bedreigen, denk maar aan heksenjachten. 

Om dit beeld aan te passen en verdere ontwikkelingen te omarmen, is er nood aan openheid. Hoe zijn onze toestelen geprogrammeerd of getraind om soms (levens-)belangrijke keuzes te nemen. Deze openheid ontbreekt vaak bij actuele machine learning technieken, die nu vaak een ‘black box’ principe volgen. Daarom is onderzoek naar transparante algoritmes belangrijk, zoals in mijn thesis omtrent FADO. 

FADO staat voor online fault detection. Hierbij focust dit algoritme zich op real-time detecteren van fraud in een stream van data. Denk onder meer aan de continue reeks van financiële transacties die een bank ontvangt en waaruit het criminele activiteit moet filteren. Tegenwoordig wordt deze data vaak op een bepaald moment van de dag in 1 keer verwerkt. Doordat de consument als maar meer nood heeft aan real-time betalingen, moeten deze fraud detectie systemen ook efficient en onmiddellijk transacties kunnen markeren als fraudulent. 

Door het eenvoudige principe dat achter FADO zit, is het zeer efficient en kan eenvoudig duizenden transacties per seconde verwerken. Verder is hierdoor het publiek beschikbare algoritme ook makkelijk te analyseren. Zo voldoet het volledig aan de transparante verwachting, voor een toekomst waarin men technologie met een gerust hart kan vertrouwen.

Bibliografie

@BOOK{Scott:16,
  title        = {E-commerce Can Expect Nearly \$7 Billion in Chargebacks in 2016},
  author    = {Scott Stone},
  year        = 2016,
  note        = {\\https://chargeback.com/ecommerce-can-expect-nearly-7-billion-chargeback…}
}
@BOOK{Emily:17,
  title        = {E-commerce Payment Fraud Outlook 2017-2020},
  author    = {Emily Vuitton},
  year        = 2017,
  note        = {\\https://chargeback.com/ecommerce-payment-fraud-outlook-2020/}
}
@BOOK{pelckmans:17,
    author  = {Kristiaan Pelckmans},
    title   = {FADO: A Deterministic Detection/Learning Algorithm},
    year    = {2017},
    note    = {\\https://arxiv.org/abs/1711.02361}
}
@BOOK{Brunet:17,
    author  = {Etienne Brunet},
    title   = {Swish, the secret Swedish FinTech payment company created by Nordic banks and used by 50\% of Swedes is challenging Swedish unicorns},
    year    = {2017},
    note    = {\\https://medium.com/@etiennebr/swish-the-secret-swedish-fintech-payment-…}
}
@BOOK{trevor08,
    author  = "Trevor Hastie, Robert Tibshirani, Jerome Friedman",
    title   = "The {E}lements of {S}tatistical {L}earning {D}ata {M}ining, {I}nference, and {P}rediction",
    year    = "2008",
    journal = "Springer",
    volume  = "2nd Edition",
    pages   = "1--745"
}
@BOOK{zahra:17,
    author  = {Z. Rabiei},
    title   = "Identifying intended and unintended errors in financial transactions: a case study",
    year    = "2017",
    journal = "DIVA",
    volume  = "",
    pages   = "1--27"
}
@BOOK{scholz:06,
    author  = {Matthias Scholz},
    title   = {PCA - Principal Component Analysis},
    year    = {2016},
    note    = {\\http://www.nlpca.org/pca\_principal\_component\_analysis.html}
}
@BOOK{Brownlee:17,
    author  = {Jason Brownlee},
    title   = {Why One-Hot Encode Data in Machine Learning?},
    year    = {2017},
    note    = {\\https://machinelearningmastery.com/why-one-hot-encode-data-in-machine-l…}
}
@BOOK{Edgar:16,
    author  = {Lopez-Rojas Edgar Alonso},
    title   = {Applying Simulation to the Problem of Detecting Financial Fraud},
    year    = {2016},
    note    = {\\http://bth.diva-portal.org/smash/record.jsf?pid=diva2%3A955852&dswid=-7…}
}
@BOOK{creditcard:15,
    author  = {Andrea Dal Pozzolo, Olivier Caelen, Reid A. Johnson, and Gianluca Bontempi},
    title   = {Calibrating Probability with Undersampling for Unbalanced Classification. In Symposium on Computational Intelligence and Data Mining (CIDM)},
    year    = {2015},
    note    = {\\https://www.kaggle.com/mlg-ulb/creditcardfraud}
}
@BOOK{scikit-learn:18,
    author  = {Scikit-learn},
    title   = {StandardScaler},
    year    = {2018},
    note    = {\\http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing…}
}
@BOOK{Andrea:15,
    author  = {Andrea Dal Pozzolo},
    title   = {Adaptive Machine Learning for Credit Card Fraud Detection},
    year    = {2015},
    note    = {\\http://www.ulb.ac.be/di/map/adalpozz/pdf/Dalpozzolo2015PhD.pdf}
}
@BOOK{Andrea2:15,
    author  = {Andrea Dal Pozzolo},
    title   = {Calibrating Probability with Undersampling for Unbalanced Classification},
    year    = {2015},
    note    = {\\https://www3.nd.edu/~dial/publications/dalpozzolo2015calibrating.pdf}
}
@BOOK{Hanumantha:18,
    author  = {Hanumantha Rao},
    title   = {Credit Card Fraud Detection, Anomaly Detection Using Python},
    year    = {2018},
    note    = {\\http://www.datajango.com/credit-card-fraud-detection-with-python-comple…}
}
@BOOK{Varun:09,
    author  = {VARUN CHANDOLA, ARINDAM BANERJEE, and VIPIN KUMAR},
    title   = {Anomaly Detection: A Survey},
    year    = {2009},
    note    = {\\https://dl.acm.org/citation.cfm?doid=1541880.1541882}
}
@BOOK{Ahmad:17,
    author  = {Subutai Ahmad, Alexander Lavin, Scott Purdy, Zuha Agha},
    title   = {Unsupervised real-time anomaly detection for streaming data},
    year    = {2017},
    note    = {\\https://doi.org/10.1016/j.neucom.2017.04.070}
}
@BOOK{patcha:07,
    author  = {Patcha, Animesh and Park, Jung-Min},
    title   = {An overview of anomaly detection techniques: Existing solutions and latest technological trends},
    year    = {2007},
    note    = {\\https://doi.org/10.1016/j.comnet.2007.02.001}
}
@BOOK{markus:16,
    author  = {Markus Goldstein, Seiichi Uchida},
    title   = {A Comparative Evaluation of Unsupervised Anomaly Detection Algorithms for Multivariate Data},
    year    = {2016},
    note    = {\\https://journals.plos.org/plosone/article?id=10.1371/journal.pone.01521…\#sec025}
}

Universiteit of Hogeschool
Industriële wetenschappen: informatica
Publicatiejaar
2018
Promotor(en)
Kristiaan Pelckmans, Marcus Björk
Kernwoorden
Deel deze scriptie