De handel van te jonge puppy’s bestrijden met AI

Jennifer
Martlé

Eén vierde van de geadopteerde puppy’s in Vlaamse gezinnen is afkomstig uit het buitenland. Daar is niets mis mee natuurlijk. Maar wat als je wist dat het grootste deel hiervan afkomstig is uit Oost-Europese landen, waar de meerderheid van frauduleuze kwekers gevestigd is? Het betreft leveranciers die overigens puppy’s op te jonge leeftijd verhandelen, wat de gezondheid en het welzijn van zowel hond als mens in gevaar brengt. Zou jij nog een pup uit het buitenland aankopen?

Om het probleem van de illegale puppyhandel te bestrijden, is het essentieel om de leeftijd van een pup accuraat te kunnen bepalen. In mijn masterproef heb ik met artificiële intelligentie (AI) een systeem ontwikkeld dat dit kan.

De wetgeving (en het overtreden ervan)

Nu kan je de vraag stellen: “Is er geen wetgeving die het verhandelen van te jonge pups ontzegt?”. Die is er wel, maar die wordt niet altijd gevolgd. Er bestaan zowel Europese als Vlaamse regelgevingen die deze handel verbieden. Honden jonger dan acht weken mogen niet van hun moeder gescheiden worden wegens welzijns- en gezondheidsredenen. Daarbovenop mogen honden jonger dan vijftien weken niet verhandeld worden over Europese grenzen omdat hun rabiës vaccin dan nog niet in werking is.

Aangezien de puppyhandel een echte “business” is, waar het zo snel mogelijk verkopen van pups het meeste opbrengt, wordt de wetgeving niet altijd nageleefd. Daarbovenop worden de puppy’s niet enkel te vroeg verhandeld, maar ook nog eens in barre omstandigheden grootgebracht en vervoerd.

Om aan te tonen dat een bepaalde handelaar de wet overtreedt, moet de leeftijd van de pup dus gekend zijn. Dit is niet altijd even simpel, aangezien paspoorten vaak vervalst worden en honden soms helemaal geen identificatie bij zich hebben. Het is dus essentieel om de leeftijd van een pup nauwkeurig te kunnen bepalen, om te bewijzen of een handelaar zich al dan niet aan de regels houdt.

AI, AI, AI

Hoe kan AI een oplossing bieden voor dit probleem? AI, meer bepaald het subdomein machinaal leren (ML), kan vanuit bestaande data leren en vervolgens voor ongeziene gegevens voorspellingen maken. 

Laten we dit nu eens toepassen op het specifieke probleem van leeftijdsbepaling bij puppy’s. Daarbij is eerst en vooral data nodig van pups, waarbij bijvoorbeeld bepaalde kenmerken zoals het ras, de grootte, de ontwikkeling… van het dier geregistreerd zijn. Daarbovenop moet ook de leeftijd van de pup genoteerd zijn. Met deze kennis kan een algoritme of model getraind worden die uit die eigenschappen leert om de leeftijd van een puppy te bepalen. Wanneer dit model goede resultaten oplevert, kan het gebruikt worden om aan een grenscontrole de leeftijd van een pup te determineren.

De data: mondje open

ML-modellen hebben dus data nodig om van te leren. De data die in mijn masterproef gebruikt wordt, is afkomstig uit een diergeneeskundige studie. Hoewel dit eerder onderzoek resulteerde in een techniek die de leeftijd van een puppy kan schatten op basis van zijn gebit, zijn de schattingen niet precies genoeg. Met mijn masterproef is het de bedoeling om deze resultaten accurater te maken met behulp van AI.

Tandheelkundig onderzoek hond

Welke data precies verzameld werd in die eerdere studie is de volgende: de tandheelkundige ontwikkeling van puppy’s met daarbij ook het geslacht, het ras, de grootte en het schedeltype. Dit werd voor zowel het doorkomen van de melktanden, als de volwassen tanden geregistreerd.

De data bevat één grote uitdaging. De leeftijd van de pups is namelijk in intervallen genoteerd. Dit wil zeggen dat de exacte ouderdom wanneer een bepaalde tand uitkwam niet gekend is. Dit fenomeen wordt interval censurering genoemd en wordt in de statistische tak survival analyse (SA) bestudeerd.

Hand in hand: AI en SA

Zo bestaat het ontwikkelde systeem niet enkel uit AI-technieken. Het is een combinatie tussen traditionele statistische SA-methodes en AI. Door deze samen te brengen kunnen de voordelen uit beide domeinen bijeengevoegd worden. 

Door gebruik te maken van SA kan het model de interval gecensureerde data correct verwerken. De combinatie met AI laat toe om de bestaande SA-methodes te verbeteren doordat het complexere en grotere datasets kan verwerken waaruit kwalitatievere predicties voortkomen.

En, hoe zijn je resultaten?

Voor zowel het melk- als het volwassen gebit zijn verschillende modellen opgesteld en geëvalueerd. 

Schematische voorstelling modellen

Hieruit blijkt dat de hybride ML- en SA-modellen beter scoren dan de klassieke statistische SA-modellen. Daarnaast hebben ze op de cruciale tijdstippen van acht en vijftien weken een goede accuraatheid.

 

 

Met hybride ML- en SA-modellen kunnen dus betrouwbare leeftijdsvoorspellingen voor puppy’s gemaakt worden op basis van hun tandgegevens. De modellen kunnen als bevestiging of advies dienen bij douanecontroles. De verkregen resultaten tonen aan dat de modellen in dit onderzoek waardevolle ondersteuning kunnen bieden bij de leeftijdsbepaling van honden, waardoor ze in de toekomst hopelijk ingezet zullen worden om de illegale puppyhandel te bestrijden.

 

Bibliografie

Allende, Alonso Silva (8 okt 2019). “Concordance Index as an Evaluation Metric”. In: Analytics Vidhya. URL: https://medium.com/analytics-vidhya/concordance-index-72298c11eac7.

Barnwal, Avinash, Hyunsu Cho en Toby Dylan Hocking (8 jun 2020). “Survival regression with accelerated failure time model in XGBoost”. In: arXiv: 2006.04920 [cs.LG].

Belyadi, Hoss en Alireza Haghighat (2021). “Supervised learning”. In: Machine Learning Guide for Oil and Gas Using Python. Elsevier, p. 169–295. ISBN: 9780128219294. DOI: 10.1016/b978-0-12-821929-4.00004-4.

Błasiok, Jarosław en Preetum Nakkiran (2024). “Smooth ECE: Principled Reliability Diagrams via Kernel Smoothing”. In: The Twelfth International Conference on Learning Representations. URL: https://openreview.net/forum?id=XwiA1nDahv.

Bou-Hamad, Imad, Denis Larocque en Hatem Ben-Ameur (jan 2011). “A review of survival trees”. In: Statistics Surveys 5.none. ISSN: 1935-7516. DOI: 10.1214/09-ss047.

Brankovič, Jana (mei 2023). “Accurate age estimation of puppies: a vital tool to combat the illegal puppy trade”. In: Veterinary Record 192.9, p. 368–370. ISSN: 2042-7670. DOI: 10.1002/vetr.3021.

Cao, Yang e.a. (sep 2023). “Development and Validation of an XGBoost-Algorithm-Powered Survival Model for Predicting In-Hospital Mortality Based on 545,388 Isolated Severe Traumatic Brain Injury Patients from the TQIP Database”. In: Journal of Personalized Medicine 13.9, p. 1401. ISSN: 2075-4426. DOI: 10 . 3390 /jpm13091401.

CatBoost ontwikkelaars (20 mei 2021). Survival analysis with CatBoost. https://github.com/catboost/tutorials/blob/master/regression/survival.i….

Davidson-Pilon, Cameron e.a. (mei 2021). CamDavidsonPilon/lifelines: 0.26.0. Versie 0.26.0. DOI: 10.5281/zenodo.4816284. URL: https://doi.org/10.5281/zenodo.4816284.

Decorte, Johan en Sabine De Vreese (2022). Machine Learning: cursus en lesnota’s. URL: https://colab.research.google.com/github/jdecorte/machinelearning/blob/….

Dickson, David C. M., Mary R. Hardy en Howard R. Waters (2019). Actuarial Mathematics for Life Contingent Risks.3de ed. International Series on Actuarial Science. Cambridge University Press.

Dierenwelzijn Vlaanderen (jan 2024). Cijfers dierenwelzijn. Dierenwelzijn Vlaanderen. URL: https : / / www .vlaanderen.be/dierenwelzijn/werking-en-beleid/cijfers-dierenwelzijn.

European Parliament (8 jun 2023). EU AI Act: first regulation on artificial intelligence. URL: https : / / www .europarl . europa . eu / topics / en / article / 20230601STO93804 / eu - ai - act - first - regulation - on - artificial -intelligence.

European Union (15 jun 2020). What to check before buying a dog, especially online? URL: https://food.ec.europa.eu/system/files/2021-09/aw_platform_plat-conc_gu….

Europees Parlement (4 sep 2020). Wat is artificiële intelligentie en hoe wordt het gebruikt? URL: https://www.europarl.europa.eu/news/nl/headlines/society/20200827STO85804/wat-is-artificiele-intelligentie-en-hoewordt-het-gebruikt.

FEDIAF (2024). EUROPEAN PET POPULATION AND MARKET DATA 2022. URL: https : / / europeanpetfood . org /about / statistics / ? _ gl = 1 * jyycok * _ga * MjA5ODIwMjMzMS4xNzI3NTMzNzUw * _ga _ TKE2BL8C8W *MTcyNzUzMzc0OS4xLjEuMTcyNzUzNDgyOS4wLjAuMA...

Friedman, Jerome H. (sep 2006). “Recent Advances in Predictive (Machine) Learning”. In: Journal of Classification 23.2, p. 175–197. DOI: 10.1007/s00357-006-0012-4.

Geeitha, S. e.a. (aug 2024). “Integrating cat boost algorithm with triangulating feature importance to predict survival outcome in recurrent cervical cancer”. In: Scientific Reports 14.1. ISSN: 2045-2322. DOI: 10 . 1038 /s41598-024-67562-0.

Geloven, N van en R.B. Geskus (11 sep 2024). Survival analyse. Amsterdam UMC. URL: https://wikistatistiek.amc.nl/Survival_analyse.

Géron, Aurélien (15 okt 2019). Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow. O’Reilly UK Ltd. 819 p. ISBN: 1492032646.

Goldstein-Greenwood, Jacob (15 feb 2021). A Brief on Brier Scores. University of Virginia. URL: https : / / library .virginia.edu/data/articles/a-brief-on-brier-scores.

Health, European Commission. Directorate General for en Food Safety. (2023). Illegal trade of cats & dogs EU enforcement action. Publications Office. DOI: 10.2875/236344.

Health, Food Chain Safety and Environment (27 jan 2016). Travelling with pets. URL: https : / / www . health .belgium . be / en / animals - and - plants / animals / animal - keeping - and - transporting / travelling - pets# : ~ :text=Pets%20under%2012%20weeks%20of%20age%20that%20have%20not%20been,site%20of%20the%20European%20Commission%20..

Herzig, Sébastien e.a. (okt 2024). “A biological age based on common clinical markers predicts health trajectory and mortality risk in dogs”. In: GeroScience 47.1, p. 45–59. ISSN: 2509-2723. DOI: 10.1007/s11357-024-01352-4.

Huang, Yinan e.a. (nov 2023). “Application of machine learning in predicting survival outcomes involving realworld data: a scoping review”. In: BMC Medical Research Methodology 23.1. ISSN: 1471-2288. DOI: 10 . 1186 /s12874-023-02078-1.

In, Junyong en Dong Kyu Lee (okt 2019). “Survival analysis: part II – applied clinical data analysis”. In: Korean Journal of Anesthesiology 72.5, p. 441–457. ISSN: 2005-7563. DOI: 10.4097/kja.19183.

Ishwaran, Hemant e.a. (2021). randomForestSRC: random survival forests vignette. http://randomforestsrc.org/articles/survival.html. URL: http://randomforestsrc.org/articles/survival.html.

Jennings, Ryan en Christopher Premanandan (2017). Veterinary Histology. The Ohio State University. URL: https://ohiostate.pressbooks.pub/vethisto/.

Kang, Jimin (10 mei 2024). “Inverse Probability Censoring Weighting (IPCW) applied to Time-to-Event Prediction”. In: URL: https://medium.com/@jimin.kang821/inverse-probability-censoring-weighti….

Karovic, Haris (15 jun 2023). “Comparison of Pre-processing Methods and Various Machine Learning Models for Survival Analysis on Cancer Data”. Masterscriptie. Norwegian University of Life Sciences.

Kim, Gwangsu, Chang D. Yoo en Seong J. Yang (2022). “Survival Analysis of COVID-19 Patients With Symptoms Information by Machine Learning Algorithms”. In: IEEE Access 10, p. 62282–62291. ISSN: 2169-3536. DOI: 10.1109/access.2022.3182350.

Kleinbaum, David G. en Mitchel Klein (2012). Survival Analysis: A Self-Learning Text. Springer New York. ISBN:9781441966469. DOI: 10.1007/978-1-4419-6646-9.

Lesaffre, Emmanuel, Arnošt Komárek en Dominique Declerck (dec 2005). “An overview of methods for intervalcensored data with an emphasis on applications in dentistry”. In: Statistical Methods in Medical Research 14.6, p. 539–552. ISSN: 1477-0334. DOI: 10.1191/0962280205sm417oa.

Longato, Enrico, Martina Vettoretti en Barbara Di Camillo (aug 2020). “A practical perspective on the concordance index for the evaluation and selection of prognostic time-to-event models”. In: Journal of Biomedical Informatics 108, p. 103496. ISSN: 1532-0464. DOI: 10.1016/j.jbi.2020.103496.

Lundberg, Scott M en Su-In Lee (2017). “A Unified Approach to Interpreting Model Predictions”. In: Advances in Neural Information Processing Systems 30. Red. door I. Guyon e.a. Curran Associates, Inc., p. 4765–4774. URL:http://papers.nips.cc/paper/7062-a-unified-approach-to-interpreting-mod….

Manning, Christopher (sep 2020). “Artificial Intelligence Definitions”. In: URL: https://hai.stanford.edu/sites/default/files/2020-09/AI-Definitions-HAI….

Mitra, Johanna (2024). “FishSurv: An AI-Driven API for Predicting Fish Mortality in Aquaculture Using Neural Network Survival Analysis”. Masterscriptie. Keele University.

Modina, S.C. e.a. (apr 2019). “Age assessment in puppies: Coming to terms with forensic requests”. In: Forensic Science International 297, p. 8–15. ISSN: 0379-0738. DOI: 10.1016/j.forsciint.2019.01.003.

Moro, Amika e.a. (jul 2024). “Survival Tree Provides Individualized Estimates of Survival After Lung Transplant”.In: Journal of Surgical Research 299, p. 195–204. ISSN: 0022-4804. DOI: 10.1016/j.jss.2024.04.017.

Nahhas, Ramzi W. (13 okt 2024). Introduction to Regression Methods for Public Health Using R. URL: https : / /www.bookdown.org/rwnahhas/RMPH/.

National Institute of Standards and Technology (z.d.). Normal Distribution. URL: https://www.itl.nist.gov/div898/handbook/eda/section3/eda3661.htm.

Odell, Patricia M., Keaven M. Anderson en Ralph B. D’Agostino (sep 1992). “Maximum Likelihood Estimation for Interval-Censored Data Using a Weibull- Based Accelerated Failure Time Model”. In: Biometrics 48.3, p. 951.ISSN: 0006-341X. DOI: 10.2307/2532360.

OpenAI (30 nov 2022). Introducing ChatGPT. URL: https://openai.com/blog/chatgpt.

Paksoy, Tuğçe (2021). “Machine learning methods for survival data”. Masterscriptie. Dokuz Eylül University.

Pal, Suvra e.a. (nov 2023). “A support vector machine-based cure rate model for interval censored data”. In: Statistical Methods in Medical Research 32.12, p. 2405–2422. ISSN: 1477-0334. DOI: 10.1177/09622802231210917.

Parker, Heidi e.a. (apr 2017). “Genomic Analyses Reveal the Influence of Geographic Origin, Migration, and Hybridization on Modern Dog Breed Development”. In: Cell Reports 19, p. 697–708. DOI: 10.1016/j.celrep.2017.03.079.

Pedregosa, F. e.a. (2011). “Scikit-learn: Machine Learning in Python”. In: Journal of Machine Learning Research 12, p. 2825–2830.

Pölsterl, Sebastian (2020). “scikit-survival: A Library for Time-to-Event Analysis Built on Top of scikit-learn”. In: Journal of Machine Learning Research 21.212, p. 1–6. URL: http://jmlr.org/papers/v21/20-729.html.

Reisen, Jan (13 mei 2021). A Puppy Growth Timeline: Transitions in Puppyhood. American Kennel Club. URL: https: //www.akc.org/expert-advice/training/puppy-growth-timeline-transitions-pu….

Roccaro, Mariana (2020). “New advances in estimating the age of dog puppies for medico-legal purposes”. Proefschrift. Università di Bologna.

Roccaro, Mariana en Angelo Peli (2020). “Age determination in dog puppies by teeth examination: legal, health and welfare implications, review of the literature and practical considerations”. In: Veterinaria Italiana 56, p. 149–162. ISSN: 18281427. DOI: 10.12834/VetIt.1876.9968.2.

Rodrigo, Hansapani en Chris P. Tsokos (2017). “Artificial Neural Network Model for Predicting Lung Cancer Survival”. In: Journal of Data Analysis and Information Processing 05.01, p. 33–47. ISSN: 2327-7203. DOI: 10.4236/jdaip.2017.51003.

RSPCA (30 jul 2024). What is a puppy farm? URL: https://kb.rspca.org.au/knowledge-base/what-is-a-puppyfarm/.

Sangani, Raj (12 sep 2022). A Comprehensive Guide on Model Calibration: What, When, and How. URL: https ://towardsdatascience.com/a-comprehensive-guide-on-model-calibration-part-1-of-4-73466eb5e09a/.

Shih, Shannon en Pravin Ravishanker (26 dec 2017). “Machine Learning Crash Course: Part 5 — Decision Trees and Ensemble Models”. In: URL: https://medium.com/@ml.at.berkeley/machine-learning-crash-course-part-5….

Shreffler, Jacob en Martin R. Huecker (22 mei 2023). Survival Analysis. URL: https://www.ncbi.nlm.nih.gov/books/NBK560604/.

Simoens, Pieter en Sam Leroux (2024). Machinaal Leren: cursus en lesnota’s.

Singh, Rishabh (9 okt 2024). “Decision Trees”. In: URL: https://medium.com/@RobuRishabh/decision- treesc3c64e81760e.

So, Banghee (jul 2023). “CatBoost Versus XGBoost and LightGBM: Developing Enhanced Predictive Models for Zero-Inflated Insurance Claim Data”. In: URL: https : / / www . researchgate . net / publication / 372372195 _CatBoost _ Versus _ XGBoost _ and _ LightGBM _ Developing _ Enhanced _ Predictive _ Models _ for _ Zero -Inflated_Insurance_Claim_Data.

Sprent, Peter (1988). Applied Nonparametric Statistical Methods. Springer Netherlands. ISBN: 9789400912236.DOI: 10.1007/978-94-009-1223-6.

Taktak, Azzam en Anthony Fisher (2007). Outcome Prediction in Cancer. Elsevier. ISBN: 9780444528551. DOI:10.1016/b978-0-444-52855-1.x5000-4.

Texas A&M College of Veterinary Medicine & Biomedical Sciences (19 mei 2023). The Puppy Timeline: Physical And Mental Changes. URL: https://vetmed.tamu.edu/news/pet-talk/puppy-timeline-part-1/.

The Brussels Times Newsroom (21 apr 2022). “1 in 5 dogs in Flanders comes from abroad”. In: The Brussels Times. URL: https://www.brusselstimes.com/218588/1-in-5-dogs-in-flanders-comes-from….

The Global Goals (z.d.). The 17 goals. URL: https://www.globalgoals.org/goals/.

Tizi, Wafaa en Abdelaziz Berrado (sep 2023). “Machine learning for survival analysis in cancer research: A comparative study”. In: Scientific African 21, e01880. ISSN: 2468-2276. DOI: 10.1016/j.sciaf.2023.e01880.

Turkson, Anthony Joe, Francis Ayiah-Mensah en Vivian Nimoh (sep 2021). “Handling Censoring and Censored Data in Survival Analysis: A Standalone Systematic Literature Review”. In: International Journal of Mathematics and Mathematical Sciences 2021. Red. door Niansheng Tang, p. 1–16. ISSN: 0161-1712. DOI: 10.1155/2021/9307475.

Van den Broeck, Martine (2022). “Age estimation in puppies and young adult dogs: data driven protocol design for the prevention and detection of age fraud in puppy trade”. Proefschrift. Ghent University.

Van den Broeck, Martine en Pieter Cornillie (jun 2020). “Legal framework and current techniques for age estimation in puppy trade”. In: Vlaams Diergeneeskundig Tijdschrift 89.3, p. 135–144. ISSN: 0303-9021. DOI:10.21825/vdt.v89i3.16533.

Vlaamse Raad voor Dierenwelzijn (29 sep 2022). Invoer van straat- en asielhonden. URL: https : / / assets .vlaanderen . be / image / upload / v1671737886 / Advieswijzer _ VRvD _ invoer _ van _ straat _ en _ asielhonden _29.09.22_vvbva0.pdf.

Vock, David M. e.a. (jun 2016). “Adapting machine learning techniques to censored time-to-event health record data: A general-purpose approach using inverse probability of censoring weighting”. In: Journal of Biomedical Informatics 61, p. 119–131. ISSN: 1532-0464. DOI: 10.1016/j.jbi.2016.03.009.

Wang, Eric, Igor Shuryak en David J. Brenner (dec 2023). “Quantifying the effects of neutron dose, dose protraction, age and sex on mouse survival using parametric regression and machine learning on a 21,000-mouse data set”. In: Scientific Reports 13.1. ISSN: 2045-2322. DOI: 10.1038/s41598-023-49262-3.

Wang, Ping, Yan Li en Chandan K. Reddy (2017). Machine Learning for Survival Analysis: A Survey. DOI: 10.48550/ARXIV.1708.04649.

Watkins, James en Ian Mathieson (2009). “CHAPTER 4 - Connective tissues”. In: The Pocket Podiatry Guide: Functional Anatomy. Red. door James Watkins en Ian Mathieson. Edinburgh: Churchill Livingstone, p. 107–156.ISBN: 978-0-7020-3032-1. DOI: https : / / doi . org / 10 . 1016 / B978 - 0 - 7020 - 3032 - 1 . 00004 - 4. URL: https ://www.sciencedirect.com/science/article/pii/B9780702030321000044.

Woolf, Virginia (1933). Flush. ISBN: 9780156319522.

Yang, Zhenwei e.a. (2 jan 2025). “Time-dependent Predictive Accuracy Metrics in the Context of Interval Censoring and Competing Risks”. In: arXiv: 2501.01280 [stat.ME].

Yau, Sarah Tsz Yui e.a. (apr 2025). “Survival Tree Analysis of Interactions Among Factors Associated With Colorectal Cancer Risk in Patients With Type 2 Diabetes: Retrospective Cohort Study”. In: JMIR Public Health and Surveillance 11, e62756–e62756. ISSN: 2369-2960. DOI: 10.2196/62756.

Download scriptie (24.29 KB)
Universiteit of Hogeschool
Universiteit Gent
Thesis jaar
2025
Promotor(en)
Sofie Van Hoecke, Luc Duchateau