Development of a Capability Maturity Model for Big Data Governance : Evaluation in the Belgian Financial Sector

Andra
Mertilos
  • Andra
    Mertilos

Big Data in Banks : governing the deluge

Een "normale" discussie tussen de front- en de back-office van een elke organisatie is jongleren met het verweten van " wie is schuldig" en waarom. De back-office klaagt dat de processen, die door de front office gevolgd worden, knelpunten opleveren door niet na te denken hoe een bedrijf daadwerkelijk opereert. Aan de andere kant, stelt de front office vast dat de bestaande processen ontworpen zijn om potentiële gebreken in de bedrijfsvoering op te lossen maar dat de back-office hen niet volgt. Dezelfde heen-en-weer gelden voor databeheer programma's.

Data is uitgegroeid tot een belangrijke troef in het huidige zakelijk landschap: gegevens over klanten, activiteiten, leveranciers en schuldeigenaars, nemen op een dagelijkse basis, de eerste plaats in alle  besluitnemers  agenda's door het geven van evaluaties en resoluties met het potentieel een bedrijf op elk niveau te beïnvloeden. Dat deze gegevens geldig en accuraat zijn is dan van centraal belang betreffende de resultaten en de invloed die ze creëren. Tegenwoordig wordt dit steeds complexer als nieuwe databronnen ook nieuwe uitdagingen brengen in termen van volume, variëteit of pluraliteit, om er maar een paar op te noemen. De "Big data fenomeen" staat gekenmerkt als één van de meest besproken onderwerpen in onderzoek en praktijk met meer dan 70% van alle gerangschikte papieren over dit onderwerp verschenen in de laatste twee jaar (Buhl, Röglinger, Moser, Heidemann, 2013).

In dit domein bestaat een stortvloed van gegevens en banken hebben hun eigen uitdagingen als ze trachtten al de vastgelegde en opgeslagen informatie te beheersen. Tamasauska, Liutvinavicius, Sakalauskas en Kriksciuniene (2013) stellen dat gegevens, die momenteel door financiële instellingen gebruikt worden, aan alle eisen voor big data voldoen (pp.36): "massale, tijdelijk besteld, snel veranderende, potentieel oneindige". Volgens hen, met succes gebruik maken van big data, biedt de mogelijkheid, om de noodzakelijke veranderingen in de bancaire sector (pp.36) aan te brengen: "een klantgerichte onderneming creëren ", "bedrijfsrisicobeheer te optimaliseren", "de flexibiliteit van de stroomlijnende activiteiten te vergroten”.

Bahjat El-Darwiche, Koch, Tohme, Shehadi en Meer (2014) wijzen er echter op, dat een gewoonlijke fout is, tijdens de discussies over Big Data, te denken dat hier draait over ingewikkelde technologieën, wat als gevolg is bedrijven, bij het verschenen van dergelijke initiatieven, te ontmoedigen. Hoewel we erkennen dat dit vooral het geval was, is de belangrijkste kracht van het succes van een big data project dat de organisaties een hervorming nodig hebben van de manier waarop de besluitvorming wordt afgedwongen: gebaseerd op duidelijke data-gedreven inzichten in plaats van alleen pure intuïtie. Big data projecten opleveren de beloofde resultaten als ze gebouwd worden op de fundamenten van een omgeving, die al een data-gedreven cultuur en mentaliteit geeft. Big data is inderdaad geen magische oplossing voor alle gegevens of problemen die een organisatie zou kunnen hebben.  Wat het biedt is de mogelijkheid om de besluitvorming scope uit te breiden door de erkenning van een hoeveelheid aan invalshoeken bij de aanpak van een bedrijfstaak. Dit zorgt ervoor dat zowel interne als externe beleidsmakers alle informatie aan de hand hebben om  geldige beslissingen te maken. Anders gezegd, dat er een data governance-opbouwplaats bestaat.

Een paar Benelux banken zijn al begonnen met big data initiatieven, zoals de ING Groep (Finance Lab, 2014) en KBC België (Van Leemputten, 2014) en deze noviteit maakt het moeilijk om degelijke data governance programma’s op te bouwen als de huidige project behoeften op zichzelf nog niet goed gedocumenteerd of begrepen zijn. De investeringen in het ontwikkelen van complexe Hadoop clusters zullen nutteloos blijken als hun doel niet gesynchroniseerd wordt met de behoeften van de organisatie.

De praktische bijdrage van ons werk is de poging om een sterke data governance-model voor de financiële sector aan te bieden. Discussiëren over wat het bestuur is of wat het bestuur zou moeten doen is gemakkelijk, maar begrijpen en het verzamelen van alle mogelijke elementen die dit steunen, is blijkbaar moeilijker.

We hebben getracht deze elementen te ontdekken in onze onderzoek, door het analyseren op het gebied van bestaande werk.  We hebben uiteenlopende elementen van dergelijke modellen samen gebracht en ze homogeen gestandaardiseerd om aan de specifieke kenmerken van elke sector aan te passen. We kozen ervoor om het aan de financiële sector aan te passen als gevolg aan intrinsieke behoefte aan normen en kaders: de notie van statistische controle stelt dat een praktijk die onder statistische controle is, altijd dezelfde resultaten zal opleveren. Regelgeving en compliance charters proberen praktijken in de financiële sector te normaliseren, om ervoor te zorgen dat de goede praktijken gesynchroniseerd worden voor de industrie, terwijl de invloed van slechte praktijken, op balans van het geheel vermijd wordt.

Ons model is een exempel dat de structuur van de Basel III-regelgeving kader volgt terwijl het de kenmerkende elementen van een bepaalde sector aanbrengt. Er wordt ook rekening gehouden met het feit dat, terwijl een regelgeving voor uniformiteit in de praktijken van de financiële sector zorgt, data governance-mogelijkheden een potentieel concurrentievoordeel biedt dat zeker niet onderschat mag worden.

Een van de belangrijkste conclusie van ons onderzoek onthult dat de tegenwoordige uitdaging, voor de financiële sector, de opbouw is van een pijler voor data governance praktijken terwijl innovatie buiten haar grenzen te verspreiden is.

Bibliografie

Bibliography

 

Afzali, P., Azmayandeh, E., Nassiri, R.,  & Latif Shabgahi, G. (2010). Effective governance through simultaneous use of COBIT and Val IT. 2010 International Conference on Education and Management Technology, 46-50.

Aiken, P., David Allen , M., Parker, B., & Mattia, A. (2007). Measuring data management practice maturity. Computer, 40(4), 42-50.

Alagha, H.(2013).Examining the Relationship between IT Governance Domains, Maturity, Mechanisms, and Performance: An Empirical Study toward a Conceptual Framework. Tenth International Conference on Information Technology: New Generations (ITNG), 767-772.

Ali-ud-din Khan, M., Uddin, M.F.,  & Gupta, N.(2014). Seven V's of Big Data understanding Big Data to extract value. 2014 Zone 1 Conference of the American Society for Engineering Education (ASEE Zone 1), 1-5.

Alves de Freitas, P., dos Reis, E.,A., Michel, S.W., Gronovicz, M.,E., & Rodrigues, M.,A.,M. (2013). Information governance, big data and data quality. IEEE 16th International Conference on Computational Science and Engineering, 1142-1143.

Apache Hive. (2015). Apache Hive. Retrieved from https://cwiki.apache.org/confluence/display/Hive/Home

Apache Mahout. (2014). What is Apache Mahout ? Retrieved from https://mahout.apache.org/

ARMA International.(2015). The generally accepted recordkeeping principles. Retrieved from http://www.arma.org/r2/generally-accepted-br-recordkeeping-principles

Bahjat El-Darwiche, B.,  Koch,V.,  Meer, D. Shehadi, R., & Tohme, W. (2014). Big data maturity: An action plan for policymakers and executives. The Global Information Technology Report, World Economic Forum, 43-51.

Barnard, K., & Avery, A. (2011). Basel III v Dodd-Frank : what does it mean for US banks. Retrieved from http://whoswholegal.com/news/features/article/28829/basel-iii-v-dodd-frank-does-mean-us-banks/

 

Basel Committee on Banking Supervision. (2013). Principles for effective risk data aggregation and risk reporting. Bank for International Settlements.

 

Bedi, P., Jindal, V., & Gautam, A. (2014). Beginning with big data simplified. 2014 International Conference on Data Mining and Intelligent Computing (ICDMIC), 1-7.

Bohlouli, M., Schulz, F.,  Angelis, L.,  & Pahor, D. (2013). Towards an integrated platform for Big Data analytics. In Bohlouli, M., Schulz, F., Angelis, L.,  PAhor, D., Brandic, I., Atlan, D., & Tate, R. (Eds.), Integration of practice-oriented Knowledge Technology: Trends and prospectives (pp. 48-55). Berlin: Springer Berlin Heidelberg.

Borthakur, D. (2012). The Hadoop Distributed File System :  architecture and design. Retrieved from http://hadoop.apache.org/docs/r0.18.0/hdfs_design.pdf   

Brammertz, W. (2012). The office of Financial Research and Operational Risk. In V. Lemieux (Eds.), Financial Analysis and risk management: data governance, analytics and life cycle management (pp. 47-73). Frankfurt: Springer Berlin Heidelberg.

Buhl,  HU.,   Röglinger, M.,  Moser, F., & Heidemann J. (2013).  Big Data : A Fashionable Topic with(out) Sustainable Relevance for Research and Practice? Business & Information Systems Engineering, 5(2), 65-69.

Chapple, M.(2013). Speaking the same language: building a data governance program for institutional impact. EDUCAUSE Review, 48(6), 14-27.

Chen, M.,  Mao,S., & Liu, Y. (2014). Big data: a survey. Mobile Networks and applications, 19(2), 171-209.

Cheong, L.,K., & Chang, V.(2007). The need for data governance : a case study. 18th Australasian Conference on Information Systems, 999-1008.

Chrissis, M. B., Konrad, M.,  & Shrum, S. (2003). CMMI Guidelines for Process Integration and Product Improvement. Addison-Wesley Longman Publishing Co.

Chukwa. (2015). Chukwa: a large-scale monitoring system. Retrieved from http://wiki.apache.org/hadoop/Chukwa?action=AttachFile&do=view&target=chukwa_cca08.pdf   

Cloudera. (2014). Flume Cookbook. Retrieved from http://archive.cloudera.com/cdh/3/flume/Cookbook/index.html#_introduction

Curley, M. (2008). Introducing an IT capability maturity framework. Enterprise Information systems: lecture notes in Business Information processing, 12, 63-78.

Datskovsky, G. (2010). Information Governance. In Lamm J.  , Blount S., Boston S., Camm M., Cirabisi R., E. Cooper N., Fox C., V. Handal K., E. McCracken W., Meyer J.,  Scheil H., Srulowitz A., & Zanella R. (Eds),  Under Control (157-181). Apress.

De Abreu Faria, F., Macada, AC.G., Kumar, K. (2013) . Information governance in the banking industry.  46th Hawaii International Conference on System Sciences (HICSS), 4436-4445.

De Haes, S., Van Grembergen, W.(2005). IT Governance structures, processes and relational mechanisms: achieving IT/business alignment in a major Belgian financial group. Proceedings of the 38th Hawaii International Conference on System Sciences, 1-10.

Demchenko, Y., de Laat, C., Membrey, P.(2014). Defining architecture components of the Big Data Ecosystem. 2014 International Conference on Collaboration Technologies and Systems (CTS),104-112.

Dyché, J.(2011). A data governance primer. Baselinemag. 28-29.

Ebner, K., Buhnen, T., & Urbach, N.(2014).Think Big with Big Data: Identifying Suitable Big Data Strategies in Corporate Environments. 47th Hawaii International Conference on System Sciences (HICSS), 3748-3757.

Esmaili, H., B., Gardesh, H.,Shadrokh Sikari, S.(2010). Strategic alignment: ITIL perspective. 2nd International Conference on Computer Technology and Development (ICCTD 2010), 550-555.

Facebook. (2008). Scribe makes its open source debut. Retrieved from https://www.facebook.com/notes/facebook/scribe-makes-its-open-source-debut/35548642130

Fernandes, L., O’Connor, M. (2009). Data governance and data stewardship – Critical issues in the move towards EHRs and HIE. Journal of AHIMA (American Health Information Management Association), 80(5), 9-36.

Finance Lab. (2014). Persoonlijke benadering klanten via big data bij ING. Retrieved from http://financelabblog.wordpress.com/2014/03/10/persoonlijke-benadering-klanten-via-big-data-bij-ing/

Financial Stability Board and the International Monetary Fund. (2009) . The financial crisis and information gaps: report to the G-20 finance ministers and central bank governors. Retrieved from  http://www.financialstabilityboard.org/publications/r_091107e.pdf

Flood, M., Mendelowitz, A., & Nichols, B. (2012). Monitoring Financial stability in a complex world. In V. Lemieux (Ed.), Financial Analysis and risk management: data governance, analytics and life cycle management (pp. 15-47). Frankfurt: Springer Berlin Heidelberg.

Georges, G., Haas, M., & Pentland, A. (2014). Big data and management. Academy of Management Journal, 52(2), 321-326.

Ghemawat, S., Gobioff, H., & Leung, S-T. (2003). The Google File System. Proceedings of the nineteenth ACM Symposium on Operating Systems Principles, 29-.

Griffin, J.(2010a). Four critical principles of data governance success. Information Management Journal, 29-30.

Griffin, J.(2010b). Implementing a data governance initiative. Information Management Journal, 27-28.

Griffin, J.(2005). Data governance: a strategy for success, part 2. DM Review, 15(8), 15-.

Griffin, J.(2008). Data governance: the key to enterprise data management. DM Review, 27-.

Hagmann, J.(2013). Information governance- beyond the buzz. Records Management.

Hansmann, T., & Niemeyer, P.(2014). Big Data - Characterizing an Emerging Research Field Using Topic Models. IEEE/WIC/ACM International Joint Conferences on  Web Intelligence (WI) and Intelligent Agent Technologies (IAT), 1, 43-51.

Harris, J. (2012). Data Governance Frameworks are like Jigsaw Puzzles. Retrieved from http://www.ocdqblog.com/home/data-governance-frameworks-are-like-jigsaw-puzzles.html?rq=Scott%20Berkun

Hay, J. (2014). Data governance gamification. Business Intelligence Journal, 19(1), 30-35.

Heier, H., Borgman, H.P., & Mileos, C. (2009). Examining the Relationship between IT Governance Software, Processes, and Business Value: A Quantitative Research Approach. Proceedings of the 42nd Hawaii International Conference on System Sciences, 1-11.

Henserson, J.C, & Venatraman, N. (1993). Strategic alignment : leveraging Information Technology for transforming organizations. IBM Systems Journal,  32(1), 472-484.

Hu, H., Wen, Y., Chua, T-S., Li,X. (2014). Toward Scalable Systems for Big Data Analytics: A Technology Tutorial. Access, IEEE, 2, 652-687.

Humphrey, W.S. (1988). Characterizing the software process: a maturity framework. Software, IEEE, 5(2), 73-79.

IBM (2014). The 5 game changing big data use cases. Retrieved from http://www-01.ibm.com/software/data/bigdata/use-cases.html

IBM. (2007). Building a roadmap for effective data governance. IBM Data Governance Council Maturity Model.

IBM. (2014) Information Governance Principles and practices for Big Data landscape. Retrieved from http://www.redbooks.ibm.com/abstracts/sg248165.html?Open

Isaca. (2012). COBIT 5. Retrieved from  http://www.isaca.org/chapters2/New-York-Metropolitan/membership/Documents/2012-04-30%20Spring%20Conference-Meeting/3%20Barnier%20VBA%20COBIT5.pdf

Katal, A., Wazid, M., & Goudar, R.H.(2013).Big data: Issues, challenges, tools and Good practices. Sixth International Conference on Contemporary Computing (IC3), 404-409.

Khatri, V., & V. Brown, C. (2010). Designing Data Governance. Communications of the ACM, 53(1), 148.

Kindler, T. (2013). The road to Basel III: how financial institutions can meet new data-management challenges. USA : Teradata Corporation.

 

Krishnan, K.(2013). Data warehousing in the age of big data. Chicago, Illinois: Morgan Kaufmann.

Kuruzovich, J., Bassellier, G., & Sambamurthy, V. (2012). IT Governance Processes and IT Alignment: Viewpoints from the Board of Directors. 45th Hawaii International Conference on System Science (HICSS), 5043-5052.

Ladley, J. (2012). Data Governance : How to Design, Deploy, and Sustain an Effective Data Governance Program. USA : Elsevier.

Lahrmann, G., Marx, F., Winter, R., & Wortmann, F. (2011). Business Intelligence Maturity: Development and Evaluation of a Theoretical Model. System Sciences (HICSS), 44th Hawaii International Conference on System Sciences (HICSS),1-10.

Lemieux, V. (2012). Financial Analysis and Risk Management: Data Governance, Analytics and Life Cycle Management. Frankfurt: Springer Berlin Heidelberg.

Lewis, E., Millar, G. (2009). The Viable Governance Model - A Theoretical Model for the Governance of IT. 42nd Hawaii International Conference on System Sciences, 1-10.

Lucas, A. (2011). Corporate Data Quality Management: Towards a Meta-Framework. International Conference on Management and Service Science (MASS), 1-6.

Maes, R.(1999). A Generic Framework for Information Management. Primavera Working Paper.

McGilvray, D.(2007). Data governance: a necessity in an integrated information world. DM Review, 16(12), 25-30.

McKinsey (2014). Presentation: Big Data and advanced analytics: 16 use cases. Retrieved from http://mckinseyonmarketingandsales.com/presentation-big-data-and-advanced-analytics-16-use-cases

Mohanty, S., Jagadeesh, M., & Srivatsa, H. (2013). Big Data Imperatives: Enterprise Big Data Warehouse, BI Implementations and Analytics (1st ed.). CA, USA: Apress, Berkely.

Morabito, V. (2014). Trends and challenges in digital business innovation. Switzerland: Springer International Publishing Switzerland.

Mosley, M. (2008). DAMA-DMBOK Functional Framework Version 3. Retrieved from http://www.dama.org/files/public/dama-dmbok_functional_framework_v3_02_20080910.pdf

Nassiri R., Ghayekhloo, S., & Shabgahi, G.L. (2009). A novel approach for IT governance : a practitioner view. International Conference on Computer Technology and Development, 217-221.

O’Regan, G. (2011). Introduction to software process improvement. London: Springer-Verlag Limited.

Ohata, M., & Kumar, A. (2012). Big Data : A boon to business intelligence. Financial Executive, 28(7), 63.

Otto, B. (2011). Data Governance. Business & Information Systems Engineering, 3(4), 241-.

Paulk, M.,C. (2009). A history of the capability maturity model for software. ASQ Software Quality Professional,  12(1), 5-19.

Paulk, M.,C., Curtis, B., Chrissis, M.,B., & Weber, C. (1993). Capability maturity model for software ver. 1.1. Software Engineering Institute CMU/SEI ‘93-TR.

Ploder, C., & Fink, K. (2008). Decision Support Framework for the implementation of IT-Governance. Proceedings of the 41st Hawaii International Conference on System Sciences, 1-10.

Rajpurohit, A.(2013).Big data for business managers — Bridging the gap between potential and value. IEEE International Conference on Big Data, 29-31.

Ribbers, P.M.A., Peterson, R.R., & Parker, M.M. (2002). Proceedings of the 35th Hawaii International Conference on System Sciences,1-12.

Simonsson, M.,& Ekstedt, M. (2006). Getting the priorities right: literature vs practice on IT governance. PICMET 2006 Proceedings, 18-26.

Skinner, T., H. (2015). Does Basel III apply to the community bank ? USA: SAS Institute.

 

Soares, S.(2011). Selling Information Governance to the Business. MC Press, Ketchum, ID.

Sucha, M. (2014). Beyond the hype: Data management and data governance. Feliciter (Canadian Library Association), 60(2), 26-29.

Tallon, P.P. (2013). Corporate Governance of Big Data: Perspectives on Value, Risk, and Cost.  Computer , 46(6), 32-38.

Tamasauska, D.,  Liutvinavicius, M.,  Sakalauskas, V., & Kriksciuniene, D. (2013). Research of conventional data mining tools for Big Data handling in finance institutions. Business Information Processing, 160, 35-46.

Team, S. C. P. (2010). CMMI for Development v1. 3. Lulu. com.

Tekiner, F., & Keane, J.A.(2013). Big Data Framework. IEEE International Conference on  Systems, Man, and Cybernetics (SMC), 1494-1499.

Thamir, A., & Theodoulidis, B. (2013). Business intelligence maturity models: information management perspective. Communications in Computer and Information Science, 403, 198-221.

Todd, G. (2008). Data Governance: the enabler of high performance. DM Review, 18(5), 30.

TOGAF. (2015). Phase C: Information Systems Architectures - Data Architecture. Retrieved from http://pubs.opengroup.org/architecture/togaf8-doc/arch/chap08.html

U.S. Congress (2010). H.R.4173 - Dodd-Frank Wall Street Reform and Consumer Protection Act. Retrieved from https://www.congress.gov/bill/111th-congress/house-bill/4173?q=%7B%22search%22%3A%5B%22Dodd-Frank+wall+street+reform+and+consumer+protection+act%22%5D%7D

 

Van Grembergen, W., De Haes, S., & Guldentops, E. (2004). Structures, Processes and Relational Mechanisms for IT Governance. In W. Van Grembergen (Ed.), Strategies for Information Technology Governance (pp. 1-36). Hershey, PA: Idea Group Publishing.

Van Grembergen, W., De Haes, S., & Guldentops, E. (n.d). Structures, Processes and Relational Mechanisms for IT Governance: theories and practices. Universiteit Antwerpt Management School. Retrieved from http://www.antwerpmanagementschool.be/media/287503/IT%20Gov%20theories%20and%20practices.pdf

Van Grembergen, W., De Haes, S.(2009) Enterprise Governance of Information Technology. Springer. New York

Van Leemputten, P. (2014). KBC investeert half miljard euro in big data. Datanews. Retrieved from http://datanews.knack.be/ict/nieuws/kbc-investeert-half-miljard-euro-in-big-data/article-4000662817321.html

Vesset, D., Morris, H.D., Little, G., Borovick, L., Feldman, S., Eastwood, M., Woo, B., Villars, R.L., …, Yezhkova, N. (2012). Worldwide Big Data technology and services 2012-2015 forecast. IDC, 233485(1).

Waddington, D.(2008). Adoption of data governance by business. DM Review, 18(12), 32.

Webb, P., Pollard, C., & Ridley G. (2006). Attempting to define IT governance: wisdom or folly? Proceedings of the 39th Hawaii International Conference on System Sciences, 1-10.

Weber, C. V., Curtis, B., & Chrissis, M. B. (1994). The capability maturity model: Guidelines for improving the software process (Vol. 441). Reading, MA: Addison-Wesley.

Weber, K., Otto, B., & Osterle, H. (2009). One size does not fit all—a contingency approach to data governance. Journal of Data and Information Quality, 1(1), 4:2-4:27

Wielki, J.(2013).Implementation of the Big Data concept in organizations - possibilities, impediments and challenges. Federated Conference on  Computer Science and Information Systems, 985-989.

Zhang, J., Chen, Y., & Li, T. (2013).  Opportunities of innovation under challenges of big data. 10th International Conference on  Fuzzy Systems and Knowledge Discovery (FSKD), 669-673 

Download scriptie (1.99 MB)
Universiteit of Hogeschool
KU Leuven
Thesis jaar
2015