Van Business Intelligence naar Data Science

691283Organisaties die al jaren ervaring hebben met de inzet van datawarehouses en Business Intelligence gaan steeds vaker Data Science-toepassingen ontwikkelen. Dat is logisch, want data heeft een impact op iedere organisatie; van retailer, reisorganisatie en financiële instelling tot ziekenhuis. Er wordt zelfs beweerd dat we momenteel in een vierde industriële revolutie zijn aanbeland, waarbij data als productiefactor is toegevoegd aan het lijstje mensen, kapitaal en grondstoffen. Hoe verhouden BI en Data Science zich tot elkaar en op welke manier maak je als BI-organisatie de stap naar Data Science-toepassingen?


Algoritmes en Data
Big Data is in een aantal jaar razendsnel opgekomen. Inmiddels zijn we van de Big Data-hype terechtgekomen in een tijd waarin het juist gaat over het voorspellen, de tijd van Data Science, waarin machine learning, artificial intelligence en deep learning een steeds grotere rol spelen. We komen terecht in een wereld waarin singularity, het moment waarop systemen intelligenter zijn dan de mens, steeds dichterbij komt. Of we dit punt ooit zullen bereiken weet niemand, wat er zal gebeuren op dat moment is nog onzekerder. Maar wat wel een feit is, is dat de wereld om ons heen steeds meer gedomineerd wordt door algoritmes en data. 
Hadoop heeft met zijn andere manier om data op te slaan en doorzoekbaar te maken een cruciale rol gespeeld in de Big Data-revolutie. Door de toegenomen rekenkracht en de afgenomen kosten van opslagcapaciteit is het tegenwoordig mogelijk om vrijwel onbeperkte hoeveelheden data op te slaan en beschikbaar te maken, waardoor data en technologie steeds minder een belemmering zijn voor innovatie.

Data en Technologie
Innoveren met data draait vanzelfsprekend om data en om technologie, maar deze komen steeds meer en gemakkelijker beschikbaar. Denk aan bijvoorbeeld de opkomst van open source technologie, waardoor je de technologie kan zoeken bij de toepassing. Dit was vroeger wel anders, toen waren het de grote organisaties die zich een licentie op dure software konden veroorloven om concurrentievoordeel mee op te bouwen. Open source is natuurlijk niet gratis, maar de kosten groeien lineair naarmate je een technologie meer gebruikt en niet zoals bij licensed producten, exponentieel.

Verdwijnt Business Intelligence?
Zowel Business Intelligence als Data Science draaien om slim gebruik van data. Business intelligence zorgt voor rapportages, zoals financiële rapporten, die een accuraat beeld schetsen van wat er heeft plaatsgevonden. Bij Data Science draait het om vooruitkijken met het vergroten van bedrijfswaarde als doel. Vanwege het experimentele karakter van Data Science hoeven uitkomsten niet altijd raak te zijn.  
In de praktijk dragen dashboards, visualisaties en rapporten vaak bij aan de bewustwording over de waarde van data. Het is niet ongebruikelijk dat een directie een visie en strategie gericht op datagedreven toepassingen gaat ontwikkelen op basis van datavisualisaties en dashboards. 

Voldoen bestaande organisatiestructuren nog wel?
Organisaties die aan de slag gaan met datagedreven toepassingen doen er goed aan hun organisatie eens goed onder de loep te nemen. Innoveren draait niet om het schrijven van een Project Initiation Document (oftewel PID), maar om het simpelweg starten. Projectresultaten leiden niet altijd tot een valide business case, bij innovatie hoort ook falen. Kijk naar Google, toch een van de meest succesvolle organisaties wat betreft datatoepassingen, daar falen ook veel projecten. Het is zaak om te experimenteren en in korte iteraties te bepalen of je verder gaat of niet. Fail fast!

Innoveren als een startup
Waar Google, Microsoft en Apple de technologie zelf ontwikkelden in hun garage, zijn het nu startups die vaak starten met behulp van state-of-the art technologie die beschikbaar is als open source product. Studenten leren op de universiteit te werken met open source, technologie die ze ook thuis kunnen gebruiken. Organisaties die talent willen aantrekken zullen ook open source moeten adopteren om interessant te blijven als werkgever.
Het nadeel van bestaande organisaties is dat de werkwijze zich vaak niet goed leent voor innovatie. Bij een online retailer werd een afdeling verantwoordelijk voor conversie. Vol enthousiasme ging de afdeling ‘Conversie’ aan de slag met het ontwikkelen van productaanbevelingen. Al vrij snel bleek het succes van de afdeling afhankelijk te zijn van de prestaties van andere afdelingen die andere targets nastreefden. De inkoper kocht volgens eigen KPI’s producten in en de marketeer bepaalde op zijn eigen manier de prijzen. De engineers en front-end developers bepaalden op basis van eigen testen de gebruikerservaring. Door de afhankelijkheid van andere afdelingen en conflicterende doelen per afdeling had de afdeling ‘Conversie’ dus feitelijk geen controle over zijn eigen succes.

De enige manier om deze kloof te slechten is door te gaan werken in multidisciplinaire teams, die verantwoordelijk zijn voor features en niet voor processen. Deze teams kennen een heel andere dynamiek doordat verschillende disciplines samenwerken en samen dezelfde verantwoordelijkheid dragen, zoals bijvoorbeeld conversie. Startups hebben het wat dat betreft gemakkelijk, zij hebben geen bestaande organisatie, zij beginnen met het aantrekken van de juiste mensen en bouwen de skills gaandeweg op. Waar vroeger de systemen het kostbaarst waren, zijn het tegenwoordig de mensen die van de grootste waarde zijn.

De rol van de Data Scientist
Data Science heeft een centrale rol in teams die zich richten op innovatie en de ontwikkeling van datagedreven producten. Data Science is hiermee echt een businessafdeling en zeker geen ondersteunende afdeling die voor de business werkt. Een Data Scientist heeft over het algemeen ook een ander profiel dan een BI-specialist.
Een Data Scientist is een soort van schaap met vijf poten. Een Data Scientist beschikt over het algemeen over een statistische achtergrond, heeft kennis van machine learning en bouwt naast modellen ook applicaties. Daarnaast is een Data Scientist communicatief vaardig en van nature nieuwsgierig, waardoor hij graag experimenteert en onderzoekt. Josh Wills, destijds verantwoordelijk voor Data Science bij Cloudera omschreef het als volgt: “Een Data Scientist is iemand die beter is in statistiek dan een software engineer en beter in software engineering dan een statisticus”. 

Van BI naar Data Scientist
Veel datawarehouse- en Business Intelligence-specialisten hebben programmeerervaring en zouden de stap naar Data Science kunnen zetten door zich bijvoorbeeld te verdiepen in Python en R en statistiek. Het helpt ook als organisaties functies creëren voor Data Scientists, niet alleen zodat externe consultancy-organisaties kennis kunnen overdragen maar ook zodat het voor bestaande medewerkers eenvoudiger wordt om door te groeien. Zodra organisaties de waarde erkennen van Data Science zal duidelijk worden dat het de mensen zijn die het verschil maken in de razendsnelle ontwikkeling van datatoepassingen en technologische innovatie.

Bron: biplatform.nl