| Wat is Data Warehousing? |
|
|
| ma 19 okt 2009 | |
|
Data Warehousing is het onderbrengen van allerlei soorten data in één systeem, zodat het beter mogelijk is te analyseren en rapporteren over allerlei aanwezige kennis binnen de organisatie. Data Warehousing is als het op één hoop gooien van de kaartenbak met klanten, het kasboek en het voorraadbeheer in het magazijn waardoor een bedrijf de boel beter kan evalueren. Of, iets technischer gezegd: ‘Data Warehousing is een onderwerpgeörienteerde, geïntegreerde, tijdsafhankelijke gegevensverzameling met als doel het maken van management informatie.’ Die definitie is van Bill Inmon, veelal beschouwd als een van de grondleggers van Data Warehousing met zijn boek ‘Building the Data Warehouse’ in 1991. Tot een goed functionerend Data Warehouse komen is niet altijd even gemakkelijk. Zowel in het ontwerp, de architectuur, de projectuitvoering als de exploitatie van een data warehouse loopt Data Warehousing risico’s. ICT-ers, directie, de financiële afdeling en andere afdelingen hebben elk hun eigen belangen en doelen, waardoor zelfs het vaststellen van exacte personele kosten tot ellenlange discussies kunnen leiden. Het zijn echter wel noodzakelijke discussies, want anders blijven er meerdere definities naast elkaar bestaan, met invoering van verschillende data, op verschillende manieren, met verschillende (waarschijnlijk onjuiste) uitkomsten. Samenwerking van IT en Business is dus ook bij dit tamelijk technisch ogend onderwerp zowel noodzaak als struikelblok. Zoals zo vaak. En daar komt nog eens bij dat Data Warehousing zelfs bij kleine vragen al om heldere afspraken schreeuwt: spreken we over ‘M/V’ of ‘Man/Vrouw’? Kortom: een Data Warehouse vraagt om een sterk ontwerp en een goede architectuur. Door alle informatie top-down in kaart te brengen, kom je tot een helder beeld van alle informatie. Maar juist om zo’n omvangrijk ontwerp te voorkomen – want dan is de eerste stap al een nachtmerrie – pleiten velen ervoor om met kleinere Data Marts te beginnen. Een fraaie ‘bottom-up’ benadering die ook zijn eigen fanatieke aanhang heeft. Al lijken er goede vooruitzichten te zijn voor een meer integrale benadering waarbij de voordelen van beide benaderingen worden benut. Op de markt van Data Warehousing komen al snel de bekende namen voorbij: Oracle, IBM en ook Microsoft. Het sterk gespecialiceerde Teradata heeft echter een aardige voorsprong op deze IT-giganten. Het is een markt waarin het niet langer draait om wie het grootste datawarehouse kan leveren, maar de beste oplossing op maat. Waarbij Data Warehouses door grote organisaties als onmisbaar worden beschouwd en steeds meer bedrijven kiezen voor een vorm van Data Warehousing, al was het maar om enigszins grip te houden op de nog altijd sterk groeiende stroom van informatie en andere data in bedrijven. Overigens een leuk weetje: een Data Warehouse kan aardig uit zijn voegen groeien. Het Amerikaanse supermarktconcern Wall Mart schijnt een Data Warehouse te hebben van 500TB. Dat zijn heel wat kassabonnetjes bij elkaar… Door: Marc Janssen |