Een goede analyse van het antwoord is nodig om tot de juiste vraagstelling te komen. Niet te onderschatten en wanneer goed uitgevoerd, kostenbesparend.
Het tellen van feiten is het belangrijkste wat binnen een datawarehouse omgeving gebeurt. We doen dat om de vragen te beantwoorden die de gebruikers aan het datawarehouse willen stellen. De grootste vijand van het feit is "de mening". Die moeten we dan ook zoveel mogelijk buiten de deur houden. Meningen zijn dingen die je met informatie-eindproducten kan vermengen, eerder liever niet. In eerdere stadia van de evolutie van gegeven naar informatieitem zijn kwaliteit en consensus juist dingen die je met gegevens wilt mengen.
Als je begint met het maken van informatie weet je een beetje van de vraag en een beetje van de grondstof van het antwoord weet (brondata). Aan de vraagkant ken je (als het goed is) de hogere doelen van de organisatie. Op het moment van vaststellen van de precieze informatiebehoefte is er dus al een kader waarbinnen de vragen van "de business" zich kunnen bevinden. Om tot het beste resultaat te komen is de grootste variabele de 'vraag' zelf. We vragen ons dus af:
Als je begint met het maken van informatie weet je een beetje van de vraag en een beetje van de grondstof van het antwoord weet (brondata). Aan de vraagkant ken je (als het goed is) de hogere doelen van de organisatie. Op het moment van vaststellen van de precieze informatiebehoefte is er dus al een kader waarbinnen de vragen van "de business" zich kunnen bevinden. Om tot het beste resultaat te komen is de grootste variabele de 'vraag' zelf. We vragen ons dus af:
Hoe krijgen we de vraag precies goed zodat het antwoord past? (Hoe krijg je de feiten uit de meningen en de meningen uit de feiten?)
Het tellen van aantallen gevallen van Mexicaanse griep lijkt eenvoudig maar je kunt er nog een hoop vragen bij stellen. Zoals: tellen we de mensen bij wie het H1N1 virus is aangetroffen? Hoe controleren we of we die mensen maar eenmaal tellen? Als een persoon in verschillende ziekenhuizen wordt onderzocht bijvoorbeeld? Wordt er nog iets opgenomen over de ernst van de besmetting? Wordt ook gekeken naar dieren die de besmetting met hetzelfde virus hebben? Wat zouden we willen weten om de epidemie te gaan beheersen. Wetenschappers willen alles weten over de ideale situatie waarin het virus van de ene drager op de andere overgaat. De verzekeringsmaatschappij zal iets willen kunnen zeggen over het financiële risico dat gelopen wordt. De moeder van twee kinderen wil concrete antwoorden op gevalsniveau.
Het bepalen van de informatievraag is dus afhankelijk van factoren als
- Voor wie is de informatie bestemd;
- Welke kwaliteit moet het antwoord hebben;
- Wie het antwoord mag hebben, met andere woorden is het antwoord relevant binnen de strategische doelstellingen van de organisatie;
- Wat is het belang van de informatievrager;
Wanneer we dit kunstje goed beheersen is de grote verspilling die nu nog op vele plaatsen aan de gang is, te verminderen. Nog teveel gebeurt het dat informatie klanten vragen stellen die (net) niet goed beantwoord kunnen worden. Deels omdat ze zelf niet goed weten wat ze moeten vragen en deels omdat de vragen niet in lijn zijn met de koers die hoger management heeft uitgezet. Veel van die vragen worden met accepteren van de extra kosten toch opgepakt en beantwoord om de klant tevreden te houden.
In breder perspectief wordt de gegevens overload en het gelijktijdig informatietekort veroorzaakt door het onvoldoende belang wat gesteld wordt in het beheer en de beheersing van de informatiehuishouding op strategisch niveau. Dat gebrek aan aandacht heeft ook invloed op de grote andere oorzaak van verspilling: datakwaliteit. Daarover graag een andere keer meer.