BI Selvbetjening vs. Data Warehouse

 

Nye værktøjer til at analysere og visualisere virksomheders data på en intuitiv og forretningsorienteret facon kommer ud i disse år. Værktøjerne kommer med løfter om selvbetjening (self-service). Selvbetjening betyder, at dataanalyse kan foregå uden om centrale data warehouses og langsomme IT-afdelinger.

Vi ser nærmere på, hvordan de nye værktøjer adskiller sig fra at benytte et centralt data warehouse. Desuden guider vi til, hvordan du som leder bør forholde sig til denne nye udvikling.

Overordnet ser vi på tre løsningsmodeller for datavisualisering:

  1. Centraliseret adgang til data igennem et Data Warehouse. Det indebærer traditionelle kanaler stillet til rådighed af IT/BI-organisationen til visualiseringer og rapporter. Hermed sikres, at der er enighed om de tal, der bruges til visualiseringer og rapporter på tværs af organisationen. Det sikrer også, at produktionssystemer ikke belastes unødvendigt med dataforespørgsler.
  2. Selvbetjening uden en central BI organisation og uden et centralt data warehouse som grundlag for datavisualisering. Du tilgår data direkte i produktionssystemer og lignende gennem en ny generation af selvbetjeningsværktøjer med visualiseringer.
  3. Hybridløsning med både centralt data warehouse og selvbetjening – og begges fordele. Data-integriteten bibeholdes, produktionssystemerne belastes ikke unødigt (som man også undgår ved 1), og data kan stadig omsættes hurtigt (som man også opnår ved tilgang 2).

Og hvilken er så den rigtige for din virksomhed? Det afhænger af ambitionsniveau, kompetencer og budget. Her ser vi nærmere på de 3 forskellige metoder.

1. Centraliseret adgang - Klassisk Business Intelligence arkitektur

Den første tilgang til business intelligence er den klassiske tilgang. Her er et centralt Data Warehouse (DW) omdrejningspunktet for al databehandling. Trods forskellige ideer om, hvordan et DW skal opbygges, er formålet enkelt; at have et centralt depot for al relevant data. Data er struktureret på en måde, der giver mening for alle forskellige forretningsprocesser. Ydermere aflaster man produktionssystemerne, hvorfra data kommer.

Og nu bliver det lidt langhåret… Et Data Warehouse relaterer data fra forskellige systemer til hinanden. Man kan hive data fra eksterne kilder ind i sit DW for at berige det yderligere. De mest brugte arkitekturer medfører redundans i dataene, hvilket gør det hurtigt at sende forespørgsler i mod dit DW. Et DW får data fra produktionssystemerne gennem såkaldte ”Extract, Transform and Load” processor (ETL). ETL processer sikrer, at uanset hvilket system data kommer fra, så er det i en brugbar struktur i ens DW.

Når data er ETL processeret og relateret til hinanden, kan data deles op og præsenteres i såkaldte data marts. Data marts er data set for udvalgte områder af forretningen. HR-chefen vil fx ikke se antal spegepølser produceret på produktline 2, men det vil produktionschefen. Disse data marts kan så bruges af slutbrugeren til enten analyse, rapportering eller decideret data mining.

Her er en illustration af et simpelt Data Warehouse.

Figur 1 Simpelt Data Warehouse

Problemet med denne struktur opstår - som nævnt i begyndelsen - hvis en slutbruger pludselig ønsker en anden rapport eller nøgletal end eksisterende. Så kræver det nemlig involvering fra enten IT eller den centrale BI organisation. Hvis det samtidig er ny data, er det med garanti en større opgave at få tilkoblet datakilder, få det behandlet og relateret til resten af dataene - for til sidst at få det skubbet ud i brugervenlige rapporter.

Denne tilgang til business intelligence har længe været betragtet som ”best practice” fra et organisationsperspektiv.

Fordele:

  • Der er altid sikkerhed for, at produktionssystemer ikke forstyrres
  • Alle dele af forretningen kigger på tal, der er udregnet på samme måde
  • Der er altid én systemejer, der kan kontaktes med problemer

Ulemper:

  • Der kan gå lang tid fra behovet for en ny rapport eller udregning opstår, til at den leveres af den centrale organisation. Dette kan i visse tilfælde være uacceptabelt for forretningen
  • Det kan være dyrt at sætte gang i et stort business Intelligence projekt, og det kræver opbakning fra topledelsen og forankring dybere i organisationen for at kunne lykkedes

Den klassiske tilgang er en god løsning, når man skal have en business intelligence løsning, der skal bruges af mere end ét forretningsområde. Eller hvis man har systemer, der ikke kan tåle den ekstra belastning fra de forespørgsler, der sendes direkte mod produktionssystemerne.

Et DW er desuden skalérbart, hvis det skal udvides til flere afdelinger senere. Det er dog ikke en optimal løsning, hvis man har behov for fleksibilitet og nye udregninger og rapporter ofte. I organisationer med begrænsede Busines Intelligence ressourcer risikerer du lange ventetider på nye rapporter og kan opleve rapportering som en unødvendig langsommelig proces.

2. Selvbetjening - Komplet kontrol til slutbrugeren

De seneste år er moderne BI-værktøjer kommet på markedet, som i princippet gør det muligt at omgå Data Warehouse modellen. Disse værktøjer kaldes også selvbetjeningsværktøjer.

Her er det muligt at sende forespørgsler direkte mod produktionssystemer. Det gør det hurtigt at lave al nødvendig dataforarbejdning/ETL og producere rapporter på baggrund af flere datakilder, man selv har forbundet. Alt sammen i samme værktøj, som samtidig er tilgængeligt for alle, og altså ikke forbeholdt en IT eller BI organisation.

Ovenstående kan umiddelbart lyde for godt til at være sandt - og det er det måske også. Det kræver nemlig folk, der har kompetencer inden for SQL, DAX, SSIS eller lignende. Giver forkortelserne ikke mening? Så er det netop pointen - at du bør alliere dig med eksperter, som står for den tekniske implementering.

Mange selvbetjeningsværktøjer er dog interessante som afkoblede visualiseringsværktøjer. Altså som user interface. Dermed kan det benyttes oven på en eksisterende arkitektur, uden at værktøjet kommunikerer direkte med produktionssystemer eller benyttes til ETL.

Figur 2 Setup uden Data Warehouse

Fordele:

  • Du kommer i gang med Business Intelligence, uden at have et centralt data warehouse eller organisation til at styre business intelligence-indsatser
  • Du får hurtigt lavet nye rapporter og udregninger, som ellers havde taget lang tid at få igennem
  • Fungerer decentralt og er særligt velegnet, hvis der ikke er behov for Business Intelligence på tværs af afdelinger

Ulemper:

  • Produktionssystemerne kan blive uhensigtsmæssigt belastet og give nedetid
  • Udregninger lavet decentralt er ofte ikke lavet på samme måde i andre afdelinger, hvorfor der kan opstå mere end én ’virkelighed’ på tværs af organisationen
  • Selvom værktøjerne er lavet til slutbrugere’ kræver det stadig en forholdsvis høj teknisk kunnen

Ser man på fordelene og ulemperne er det klart, at ikke alle bør benytte denne tilgang til Business Intelligence. Selvbetjening er specielt velegnet til slutbrugere, der selv kan skrive SQL, og som har erfaring med at skrive forespørgsler, der ikke belaster produktionssystemer. Har I disse ressourcer, er det en god løsning.

3. Hybridløsning - En tosporet motorvej

Hvis organisationen allerede har et eksisterende data warehouse, er det stadig muligt at få beslutningskritiske rapporter hurtigere – og uden fare for inkonsistente data. Det kan foregå som en hybridløsning. Man lader medarbejdere med teknisk kompetence lave deres egne ad-hoc rapporter i selvbetjeningsværktøjer som i tilgang 2, mens det eksisterende DW kører som i tilgang 1.

Hvis det viser sig, at en selvbetjeningsrapport eller en beregningsmodel bliver brugt gentagne gange eller af forskellige afdelinger, kan man sende den igennem det almindelige DW workflow. Den proces indebærer, at alle udregninger bliver kvalitetstjekket af den centrale business intelligence organisation.

Figur 3 Data warehouse med Self-Service BI-værktøj

Selvom du kører med en hybridløsning med et selvbetjenings-fast track, skal du dog altid sikre dig, at produktionssystemerne ikke belastes og bliver sløve eller bryder sammen - som følge af uhensigtsmæssige forespørgsler mod disse. Det er derfor altid en god ide at alliere sig med de ansvarlige for disse systemer, inden du gør noget. De vil som regel også kunne fortælle, om særheder ved systemet. Det kunne fx være, at maskine 1 fysisk står i lagerhal A, men systemet skriver lagerhal B af historiske årsager. Desuden er langtfra alle produktionssystemer designet i dette årtusinde og kan være programmeret på en mindre hensigtsmæssig måde.

En hybridløsning kan kaldes en tosporet motorvej, hvor du opnår fordelene fra både tilgang 1 og 2. Ulemperne forsvinder ikke, men minimeres i kraft af kombinationen.

En hybridløsning kan være den bedste løsning til virksomheder, der:

  • kæmper med lang lead time på akutte rapporter til brug for forretningskritiske beslutninger
  • endnu ikke har et Business Intelligence setup
  • har behov for en skalérbar løsning, der kan rulles ud til endnu flere afdelinger
  • alene benytter sig af selvbetjeningsværktøjer, men oplever problemer med forstyrrelse af produktionssystemerne
  • der skal i gang med et Business Intelligence projekt og gerne vil være på forkant med udfordringer og få mest værdi ud af de nye værktøjer i samspil med et traditionelt Data Warehouse

Kan selvbetjening erstatte et data warehouse?

Ser man på ovenstående tre tilgange, er det klart at der ikke er én løsning, der er rigtig til alle virksomheder. Overvej disse 5 punkter:

  • Behov for business intelligence på tværs af afdelinger?
  • Behov for hastighed, når nye rapporter skal produceres?
  • Risikovillighed i forhold til belastning af produktionssystemer?
  • Adgang til teknisk kompetence?
  • Budgettet for en Business Intelligence løsning?

Dette indlæg er en del af Novicells business intelligence nyhedsbrev.

Tilmeld Novicells BI nyhedsbrev