Det rette analyseværktøj til dine databehov

I en tid hvor der udbydes en bred vifte af diverse softwareløsninger til dataanalyse kan det virke uoverskueligt at vælge et ud fra mængden. Det kan være svært at vide, hvor man skal starte, og hvilket værktøj, der passer virksomheden bedst. Det ønsker vi at gøre op med i dette blogindlæg. Så her kommer en oversigt over analyseværktøjer samt deres fordele og ulemper.

Vi vil skabe et overblik over den brede vifte af tilgængelige kvantitative analyseværktøjer, der findes i dag. Vi tager en diskussion om de værktøjer, der er mest populære på det danske marked. Til sidst beskriver vi deres styrker og svagheder, så du kan vælge den løsning, der passer på din virksomheds behov og prioriteringer. Vurderingen er lavet på baggrund af de forskellige værktøjers funktioner, men vil selvfølgelig også være baseret på en subjektiv vurdering, baseret på vores erfaringer med at arbejde med værktøjerne. Analyseværktøjerne vil blive vurderet ud fra følgende kriterier: brugervenlighed, analytiske kapabiliteter og pris.

Open Source versus kommerciel software

Hvilket værktøj, der fungerer bedst til netop din virksomhed, afhænger af følgende parametre.

Visionen for datakompetencer i virksomheden

For det første afhænger det af brugernes datakompetencer. Hvis I ønsker at analyseværktøjerne skal benyttes af så mange medarbejdere som muligt, så alle kan tage del i dataanalyse, er de kommercielle værktøjer mest passende. De har en høj brugervenlighed, og kræver ikke kompetencer indenfor kodning, men det er nemt at foretage analyser på egen hånd.

Hvis målet til gengæld er at få startet dataanalyse i virksomheden ved at prøve det af i en specialiseret afdeling, såsom Business Intelligence, så kan det være en fordel at benytte Open Source-software. Det har mange analytiske kapabiliteter, men er til gengæld også sværere at bruge for medarbejdere med begrænsede datakompetencer.

Pris

Desuden er open source selvfølgeligt gratis, hvilket mindsker risikoen, da det ikke kræver en investering i licenser og abonnementer. Dette element kan bruges, til at overbevise ledelsen om at have mere fokus på dataanalyse og business intelligence.

Kompleksiteten af analysebehov

For det andet afhænger det af hvilke former for analyser, der skal foretages af brugerne. Er der behov for meget specifikke og avancerede analyser, er det vigtigt at undersøge, om det er muligt i de forskellige analyseværktøjer, før man foretager investeringen. Til sidst er det også vigtigt at afveje, om man ønsker at betale for professionel support. Alternativet er en løsning, som kræver investering i træning, og medarbejdere, der er dygtige til at løse udfordringer på egen hånd med hjælp fra eksempelvis netværk og forskellige online forums.

Oversigt over værktøjer

Inden vi kaster os ud i beskrivelsen af de konkrete redskaber, ønsker vi først at afgrænse emnet en smule. Vi ser bort fra redskaber som Tableau, PowerBI og Qlik da det i vores optik er datavisualiseringsredskaber, som typisk kan benyttes i kombination med de nedenstående værktøjer.

Open Source:

R

R er et statistisk sprog som har oplevet meget popularitet i de sidste år. Med det stærke udviklingsmiljø RStudio samt brede udvalg af brugerudviklede funktionspakker, har R vundet en plads på mange akademiske og erhvervsmæssige arbejdspladser. Grundet R’s store open source community er sproget konstant up-to-date med de nyeste analysemetoder og kan benyttes til at udarbejde selv de mest avancerede statistiske analyser. Sproget har dog en stejl læringskurve, da dens syntax ikke giver plads til fejl. Med syntax mener vi det regelsæt, som udviklingssproget godtager som retmæssig struktur. Eksempelvis er R følsom overfor store og små bogstaver hvilket kan skabe problemer.

Der eksisterer heldigvis mange online kurser til at hjælpe en i gang med at benytte R. Derudover gør det store community, at der stort set findes svar på alle spørgsmål på de forskellige forums. Sidst, men ikke mindst er sproget gratis at benytte.

Python

Python er et objektorienteret programmeringssprog, der har oplevet høj vækst indenfor data science i løbet af de sidste år grundet introduktionen af dataanalysebiblioteket Pandas. Ligesom R, understøtter Python også de mest komplekse former for statistiske analysemetoder og har et stort og aktivt community af brugere. Desværre betaler Python også prisen for dens stærke analytiske kapabiliteter ved en stejl læringskurve. Python anvendes typisk af personer med en baggrund indenfor computer science hvorimod R’s brugere ofte har en baggrund indenfor økonomi.

Kommerciel software:

SAS

SAS har længe været markedsleder indenfor kommercielle analyseredskaber. Programmet udbyder en bred vifte af forskellige statistiske funktioner samt en brugervenligt grafisk brugerflade i form af SAS JMP, der hjælpe læringsprocessen. SAS institute udbyder også stærkt teknisk support, hvis der opleves problemer eller spørgsmål til softwaren. Desværre er programmet dyrt at benytte og er ikke altid fuldt opdateret med de nyeste analysemetoder på markedet.

Stata

Stata er et populært statistikprogram indenfor den akademiske verden da den kombinerer et drag and drop interface med en stærk intuitiv kommando syntax, der gør Stata brugervenligt. Stata er udviklet og understøttes af Statacorp som har fokus på at holde programmet opdateret, og som også ligger vægt på support.

SPSS

SPSS understøtter en lang række statistiske værktøjer og henvender sig både til begyndere, men har også mere avancerede funktioner som machine learning og tekstanalyse til mere garvede analytikere. SPSS fungerer især godt med cross-sectional data, og er derfor oplagt til statistiske test indenfor det område. Programmet er point-and-click inspireret, hvilket øger brugervenligheden og gør det nemt at gå til. Derudover er SPSS god til datahåndtering og grafiske fremstillinger. SPSS er i dag ejet af IBM, hvilket sikrer en professionel support, men som også gør at softwaren er dyr. 

Excel

Excel er måske det mest klassiske program og har i mange år været foretrukket i mange virksomheder. Succesen er opnået da Excel er ekstremt brugervenligt, men det mangler til gengæld nogle analytiske kapabiliteter. Excel er et regnearksprogram der gør det nemt at håndtere data og foretage hurtige udregninger. Det er muligt at foretage statistisk analyse, men Excel halter desværre markant bag de andre analyseredskaber, når det kommer til håndteringen af større dataset. Det er blandt andet fordi udregninger på større datamængder kan resultere i lange query times og systemnedbrud.

Når det så er sagt, har Excel en stærk synergieffekt sammen med mange andre programmer fra Microsoft såsom Power Pivot, Power View, Visual Basic for Applications og Power BI der kan muliggøre nogle af de samme funktioner.