En væsentlig pointe ved brug af regneark er, at de foruden brug for indtastning af rådata er egnede til i samme dataark at tilføje afledte variable (afledte variable er felter, som indeholder værdier, der er beregnet på baggrund af andre værdier i regnearket) og at aggregere data til analyse med fx et seriediagram. Aggregering betyder at man regner på grupperede data, fx samlet antal patienter i en uge.

I dette afsnit kan du læse om:

Beregning af afledte variable i regneark
Afledte variable i regneark er kolonner (felter), som indeholder værdier, der er beregnet på baggrund af andre værdier i regnearket. I regnearket ovenfor er datoen for første dag (mandag) i ugen beregnet i kolonne E på baggrund af datoen i kolonne A, E2 =A2-WEEKDAY(A2;2)+1. Formlen tager datoen i A2, fratrækker dagens nummer i ugen (WEEKDAY(A2;2)) og lægger en til (+1).

Fidusen ved at skrive den eksakte dato i A-kolonnen i stedet for blot at skrive ugenummeret er, at det altid er muligt at omregne fra en eksakt dato til hvilket som helst tidsinterval, man kunne få behov for, men aldrig omvendt. Det ville fx være relevant også at udregne måneden for hver dato til månedlig aggregering af antallet af nyopståede tryksår. Dem er der jo i eksemplet heldigvis så få af, at det ikke giver mening at tælle dem sammen på ugebasis. Har man først reduceret informationen ved kun at skrive ugenummeret, mister man muligheden for senere at lave andre opgørelser af data. Uden at det koster noget som helst ekstraarbejde, opnår man således en større fleksibilitet ved at registrere rådata så præcist som muligt.

Tabellen nedenfor giver eksempler på nyttige funktioner til beregning af afledte variable (Tabel 29).

Bemærk, at alle formlerne i tabellen benytter relative cellereferencer. Man bør altid overveje, hvornår det er hensigtsmæssigt at benytte absolutte referencer og, i så fald, om man skal låse både kolonne- og rækkereferencen.

Dataaggregering i regneark
Når rådata er indtastet og eventuelle afledte variable er tilføjet til dataarket, er det let at aggregere data til analyse med fx et seriediagram.

Aggregering betyder, at man regner på grupperede data. I tryksårseksemplet skal man således for hver uge summere det totale antal patienter og antallet af tjekkede patienter. De to tal kan herefter indgå som tæller og nævner i indikatoren.

De fleste regneark indeholder en smart facilitet, pivottabel, som gør aggregering til en leg. Pivottabeller kan se forskellige ud, og terminologien og brugerfladen varierer mellem forskellige regneark, især mellem forskellige versioner af Excel. Men funktionaliteten er grundlæggende ens. Her gennemgås et eksempel med LibreOffice version 3.3, hvor funktionen kaldes DataPilot.

De følgende skærmbilleder viser eksemplet (Figur 50-55), hvor data fra tryksårsopgørelsen aggregeres efter en uge.

 

Fordi pivottabeller findes i så mange forskellige udformninger, er det ikke muligt meningsfuldt at give en detaljeret peg-og-klik-gennemgang af konstruktionen af en pivottabel. Det væsentlige er at forstå pivottabellen ”anatomi og fysiologi”.

En pivottabel har ét dataområde og tre dimensioner (rækker (row), kolonner (column), sider (page)), som kan bruges til at gruppere de aggregerede data.

Data aggregeres ved at trække de relevante datafelter ind i dataområdet i midten og vælge den eller de relevante aggregatfunktioner, fx sum, antal eller gennemsnit. Som udgangspunkt vælger regnearket ofte sumfunktionen, hvilket ofte er det korrekte valg.

Data grupperes ved at tilføje feltet med grupperingsvariablen, fx uge eller måned til rækkeområdet. Har man behov for det, kan man gruppere i flere dimensioner ved at tilføje flere grupperingsvariable til kolonne og/eller sideområdet. Man kan endda gruppere på flere niveauer i samme dimension. Til vores formål har vi sjældent brug for at gruppere på mere end et niveau i en dimension.

Endelig kan man slå en række faciliteter til og fra. Fx er det som regel en god ide at slå række- og kolonnetotaler fra.

Har man valgt mere end ét datafelt, vil pivottabellen ofte have et ”stablet” layout, som vi ikke kan bruge til ret meget. Det kan dog let rettes. I LibreOffice og Excel trækker man den grå kasse med overskriften ”Data” hen i det tomme felt over kolonnen med de aggregerede tal.

Generelt kan pivottabeller være forvirrende at arbejde med i begyndelsen, bl.a. fordi, de er så fleksible og dynamiske. Men når det først, man har ”knækket koden”, er der næsten ingen ende på, hvor nyttige de kan blive.

Seriediagram med regneark
De aggregerede data kan nu benyttes som grundlag for et seriediagram. Har man de aggregerede data i en pivottabel, er det ofte en god ide at kopiere indholdet til et tomt faneblad og lave sit diagram der.

Skærmbilledet (Figur 55) viser fanebladet med kolonne A, B og C, som er kopieret fra pivottabellen. Der er oprettet to afledte variable, andel tjekkede patienter i kolonne D og median i kolonne E. Andelen er udregnet ved at dividere C med B, fx D2=C2/B2, og kopiere formlen til alle felterne i D2:D25. Medianen udregnes som medianen af alle raterne i kolonne D, fx E2=MEDIAN(D$2:D$25). Bemærk, at denne formel, ved hjælp af dollartegn, indeholder en statisk reference til D$2:D$25. På denne måde undgår man, at referencen rykker, når formlen kopieres ned i de øvrige felter i kolonnen.

Seriediagrammet er tegnet ved at markere kolonnerne A, D og E, indsætte diagram, vælge kurvediagram med kolonne A som etiketter på x-aksen og D og E som kurver. Herefter er diagrammets udseende tilpasset, så medianen fremstår som en ret linje uden punktmarkører, y-aksen er formateret, så indikatoren præsenteres som procent, og der er tilføjet passende titler til diagram og akser.