Gennemsnittet er datasættets tyngdepunkt. Læg alle værdier sammen og del med antallet af værdier. Da hver observation tæller lige meget, kan en enkelt meget høj eller lav værdi trække gennemsnittet markant.
Medianen er det midterste tal, når dataene er sorteret fra lavest til højest. Ved ulige antal observationer er det tallet midt i rækken; ved lige antal er det gennemsnittet af de to midterste. Ekstreme værdier har næsten ingen indflydelse på medianen.
Brug det til symmetriske data uden ekstreme outliers – for eksempel karaktergennemsnit i en klasse eller gennemsnitlig juli-temperatur.
Tag den ved skæve fordelinger med få ekstreme værdier, som boligpriser, lønstatistikker med milliardærer eller dagligt web-trafik, der kan få pludselige spikes.
En lærer beregner typisk højde i klassen: gennemsnittet er fint, da højder varierer moderat.
En reporter, der vil vise typisk løn i København, vælger medianen, så nogle få topdirektører ikke skævvrider tallet.
En blogejer analyserer daglige besøgstal og bruger medianen for at neutralisere en enkelt viral dag.
Gennemsnit
Læg tallene sammen (10 + 12 + 8 + 15 = 45).
Tæl, hvor mange tal der er (4).
Divider summen med antallet (45 ÷ 4 = 11,25).
Median
Sortér tallene (8, 10, 12, 15).
Ved ulige antal: vælg midterste tal. Ved lige antal: læg de to midterste sammen og divider med 2 (10 + 12 = 22; 22 ÷ 2 = 11).
Når du kender begge mål – og vælger det rette til opgaven – får du en langt klarere forståelse af dine data.