Gennemsnits- og medianberegner | Beregn centralmål

Beregn gennemsnit (middelværdi) og median (midterste værdi) med det samme. Forstå dine data med trinvise løsninger og intelligent afvigelsesregistrering.

2

Indtast data ovenfor for at se resultaterne med det samme.

Bemærk: Ikke-numeriske tegn filtreres fra. Beregningerne behandler alle værdier med lige vægt.

Hvad er gennemsnittet?

Gennemsnittet (ofte kaldet det aritmetiske middel) er den mest almindelige måde at måle »centret« i et datasæt. Det beregnes ved at lægge alle værdierne sammen (summen) og dividere med det samlede antal værdier (antallet).

Formel: Gennemsnit = (x₁ + x₂ + ... + xₙ) ÷ n

Gennemsnittet er meget nyttigt for symmetriske data, hvor værdierne er jævnt fordelt. Det er dog følsomt over for outliere – en enkelt ekstremt høj eller lav værdi kan trække gennemsnittet væk fra det egentlige »center«.

Hvad er medianen?

Medianen er den midterste værdi i et datasæt, når det er sorteret fra mindst til størst. Den repræsenterer det nøjagtige midtpunkt: halvdelen af dataene er mindre end medianen, og halvdelen er større.

  • Ulige antal: Vælg den nøjagtige midterste værdi. (F.eks. i 1, 5, 9 er medianen 5).
  • Lige antal: Find de to midterste værdier og beregn gennemsnittet af dem. (F.eks. i 1, 5, 7, 9 er medianen (5+7)÷2 = 6).

Medianen er »robust«, hvilket betyder, at den sjældent påvirkes af outliere. Det gør den til det foretrukne mål for skæve data som indkomst eller boligpriser.

Gennemsnit vs. median: Hvornår bør du bruge hvad?

Brug GENNEMSNIT når … Brug MEDIAN når …
Data er symmetriske (klokkeformet kurve) Data er skæve (lang hale)
Der ikke er ekstreme outliere Outliere er til stede
Præcision er nødvendig for alle værdier En repræsentativ »typisk« værdi er ønsket
Eksempel: Højden på elever i en klasse Eksempel: Husstandsindkomst, boligpriser

Forståelse af outliere og deres påvirkning

En outlier er et datapunkt, der afviger markant fra de øvrige observationer. Forestil dig fem personer i et lokale med årlige indkomster på 250.000 kr, 300.000 kr, 340.000 kr, 280.000 kr og 7.500.000 kr (en topchef).

Gennemsnitsindkomst: 1.734.000 kr

Misvisende. Kun topchefen tjener så meget eller mere. Værdien repræsenterer ikke den »typiske« person i lokalet.

Medianindkomst: 300.000 kr

Rammende. Denne værdi repræsenterer den typiske løn i gruppen uden at blive påvirket af topchefens ekstreme outlier.

Det er grunden til, at økonomer og ejendomsmæglere næsten altid rapporterer medianindkomst og boligpriser – gennemsnittet forvrænges let af meget høje indkomster eller luksusejendomme.

Eksempler fra den virkelige verden

  • Uddannelse: Lærere bruger gennemsnittet til at vurdere klassens præstation, men kan tjekke medianen for at se, om en svær prøve fik de fleste elever til at dumpe, trods nogle få høje resultater.
  • Ejendomme: I et kvarter med hovedsageligt beskedne boliger og én ejendom til flere millioner giver medianprisen købere et realistisk billede af, hvad de reelt kan forvente at betale.
  • Webydelse: Udviklere ser på median-indlæsningstider (eller den 95. percentil) frem for gennemsnittet, fordi nogle få brugere med dårlig forbindelse kan trække den gennemsnitlige indlæsningstid op, så den ser værre ud, end den er for de fleste.

Ofte stillede spørgsmål

Hvad er forskellen mellem gennemsnit, median og typetal?

Gennemsnittet er det aritmetiske middel. Medianen er den midterste værdi. Typetallet er den værdi, der forekommer oftest. Alle er mål for »central tendens«, men de opfører sig forskelligt, når data er skæve.

Hvornår bør jeg bruge median i stedet for gennemsnit?

Brug medianen, når dine data indeholder outliere eller er skæve (som indkomstdata). Medianen giver en bedre »typisk« værdi i disse tilfælde, fordi den ikke påvirkes af ekstreme tal.

Hvordan beregner jeg medianen manuelt?

Sortér først dine tal fra lavest til højest. Hvis du har et ulige antal tal, er medianen det tal, der ligger nøjagtigt i midten. Hvis du har et lige antal, tager du de to midterste tal, lægger dem sammen og dividerer med 2.

Kan et datasæt have flere typetal?

Ja! Et datasæt er »bimodalt«, hvis to værdier forekommer med den samme højeste frekvens, eller »multimodalt«, hvis mere end to gør det.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram