En observation, der skiller sig markant ud fra alle andre observationer, kaldes man en outlier. En outlier kan være tegn på, at der i dataindsamlingen er sket en fejl. Måske er der blevet observeret forkert, måske skyldes det en instrumentfejl.
Hvornår er det en outlier?
En outlier er en observation, der afviger meget fra de andre observationer i datasættet, fordi den er meget større eller meget mindre end de andre observationer. En outlier kan skyldes måleusikkerheder, en fejl i målingerne, eller det kan være, at der bare er tale om en usædvanlig observation.
Hvordan bestemmer man Outliers?
Bestem kvartilbredden, og benyt denne til at undersøge, om den højeste elev i klassen er en outlier. En observation vurderes til at være en outlier, hvis observationen ligger mere end halvanden kvartilbredde under nedre kvartil eller mere end halvanden kvartilbredde over øvre kvartil.
Hvad er et ugrupperet datasæt?
Et ugrupperet datasæt
Observationer, der ikke er inddelt i intervaller, kaldes ugrupperede. Når vi inddeler observationer i intervaller, så grupperer vi dem. Eksempel: Et datasæt består af skostørrelserne i en familie: 35, 37, 39, 40, 43. Observationerne er ugrupperede.
Hvad fortæller et boksplot?
Et boksplot eller kassediagram anvendes indenfor beskrivende statistik (deskriptiv statistik) som en metode til at illustrere median, kvartiler samt eventuelt maksimum og minimum i et sæt numeriske værdier.
What is an outlier?
Hvad viser en median?
Medianen angiver den midterste værdi i en talrække der er sorteret efter størrelsen. Det betyder at halvdelen af observationerne vil være større end medianen og halvdelen af observationerne vil være mindre end medianen. Hvis der er et lige antal observationer er medianen gennemsnittet af de to midterste tal.
Hvad betyder Q1 i et boksplot?
Nedre kvartil (Q1) er det tal, som 25% af observationerne er mindre end (og 75% større end). Øvre kvartil (Q3) er det tal, som 75% af observationerne er mindre end (og 25% større end). Man aflæser sit kvartilsæt i sumkurven.
Hvad betyder hyppighed?
Hyppigheden angiver hvor ofte en given situation, eller et element, forekommer i en statistik eller optælling. Hyppighed indgår som en del i matematisk statistik. Ordet antal kan anvendes synonymt med ordet hyppighed.
Hvad er Størsteværdien i et datasæt?
Størsteværdi Størsteværdien er den største observation i observationssættet. Mindsteværdi Mindsteværdien Den mindste observation i observationssættet. Variationsbredde Variationsbredden er forskellen på størsteværdi og mindsteværdi • Variationsbredden = størsteværdien - mindsteværdien.
Hvad er forskellen på grupperede og Ugrupperede data?
Et datasæt kaldes grupperet, hvis observationerne er inddelt i intervaller. Hvis observationerne ikke er inddelt i intervaller, så kalder vi observationerne for ugrupperede. Ugrupperede observationer kan inddeles i intervaller og behandles som et grupperet datasæt.
Hvad er hyppighed og frekvens?
Hvor hyppigheden af et tal er antallet af gange tallet optræder blandt observationerne i et datasæt, så er frekvensen altså den andel af observationerne som tallet udgør. Frekvens kaldes ind i mellem for relativ hyppighed. Frekvensen angives typisk i procent. Den kan dog også angives som et decimaltal.
Hvad er observation og hyppighed?
Hyppigheden for hver observation er det antal gange observationen forekommer. Hyppigheden for den i'te observation, betegner man tit hi. Frekvensen er den procentdel, hvormed en observation forekommer. Lad os se på et eksempel, hvor vi har målt skostørrelsen på alle i en gymnasieklasse bestående af 28 elever.
Er median og gennemsnit det samme?
Gennemsnittet (middeltallet) af et observationssæt udregnes ved at lægge alle observationerne sammen og til sidst dividere med antallet af observationer. Medianen er den midterste observation, når observationssættet er sorteret.
Hvordan læser man et boxplot?
Kassen viser hvor den midterste halvdel af tallene ligger. Den vandrette streg i venstre ende af boksplottet viser hvor den fjerdedel af tallene der er mindst, ligger. Den vandrette streg i højre ende af boksplottet viser hvor den fjerdedel af tallene der er størst, ligger.
Hvordan læser man et histogram?
Den måde man aflæser et histogram på er nemlig ved at se på arealet af hver søjle. Øverst i højre hjørne er angivet hvor stort et areal 5% svarer til. Hvis man lægger arealerne af søjlerne sammen, får man 100%. Hvis intervallerne har samme bredde, svarer søjlernes højde til intervalhyppigheden.
Hvad betyder Sumkurve i statistik?
En sumkurve er en kurve i et koordinatsystem, der beskriver sammenhængen mellem observationerne i et datasæt og de tilhørende kumulerede frekvenser. På en sumkurve er observationerne ud ad førsteaksen, mens de kumulerede frekvenser er op ad andenaksen.
Hvad er diskrete data?
Diskret data anvendes når der er tale om eksakte værdier og anvendes når der er en klar og logisk opdeling af data.
Hvad betyder et middeltal?
Middeltal, den typiske værdi af et talmateriale. Oftest anvendes det aritmetiske middeltal (gennemsnittet). For positive tal anvendes undertiden det geometriske middeltal, der for fx tre tal er den tredje rod af tallenes produkt.
Hvordan finder man størrelsen af et datasæt?
Hyppigheden af et tal er antallet af gange tallet optræder blandt observationerne. Summen af alle hyppighederne er størrelsen af datasættet, dvs. at hvis datasættet består af 20 observationer, så er summen af alle hyppighederne også 20.
Hvad kan man bruge en Hyppighedstabel til?
En hyppighedstabel er en tabel, der viser, hvor mange gange hver enkelt observation forekommer.
Hvad betyder en frekvens?
Frekvens er et mål for hvor hurtigt regelmæssige gentagelser af et givet fænomen forekommer. Begrebet bruges ofte til at beskrive hvor hurtigt (sekund)-1 (s-1). Denne enhed kaldes også hertz (opkaldt efter tyskeren Heinrich Rudolf Hertz), og forkortes Hz.
Hvad er forskellen på summeret frekvens og frekvens?
frekvens: hyppighed omregnet til procent af samtlige observationer (af observationssættets størrelse). summeret frekvens: summeret hyppighed omregnet til procent af samtlige observationer.
Hvad er Q1 og Q3?
Den nedre kvartil Q1 er medianen for den halvdel af observationerne, der er mindst. Kvartilen Q2 er medianen af alle observationerne (dvs. m). Den øvre kvartil Q3 er medianen for den halvdel af observationerne, der er størst.
Hvad står Q1 for?
Q1, Q2, Q3 og Q4 er forkortelser for 1. kvartal, osv.
Hvad betyder kvartil?
Kvartilerne er et begreb der benyttes indenfor matematikken, helt præcis indenfor statistik (boksplot), til at beskrive et datasæt. Kvartilerne er de observationer, som – når datasættet er sorteret – deler sættet i fire lige store mængder: OBS: Nedenstående beskriver de gamle regler for udregning af kvartilsæt.