En observation i et observationssæt kaldes en outlier hvis den ligger mere en halvanden kvartilbredde under nedre kvartil eller mere end halvanden kvartilbredde over øvre kvartil. <1 − 1,5 ⋅ (3 − 1) eller >3 + 1,5 ⋅ (3 − 1) .
Hvornår er det en outlier?
En observation, der skiller sig markant ud fra alle andre observationer, kaldes man en outlier. En outlier kan være tegn på, at der i dataindsamlingen er sket en fejl. Måske er der blevet observeret forkert, måske skyldes det en instrumentfejl.
Hvordan finder jeg en outlier?
Bestem kvartilbredden, og benyt denne til at undersøge, om den højeste elev i klassen er en outlier. En observation vurderes til at være en outlier, hvis observationen ligger mere end halvanden kvartilbredde under nedre kvartil eller mere end halvanden kvartilbredde over øvre kvartil.
Hvad er en outlier i boksplot?
Hvad er en outlier? En outlier er en observation, der afviger meget fra de andre observationer i datasættet, fordi den er meget større eller meget mindre end de andre observationer.
Hvordan aflæser man kvartiler?
Nedre kvartil (Q1) er det tal, som 25% af observationerne er mindre end (og 75% større end). Øvre kvartil (Q3) er det tal, som 75% af observationerne er mindre end (og 25% større end). Man aflæser sit kvartilsæt i sumkurven. For at finde nedre kvartil, finder man 25% på y-aksen.
Outlier og Boksplot med og uden outlier i Geogebra [Statistik, Geogebra]
Hvordan læser man et boxplot?
Kassen viser hvor den midterste halvdel af tallene ligger. Den vandrette streg i venstre ende af boksplottet viser hvor den fjerdedel af tallene der er mindst, ligger. Den vandrette streg i højre ende af boksplottet viser hvor den fjerdedel af tallene der er størst, ligger.
Hvad viser et boxplot?
Et boksplot eller kassediagram anvendes indenfor beskrivende statistik (deskriptiv statistik) som en metode til at illustrere median, kvartiler samt eventuelt maksimum og minimum i et sæt numeriske værdier.
Hvornår er en fordeling Venstreskæv?
Definition: Hvis middelværdien er større end medianen, er datasættet højreskævt. Hvis middelværdien er mindre end medianen, er datasættet venstreskævt.
Hvad fortæller Kvartilbredden noget om?
Kvartilbredde (kvartilafstand). Kvartilbredden beskriver, hvor tæt den midterste halvdel af observationerne ligger. Kvartilbredden siger altså noget om spredningen i den midterste halvdel af observationerne.
Hvordan finder man variansen?
Hvis du vil beregne variansen for en hel population, skal du bruge VARIANSP . VARIANS tager summen af kvadraterne af hver værdis afvigelse fra middelværdien og dividerer med antallet af sådanne værdier minus én.
Hvilke deskriptorer er der?
- Minimum og maksimum.
- Variationsbredde.
- Typetal.
- Median.
- Middeltal (gennemsnit)
- Spredning.
- Kvartiler.
- Fraktiler.
Hvad betyder kvartiler?
Kvartilerne er et begreb der benyttes indenfor matematikken, helt præcis indenfor statistik (boksplot), til at beskrive et datasæt. Kvartilerne er de observationer, som – når datasættet er sorteret – deler sættet i fire lige store mængder: OBS: Nedenstående beskriver de gamle regler for udregning af kvartilsæt.
Hvad er forskellen på grupperede og Ugrupperede observationer?
Et datasæt kaldes grupperet, hvis observationerne er inddelt i intervaller. Hvis observationerne ikke er inddelt i intervaller, så kalder vi observationerne for ugrupperede. Ugrupperede observationer kan inddeles i intervaller og behandles som et grupperet datasæt.
Hvad er spredning matematik?
Hvad er spredning? Spredningen (standardafvigelsen) af observationerne i et datasæt beskriver, hvor meget observationerne i gennemsnit afviger fra gennemsnittet, dvs. hvor spredte observationerne er. Jo større spredningen er, jo mere spredt er observationerne.
Hvad betyder en median?
Medianen. Medianen angiver den midterste værdi i en talrække der er sorteret efter størrelsen. Det betyder at halvdelen af observationerne vil være større end medianen og halvdelen af observationerne vil være mindre end medianen. Hvis der er et lige antal observationer er medianen gennemsnittet af de to midterste tal.
Hvad er en variationsbredde?
Variationsbredden er forskellen mellem størsteværdien og mindsteværdien.
Hvad kan man se på en sumkurve?
En sumkurve er en kurve i et koordinatsystem, der beskriver sammenhængen mellem observationerne i et datasæt og de tilhørende kumulerede frekvenser. På en sumkurve er observationerne ud ad førsteaksen, mens de kumulerede frekvenser er op ad andenaksen.
Er median og gennemsnit det samme?
Gennemsnittet (middeltallet) af et observationssæt udregnes ved at lægge alle observationerne sammen og til sidst dividere med antallet af observationer. Medianen er den midterste observation, når observationssættet er sorteret.
Hvordan angiver man kvartilsæt?
Kvartilsættet består af kvartilerne. Definition. Kvartilsæt. Hvis et datasæt har nedre kvartil Q1 = 4, median m = 7 og øvre kvartil Q3 = 12, så er kvartilsættet altså (4, 7, 12).
Hvad fortæller Kvartilsættet?
De 5 værdier er: minimum, nedre kvartil, median, øvre kvartil og maksimum. De tre midterste værdier ( nedre kvartil , median , øvre kvartil ) kaldes kvartilsættet og opdeler observationsrækken ved 25 %, 50 % og 75 %. I en klasse måles højden af alle drengene.
Hvad betyder et boksplot?
Et boksplot viser, hvordan observationer er fordelt i et observationssæt. "Antennerne" er de to streger i hver ende af boksplottet, og de viser mindsteværdien og størsteværdien. Selve "kassen" viser nedre kvartil (1. kvartil), medianen (2.
Hvad er et ugrupperet observationssæt?
Observationer, der ikke er inddelt i intervaller, kaldes ugrupperede. Når vi inddeler observationer i intervaller, så grupperer vi dem. Eksempel: Et datasæt består af skostørrelserne i en familie: 35, 37, 39, 40, 43. Observationerne er ugrupperede.
Hvad siger et histogram?
Et histogram er en måde grafisk at vise et datasæt på, som illustrerer hyppigheden, værdier i datasættet forekommer med. Det bruges til at få overblik over hvordan data fordeler sig, og for eksempel vurdere hvilken sandsynlighedsfordeling en stokastisk variabel kommer fra.
Hvad er medianen i et boksplot?
Boksplot er en diagramtype man ofte anvender til, at vise observationernes forskellige tal i. Det er bygget op som en kasse med to haler. Kassens størrelse svarer til halvdelen af observationerne. Hvis ikke medianen ligger i midten af kassen er der en skævhed i observationerne.
Hvad er variationsbredde i et boksplot?
Variationsbredden er altså afstanden mellem den største observation og den mindste observation i datasættet. Variationsbredden siger derfor noget om, hvor spredte observationerne er. Jo større variationsbredden er, jo mere spredt er observationerne.