En outlier er en observation, der afviger meget fra de andre observationer i datasættet, fordi den er meget større eller meget mindre end de andre observationer. En outlier kan skyldes måleusikkerheder, en fejl i målingerne, eller det kan være, at der bare er tale om en usædvanlig observation.
Hvordan ved man om noget er en outlier?
En observation i et observationssæt kaldes en outlier hvis den ligger mere en halvanden kvartilbredde under nedre kvartil eller mere end halvanden kvartilbredde over øvre kvartil. <1 − 1,5 ⋅ (3 − 1) eller >3 + 1,5 ⋅ (3 − 1) .
Hvad er en median i et boksplot?
Medianen (Med) er det midterste tal af alle observationerne. 50% af observationerne er altså mindre end medianen og 50% er større. Nedre kvartil (Q1) er det tal, som 25% af observationerne er mindre end (og 75% større end). Øvre kvartil (Q3) er det tal, som 75% af observationerne er mindre end (og 25% større end).
Hvordan forklarer man et boksplot?
Boksplot Når man skal tegne et boksplot, tegnes en lodret akse, som mindst dækker værdierne i observationsrækken. Derefter markeres de 5 værdier i det udvidede kvartilsæt med en vandret streg. Der tegnes en lodret streg gennem de 5 vandrette streger fra minimum til maksimum. Til sidst tegnes en ”kasse” mellem Q1 og Q3.
Hvad er Kvartilbredden i et boksplot?
Kvartilbredde (kvartilafstand). Kvartilbredden beskriver, hvor tæt den midterste halvdel af observationerne ligger. Kvartilbredden siger altså noget om spredningen i den midterste halvdel af observationerne.
Outliers - Box and Whisker Plot (1,5 IQR)
Hvad betyder en median?
Medianen. Medianen angiver den midterste værdi i en talrække der er sorteret efter størrelsen. Det betyder at halvdelen af observationerne vil være større end medianen og halvdelen af observationerne vil være mindre end medianen. Hvis der er et lige antal observationer er medianen gennemsnittet af de to midterste tal.
Hvornår er et boksplot Venstreskæv?
Definition: Hvis middelværdien er større end medianen, er datasættet højreskævt. Hvis middelværdien er mindre end medianen, er datasættet venstreskævt.
Hvad er variationsbredde i boksplot?
Af boksplottet kan man også få et indtryk af, hvor spredt værdierne er. Forskellen mellem størsteværdien og mindsteværdien kaldes variationsbredden, og den er her 13-8=5. Der er altså 5 tryksager til forskel mellem de familier, der fik flest, og dem der fik færrest.
Hvordan aflæser jeg boksplot?
Kassen viser hvor den midterste halvdel af tallene ligger. Den vandrette streg i venstre ende af boksplottet viser hvor den fjerdedel af tallene der er mindst, ligger. Den vandrette streg i højre ende af boksplottet viser hvor den fjerdedel af tallene der er størst, ligger.
Hvad betyder kvartiler?
Kvartilerne er et begreb der benyttes indenfor matematikken, helt præcis indenfor statistik (boksplot), til at beskrive et datasæt. Kvartilerne er de observationer, som – når datasættet er sorteret – deler sættet i fire lige store mængder: OBS: Nedenstående beskriver de gamle regler for udregning af kvartilsæt.
Hvordan laver man en sumkurve?
- Gruppér tallene og udregn frekvensen.
- Definér dine intervalpunkter og udregn den kumulerede frekvens.
- Opret sumkurven i Excel.
- Formater sumkurven.
Er median og gennemsnit det samme?
Gennemsnittet (middeltallet) af et observationssæt udregnes ved at lægge alle observationerne sammen og til sidst dividere med antallet af observationer. Medianen er den midterste observation, når observationssættet er sorteret.
Hvad er en variationsbredde?
Forskellen mellem den mindste observationsværdi og den største observationsværdi. Variationsbredden er forskellen på den højeste data i datasættet og det mindste. Det højeste antal søskende er 3 og det laveste 0.
Hvordan finder man type tal?
Typetallet for et datasæt er det tal, der forekommer flest gange i datasættet. Tallene 2 og 4 forekommer begge to 3 gange. Da der ikke er nogen tal, der forekommer mere end 3 gange, så er 2 og 4 begge typetal. Da typetallet er det tal, der forekommer flest gange, så er typetallet det tal, der har den største hyppighed.
Hvilke deskriptorer er der?
- Minimum og maksimum.
- Variationsbredde.
- Typetal.
- Median.
- Middeltal (gennemsnit)
- Spredning.
- Kvartiler.
- Fraktiler.
Hvad er observation og hyppighed?
Hyppigheden for hver observation er det antal gange observationen forekommer. Hyppigheden for den i'te observation, betegner man tit hi. Frekvensen er den procentdel, hvormed en observation forekommer. Lad os se på et eksempel, hvor vi har målt skostørrelsen på alle i en gymnasieklasse bestående af 28 elever.
Hvad kan man se på et boksplot?
Et boksplot eller kassediagram anvendes indenfor beskrivende statistik (deskriptiv statistik) som en metode til at illustrere median, kvartiler samt eventuelt maksimum og minimum i et sæt numeriske værdier.
Hvad er største og mindsteværdi?
Størsteværdi Størsteværdien er den største observation i observationssættet. Mindsteværdi Mindsteværdien Den mindste observation i observationssættet. Variationsbredde Variationsbredden er forskellen på størsteværdi og mindsteværdi • Variationsbredden = størsteværdien - mindsteværdien.
Hvorfor laver man et boksplot?
En grafisk måde at fremstille vores observationer på er ved at tegne et boksplot. og disse tal bruges til at tegne et boksplot. Et boksplot bruges til at give en ide om fordelingen af vores data, og det kan være en god måde at sammenligne to datasæt på.
Er middeltallet det samme som gennemsnit?
Et middeltal er den typiske værdi af et talmateriale. Oftest anvendes det aritmetiske middeltal (gennemsnittet). For positive tal anvendes undertiden det geometriske middeltal, der for fx tre tal er den tredje rod af tallenes produkt.
Hvordan finder man ud af hvad variationsbredden er?
For at beregne variationsbredde skal vi identificere det mindste og største observationer i datasættet. Derefter trækker vi det mindste tal fra det største tal for at få forskellen mellem dem.
Hvad er en kumuleret frekvens?
Definition. Kumuleret frekvens. Den kumulerede frekvens af x er andelen af observationer i hele datasættet, der er mindre end eller lig med x. Fx er den kumulerede frekvens af 120 andelen af observationer i et datasæt, der er mindre end eller lig med 120.
Er et boksplot et diagram?
Et boksplot er et diagram, der består af en tallinje og en todelt boks med to "antenner" eller "haler". Der er ikke nogen andenakse på et boksplot, så højden af boksen har ingen betydning.
Hvad kan man bruge kvartil til?
Den nedre kvartil afgrænser den nederste fjerdedel af observationerne, mens den øvre kvartil afgrænser den øverste fjerdedel. Et mål for en fordelings bredde er kvartilafstanden, dvs. afstanden mellem øvre og nedre kvartil. For grupperede materialer må der interpoleres for at beregne median og kvartiler.
Er median bedre end gennemsnit?
Lad fx 2, 4, 4, 5, 6, 7, 9 og 35 være målingerne opstillet i voksende rækkefølge. Så er medianen 5+62=5,5 (eller 5½), mens gennemsnittet er 2+4+4+5+6+7+9+358=728=9. Medianen er ofte et bedre mål end gennemsnittet for hovedtendensen i en målerække.