Hvad er en outlier? En outlier er en observation, der afviger meget fra de andre observationer i datasættet, fordi den er meget større eller meget mindre end de andre observationer. En outlier kan skyldes måleusikkerheder, en fejl i målingerne, eller det kan være, at der bare er tale om en usædvanlig observation.
Hvad definerer en outlier?
En observation, der skiller sig markant ud fra alle andre observationer, kaldes man en outlier. En outlier kan være tegn på, at der i dataindsamlingen er sket en fejl. Måske er der blevet observeret forkert, måske skyldes det en instrumentfejl.
Hvornår er der Outliers?
En observation i et observationssæt kaldes en outlier hvis den ligger mere en halvanden kvartilbredde under nedre kvartil eller mere end halvanden kvartilbredde over øvre kvartil.
Hvordan finder man en outlier?
Bestem kvartilbredden, og benyt denne til at undersøge, om den højeste elev i klassen er en outlier. En observation vurderes til at være en outlier, hvis observationen ligger mere end halvanden kvartilbredde under nedre kvartil eller mere end halvanden kvartilbredde over øvre kvartil.
Hvad viser et boxplot?
Et boksplot eller kassediagram anvendes indenfor beskrivende statistik (deskriptiv statistik) som en metode til at illustrere median, kvartiler samt eventuelt maksimum og minimum i et sæt numeriske værdier.
Statistik - Sådan finder du outliers
Hvad er en outlier i boksplot?
En outlier er en observation, der afviger meget fra de andre observationer i datasættet, fordi den er meget større eller meget mindre end de andre observationer. En outlier kan skyldes måleusikkerheder, en fejl i målingerne, eller det kan være, at der bare er tale om en usædvanlig observation.
Hvordan læser jeg et boksplot?
Kassen viser hvor den midterste halvdel af tallene ligger. Den vandrette streg i venstre ende af boksplottet viser hvor den fjerdedel af tallene der er mindst, ligger. Den vandrette streg i højre ende af boksplottet viser hvor den fjerdedel af tallene der er størst, ligger.
Hvad viser en median?
Medianen. Medianen angiver den midterste værdi i en talrække der er sorteret efter størrelsen. Det betyder at halvdelen af observationerne vil være større end medianen og halvdelen af observationerne vil være mindre end medianen. Hvis der er et lige antal observationer er medianen gennemsnittet af de to midterste tal.
Hvornår er et boksplot Venstreskæv?
Definition: Hvis middelværdien er større end medianen, er datasættet højreskævt. Hvis middelværdien er mindre end medianen, er datasættet venstreskævt.
Er median og gennemsnit det samme?
Gennemsnittet (middeltallet) af et observationssæt udregnes ved at lægge alle observationerne sammen og til sidst dividere med antallet af observationer. Medianen er den midterste observation, når observationssættet er sorteret.
Hvad er q1 i et boksplot?
Nedre kvartil (Q1) er det tal, som 25% af observationerne er mindre end (og 75% større end). Øvre kvartil (Q3) er det tal, som 75% af observationerne er mindre end (og 25% større end). Man aflæser sit kvartilsæt i sumkurven. For at finde nedre kvartil, finder man 25% på y-aksen.
Hvordan finder man varians?
Hvis du vil beregne variansen for en hel population, skal du bruge VARIANSP . VARIANS tager summen af kvadraterne af hver værdis afvigelse fra middelværdien og dividerer med antallet af sådanne værdier minus én.
Hvilke deskriptorer er der?
- Minimum og maksimum.
- Variationsbredde.
- Typetal.
- Median.
- Middeltal (gennemsnit)
- Spredning.
- Kvartiler.
- Fraktiler.
Hvad er Kvartilbredden i et boksplot?
Kvartilbredde (kvartilafstand). Kvartilbredden beskriver, hvor tæt den midterste halvdel af observationerne ligger. Kvartilbredden siger altså noget om spredningen i den midterste halvdel af observationerne.
Hvad er en variationsbredde?
Variationsbredden er altså afstanden mellem den største observation og den mindste observation i datasættet. Variationsbredden siger derfor noget om, hvor spredte observationerne er. Jo større variationsbredden er, jo mere spredt er observationerne.
Hvad betyder kvartiler?
Kvartilerne er et begreb der benyttes indenfor matematikken, helt præcis indenfor statistik (boksplot), til at beskrive et datasæt. Kvartilerne er de observationer, som – når datasættet er sorteret – deler sættet i fire lige store mængder: OBS: Nedenstående beskriver de gamle regler for udregning af kvartilsæt.
Hvorfor laver man et boksplot?
Hvis du laver statistisk analyse, vil du måske få brug for at lave et 'boksplot' (engelsk: 'box plot') for at vise fordelingen af dine data. Boksplot er oplagt til at sammenligne fordelingen af flere populationer i samme diagram. Det giver ofte et godt og enkelt overblik, med synlige kvartiler og median.
Hvad består boksplot af?
Et boksplot er et diagram, der består af en tallinje og en todelt boks med to "antenner" eller "haler". Der er ikke nogen andenakse på et boksplot, så højden af boksen har ingen betydning.
Hvad betyder skævhed i statistik?
Skævhed er den grad af asymmetri, der er i en fordeling omkring dens middelværdi. Positiv skævhed indikerer en fordeling med en asymmetrisk hale, der hælder mod mere positive værdier. Negativ skævhed indikerer en fordeling med en asymmetrisk hale, der hælder mod mere negative værdier.
Er median bedre end gennemsnit?
Lad fx 2, 4, 4, 5, 6, 7, 9 og 35 være målingerne opstillet i voksende rækkefølge. Så er medianen 5+62=5,5 (eller 5½), mens gennemsnittet er 2+4+4+5+6+7+9+358=728=9. Medianen er ofte et bedre mål end gennemsnittet for hovedtendensen i en målerække.
Hvorfor er median bedre end gennemsnit?
Medianen er et statistisk mål, der anvendes til at analysere data. Det repræsenterer den midterste værdi i en række af tal, når de er sorteret i stigende eller faldende rækkefølge. Medianen er mindre følsom over for ekstreme værdier end gennemsnittet, hvilket gør den til et nyttigt værktøj i dataanalyse.
Hvorfor median i stedet for gennemsnit?
Fordelen ved at bruge median i forhold til middelværdi er, at median er stabil overfor ekstreme observationer (som blandt andet kan fremkomme ved målefejl).
Hvad betyder sumkurve i statistik?
En sumkurve er en kurve i et koordinatsystem, der beskriver sammenhængen mellem observationerne i et datasæt og de tilhørende kumulerede frekvenser. På en sumkurve er observationerne ud ad førsteaksen, mens de kumulerede frekvenser er op ad andenaksen.
Hvordan laver man en sumkurve?
- Gruppér tallene og udregn frekvensen.
- Definér dine intervalpunkter og udregn den kumulerede frekvens.
- Opret sumkurven i Excel.
- Formater sumkurven.
Kan man lave et boksplot i Excel?
- Marker tallene og overskrifterne (bemærk: vi tager ikke årstallene med)
- Vælg Fanen Indsæt og klik på galleriet Indsæt statistikdiagram. Her kan du vælge Kasse med hale.