Tabla de Contenidos
Skævhed kan bestemmes ud fra, hvordan middelværdien, medianen og tilstanden af en fordeling er relateret til hinanden.
I unimodale fordelinger, der er symmetriske, det vil sige, at de kun har én modus, falder middelværdien, medianen og modusen sammen. På den anden side går symmetrien tabt i skæve fordelinger, og både middelværdien og medianen optræder i forskellige positioner.
Når niveauet af symmetri forsvinder, opstår positive og negative asymmetrier. Disse målinger gør det muligt at fastslå graden af asymmetri, som en sandsynlighedsfordeling af en stokastisk variabel har. Asymmetrien kan let ses på en klokkeplot.
Under hensyntagen til tilstanden som referenceakse, vil typen af asymmetri blive defineret i henhold til graden af spredning af dataene på begge sider, også kaldet «haler».
Hvis fordelingen er symmetrisk, vil der være det samme antal værdier til højre som til venstre for middelværdien.
positiv asymmetri
Hvis skævheden er positiv, vil grafkurven blive skæv til højre, da der vil være flere værdier til højre for middelværdien. Her er middelværdien og medianen større end tilstanden. Selv i de fleste tilfælde vil middelværdien være større end medianen.
negativ asymmetri
Hvis skævheden er negativ, vil grafkurven blive skæv til venstre. Det vil sige, at der vil være flere værdier placeret til venstre for middelværdien.
Ved negativ skævhed er middelværdien og medianen mindre end tilstanden. Generelt er gennemsnittet også mindre end medianen.
Hvordan man beregner skævheden af en fordeling
Da det kan være svært at bestemme skævheden i en graf med det blotte øje, er der skævhedsmål, som gør, at vi kan kende præcis graden af skævhed af en fordeling.
Til dette bruges de:
- Pearsons første skævhedskoefficient: Dette er et mål for skævhed, der involverer at trække middelværdien fra tilstanden og dividere forskellen med standardafvigelsen af dataene. Det bruges hovedsageligt i unimodale fordelinger.
- Den anden Pearson skævhedskoefficient er et andet middel, der bruges til at bestemme skævheden af et datasæt. For at udføre denne beregning skal tilstanden trækkes fra medianen. Derefter multiplicerer vi resultatet med tre og dividerer resultatet med standardafvigelsen.
- Fishers asymmetrikoefficient: denne metode er lidt mere kompleks og er baseret på de afvigelser, som de observerede værdier præsenterer i forhold til middelværdien. Det beregnes ved at dividere det tredje øjeblik med standardafvigelsen.
- Bowley-Yule skævhedskoefficienten: Denne beregning er baseret på medianen og kvartilerne. Hvis fordelingen er symmetrisk, vil den første og tredje kvartil være placeret i samme afstand fra medianen. Dette vil resultere i, at skævheden er lig med 0. På den anden side, hvis skævheden er positiv, vil resultatet være større end 0. Hvis den er negativ, vil denne værdi være mindre.
Bibliografi
- Martínez Pineda, A. (2018, 4. april). Distributionstyper. RStudio. Tilgængelig på: https://rstudio-pubs-static.s3.amazonaws.com/377130_08851253a31b41d18c25fd08fad316c3.html
- Spiegel, M. Sandsynlighed og statistik. (2014). Spanien. McGraw-Hill Interamericana.
- Mullor Ibáñez, R. Grundlæggende statistik: I. Introduktion til statistik . (2017). Publikationer fra universitetet i Alicante.