Hvad er forskellen mellem varians og standardafvigelse?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Variansen og standardafvigelsen er to udtryk af stor betydning, både i statistik og i alle grene af videnskab og teknik. Begge er spredningsmål med hensyn til en central værdi, men afhængigt af konteksten, de bruges i, kan de defineres på forskellige måder.

Inden for statistik og sandsynlighed måler varians og standardafvigelse, hvor langt værdierne af en tilfældig variabel (næsten altid repræsenteret med bogstavet X) afviger fra deres middelværdi.

Men når disse termer bruges i videnskab eller teknik, refererer variansen og standardafvigelsen til spredningen af ​​en dataserie, enten af ​​en hel population eller en stikprøve, omkring populationen eller stikprøvegennemsnittet. Standardafvigelsen for en række gentagne målinger ved brug af det samme måleinstrument bruges også ofte til at give en idé om præcisionsniveauet af nævnte instrument.

Standardafvigelsen for en række gentagne målinger giver en ide om måleinstrumentets præcisionsniveau.

I det første tilfælde måler variansen og standardafvigelsen variabiliteten af ​​en tilfældig variabel, mens de i det andet måler spredningen af ​​eksperimentelle data. I begge tilfælde indikerer en varians eller standardafvigelse på nul ingen variation overhovedet (den tilfældige variabel er faktisk konstant, eller dataene er alle nøjagtig de samme), mens en høj værdi indikerer det modsatte.

Disse to udtryk er tæt beslægtede og kan nogle gange forveksles med hinanden, men der er vigtige forskelle mellem de to, som vi kommer til med det samme.

Forskelle mellem varians og standardafvigelse

1. De har forskellige definitioner

Den første forskel mellem disse to statistiske udtryk er deres definition:

Definition af varians

I statistik defineres varians som den forventede værdi af kvadratet af forskellen mellem værdien af ​​en tilfældig variabel og dens middelværdi.

Matematisk skrives dette som:

Statistisk definition af varians

På en lidt mindre formel måde kan det også defineres som gennemsnittet af kvadraterne af forskellene mellem de individuelle data i en dataserie (population eller stikprøve) og dens middelværdi.

Standardafvigelsesdefinition

Uanset hvilken kontekst den bruges i, er standardafvigelsen, også kendt som standardafvigelsen, defineret som den positive kvadratrod af variansen.

Matematisk skrives dette som:

Statistisk definition af standardafvigelse.

2. De er repræsenteret med forskellige symboler

Varians og standardafvigelse er repræsenteret på forskellige måder både i statistiktekster og i formler og ligninger:

Varians:

  • σ 2 når der refereres til populationsvariansen
  • S 2 når der refereres til prøvevariansen
  • Var(X) når der refereres til variansen af ​​en tilfældig variabel, i dette tilfælde X.

Standardafvigelse:

  • σ når der refereres til populationens standardafvigelse
  • S, når der refereres til prøvens standardafvigelse
  • SD(X) når der refereres til standardafvigelsen af ​​en stokastisk variabel, i dette tilfælde X.

3. De har forskellige formler

For både variansen og standardafvigelsen er der to formler, afhængig af om dataserien, som variansen eller standardafvigelsen beregnes for, er data fra en population eller fra en stikprøve.

Populationsvariansformel (σ 2 )

Formler for varianspopulationsvariansen

I en af ​​de to formler for populationsvariansen repræsenterer μ populationens middelværdi, X i repræsenterer den ite populationsdataværdi, og N repræsenterer populationens størrelse eller det samlede antal datapunkter.

Prøvevariansformel (S 2 )

formler for prøvevarians

Her repræsenterer x-bjælken middelværdien af ​​prøvedataene (stikprøvemiddelværdi), x i repræsenterer værdien af ​​de ide prøvedata, og n repræsenterer størrelsen eller det samlede antal data i prøven.

Populationsstandardafvigelsesformel (σ)

I tilfælde af standardafvigelsen kan den beregnes på tre forskellige måder:

Formel for populationens standardafvigelse.

En anden formel for populationens standardafvigelse

Praktisk formel for populationens standardafvigelse.

Eksempel på standardafvigelsesformler

Også her kan en af ​​tre forskellige måder bruges:

Formel for prøvestandardafvigelse.

En anden formel for prøvestandardafvigelse.

Praktisk formel for prøvestandardafvigelse.

Der skal noteres med hensyn til de to sidste formler. Det er almindeligt, at man ved beregning af standardafvigelsen først beregner variansen, og derefter tages kvadratroden. Standardafvigelsen bestemmes sjældent ved at bruge de sidstnævnte ligninger uden først at beregne variansen, så førstnævnte går næsten altid forud for sidstnævnte.

4. De har forskellige enheder

Både variansenhederne og standardafvigelsen afhænger af arten og enhederne af dataene eller den tilfældige variabel, som de refererer til, men enhederne er forskellige i hvert enkelt tilfælde.

Standardafvigelsen har de samme enheder som de oprindelige data eller den tilfældige variabel, mens variansen kommer i disse enheder i kvadrat.

Eksempel:

Hvis du har data for vægtene i kilogram (kg) af en stikprøve af 8. klasses elever i en bestemt uddannelsesinstitution, så vil variansen af ​​disse data have enheder på kg 2, mens standardafvigelsen vil komme i kg .

5. De adskiller sig i deres fortolkning

For både variansen og standardafvigelsen er fortolkningen den samme som den allerede nævnte: hvis de er nul værd, er der ingen spredning, og alle data er nøjagtigt lig med hinanden; hvis de er små værdier, vil der være lidt spredning, og hvis de er store vil der være meget spredning.

fortolkning af varians og standardafvigelse.

Men når man forstår, hvad det vil sige at være en stor eller lille værdi, er standardafvigelsesværdier meget lettere at fortolke end variansværdier, da de er i de samme enheder som dataene. Dette er ikke så enkelt i tilfælde af varians.

6. De adskiller sig i deres følsomhed over for ekstreme værdier

Som spredningsmål lider både variansen og standardafvigelsen af ​​følsomhed over for eksistensen af ​​ekstreme værdier (enten meget høje eller meget lave). Dette betyder, at når man beskriver en dataserie, hvor alle data er meget ens, bortset fra én, der er meget større eller mindre end de andre, vil hverken variansen eller standardafvigelsen godt repræsentere spredningen af ​​dataene (begge vil give værdier store på trods af, at langt størstedelen af ​​dataene viser meget lille spredning).

Men når man sammenligner variansen med standardafvigelsen, er variansen meget mere følsom over for disse outliers, da alle afvigelser er kvadreret, mens standardafvigelsen ikke er det.

7. De adskiller sig i deres matematiske egenskaber

Den sidste forskel, vi vil se på, omfatter faktisk flere meget dybere forskelle, der primært er vigtige for statistikere (eller dem, der studerer statistik).

Som matematiske funktioner adskiller varians og standardafvigelse sig med hensyn til effekten af ​​at gange dataene med en konstant, effekten af ​​at lægge konstanter sammen, lægge tilfældige variable sammen, hæve til potenser og så videre.

Disse forskelle ligger dog uden for rammerne af denne artikel.

Eksempel på beregning af varians og standardafvigelse

Antag, at en prøve på 12 tyre fra en lokal producent blev vejet. Vægtene i kilo er vist nedenfor:

507 497 510 508 491 510
500 509 496 491 505 503

Du bliver bedt om at bestemme variansen og standardafvigelsen for denne prøve.

LØSNING

Som nævnt ovenfor, når du har en dataserie, er det praktisk først at bestemme variansen og derefter standardafvigelsen.

Beregning af prøvevariansen (S 2 )

Vi vil bruge den anden prøvevariansformel, da den er mere praktisk. For at gøre dette følges følgende trin:

  • Trin 1: Der laves en lodret liste over alle data
  • Trin 2: Kvadraten af ​​hver data beregnes og skrives ved siden af ​​den i en ny kolonne.
  • Trin 3: Alle data tilføjes, og resultatet registreres i slutningen af ​​den første kolonne.
  • Trin 4: Læg alle kvadraterne sammen og skriv resultatet ned i slutningen af ​​anden kolonne.

Disse første 5 trin er opsummeret i følgende tabel:

Xi _ x i 2
500 250.000
509 259081
496 246016
491 241081
505 255025
503 253009
507 257049
497 247009
510 260100
508 258064
491 241081
510 260100
∑Xi _ ∑X i 2
6027 3027615
  • Trin 5: Formlen bruges til at beregne variansen:
Eksempel på beregning af varians

Så prøvevariansen er cirka S 2 = 50 kg 2 .

Beregning af prøvens standardafvigelse (S)

Nu hvor vi har variansen, er det så simpelt at beregne standardafvigelsen som at tage kvadratroden af ​​den første:

Eksempel på beregning af standardafvigelse

Som det kan ses, giver sammenligningen af ​​standardafvigelsen, som er 7 kilo, med gennemsnitsvægten af ​​tyrene, som er 502,25 kilo (beregnet separat), os til at konkludere, at denne prøve har en lav spredning, da den kun er 1,4 % af tyrenes gennemsnitsvægt.

Referencer

Espinoza, CI, & Echecopar, AL (2020). Statistiske applikationer ved hjælp af MS Excel med trinvise eksempler (spansk udgave) (1. udg .). Lima, Peru: Luis Felipe Arizmendi Echecopar og Duo Negocios SAC.

Investopedia. (2021, 16. april). Lær hvordan standardafvigelse bestemmes ved at bruge varians. Hentet 24. juli 2021 fra https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp

Lopez, JF (18. november 2017). Varians . Hentet fra https://economipedia.com/definiciones/varianza.html

National Institute of Standards and Technology. (nd). Grundlæggende definitioner af usikkerhed. Hentet 24. juli 2021 fra https://physics.nist.gov/cuu/Uncertainty/basic.html

Webster, A. (2001). Statistik anvendt på erhvervslivet og økonomien (spansk udgave) . Toronto, Canada: Irwin Professional Publishing.

-Reklame-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados