Forskjeller mellom populasjons- og utvalgsstandardavvik

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


I beskrivende statistikk er det en rekke mål som lar oss observere ulike generelle aspekter ved dataene til en populasjon. Noen brukes til å måle den sentrale tendensen til dataene, mens andre søker å gi en ide om variasjonen eller spredningen av dataene, det vil si måten dataene er fordelt rundt den sentrale tendensen på.

To viktige mål for variasjon eller spredning er variansen og standardavviket. Disse to målene er nært knyttet til hverandre, men det er to versjoner av variansen og to tilsvarende versjoner av standardavviket, nemlig populasjonen og utvalget.

Befolkning vs. utvalg statistiske sammendrag

Det er verdt å merke seg et faktum av stor betydning, og det er at det i statistikk generelt er to versjoner av hvert av målene som oppsummerer oppførselen til en serie data og som brukes i forskjellige sammenhenger.

Til å begynne med må vi skille mellom data fra en populasjon (eller populasjonsdata) og data fra en undergruppe av den populasjonen, kalt et utvalg. Selv om populasjonsdata og utvalgsdata er matematisk umulige å skille, er de konseptuelt svært forskjellige.

folketellinger

Befolkningsdata er data innhentet gjennom en statistisk folketelling, det vil si å måle eller analysere hvert element eller individ som utgjør en populasjon (så lenge den er endelig, selvfølgelig). Når vi beregner mål på sentral tendens eller spredning for populasjonsdata, får vi mål som oppsummerer den generelle atferden til populasjonen, som vi kaller populasjonsparametere og som er faste verdier for en populasjon (det vil si at en populasjon bare har ett gjennomsnitt , én modus, ett standardavvik osv. på et gitt tidspunkt). I dette tilfellet bruker vi beskrivende statistikk .

Prøvetaking

På den annen side, i mange forskjellige situasjoner utfører vi en prøvetakingsprosess for å analysere bare noen elementer av populasjonen, og dermed få prøvedata. I disse tilfellene kan vi også bruke verktøyene til beskrivende statistikk for å observere den generelle oppførselen til disse dataene, men vi lager faktisk ikke beskrivende statistikk om populasjonen, bare på utvalget.

Numeriske oppsummeringer av utvalget er ikke parametere, men kalles statistikk (selv om noen også kaller dem statistikk). I motsetning til parametere varierer statistikk fra utvalg til utvalg , selv om prøvene er trukket fra samme populasjon. Dette er fordi, når du velger en undergruppe av populasjonen, er det mange mulige kombinasjoner av elementer som kan utgjøre utvalget. Av denne grunn består utvalgene generelt av ulike emner, individer eller elementer, noe som gir opphav til ulik statistikk.

Det endelige målet med å beregne denne statistikken på utvalget er å kunne bruke dem som estimatorer av de respektive populasjonsparametrene. Denne prosessen med å utlede eller estimere atferden til populasjonsdata fra utvalgsdata er det konklusjonsstatistikk er ansvarlig for . Dette gjør populasjons- og utvalgsvarianser og standardavvik vesentlig forskjellige.

Men hva er egentlig varians og standardavvik?

Hva er variansen?

Varians er et mål på spredning fra gjennomsnittet av et datasett. Det er definert som gjennomsnittet av kvadrerte avvik for alle data fra gjennomsnittet. Som et gjennomsnitt av kvadratiske forskjeller, er det alltid en positiv størrelse.

Hva er standardavviket?

På den annen side er standardavviket ganske enkelt den positive kvadratroten av variansen. Den måler også spredningen rundt gjennomsnittet, bare det gjør det i form av de samme enhetene av dataene og gjennomsnittet. Dette gjør det lettere å forstå og tolke enn variansen.

Siden standardavviket beregnes som kvadratroten av variansen, gir det ikke mening å snakke om populasjonen og utvalgsstandardavviket uten å snakke om populasjonen og utvalgsvariansen.

De viktigste forskjellene mellom disse vanlige målene for spredning rundt gjennomsnittet vil bli beskrevet i detalj i de følgende avsnittene.

Differanse 1: Populasjons- og utvalgsstandardavvik og varianser er representert med forskjellige symboler

Den første forskjellen å vurdere når man sammenligner populasjons- og utvalgsvariansen og populasjonens og prøvens standardavvik er symbolet som brukes til å representere dem. I statistikk er numeriske sammendrag eller parametere for befolkningen vanligvis representert ved bruk av greske bokstaver , mens prøve- eller statistiske versjoner er representert med tilsvarende bokstaver i det latinske alfabetet .

I denne forstand er variansen og populasjonsstandardavviket begge assosiert med den små greske bokstaven sigma mens prøveversjonene er representert med bokstaven s . Det vil si at populasjonsvariansen er σ 2 og populasjonsstandardavviket er σ , mens utvalgets varians er representert med s 2 og utvalgets standardavvik er representert med s .

Differanse 2: De beregnes ved hjelp av forskjellige formler

Både populasjonen og utvalgets standardavvik beregnes som den positive kvadratroten av den respektive variansen, det vil si:

Forskjeller mellom populasjons- og utvalgsstandardavvik

Imidlertid er populasjons- og utvalgsvariansene beregnet ved hjelp av litt forskjellige formler. Når det gjelder populasjonsvariansen, beregnes dette som gjennomsnittet av de kvadrerte avvikene for hvert datum i forhold til populasjonsgjennomsnittet. Det vil si at det beregnes av ett av følgende ekvivalente uttrykk:

Forskjeller mellom populasjons- og utvalgsstandardavvik

Der x i representerer verdien av hvert dataelement i populasjonen, μ representerer populasjonsgjennomsnittet, og N er størrelsen på populasjonen. Derfor beregnes populasjonsstandardavviket som:

Forskjeller mellom populasjons- og utvalgsstandardavvik

I stedet for å dividere med antall datapunkter, n , som forventet, beregnes utvalgets varians ved å dividere summen av de kvadrerte avvikene fra utvalgets gjennomsnitt med n – 1 . Med andre ord, utvalgets varians beregnes som:

Forskjeller mellom populasjons- og utvalgsstandardavvik

Der x i representerer verdien av hvert dataelement i utvalget, x̄ representerer utvalgets gjennomsnitt, og n er utvalgets størrelse. I lys av ovenstående beregnes standardavviket for utvalget som:

Forskjeller mellom populasjons- og utvalgsstandardavvik

Begrunnelse for å dele med n – 1 i stedet for n

Et vanlig spørsmål som dukker opp når man sammenligner populasjons- og utvalgsstandardavvik er hvorfor dividere med n – 1 og ikke med n ? Grunnen er veldig enkel.

Som tidligere nevnt søker beregningen av statistikk som utvalgets standardavvik å etablere estimatorer som er så nær de respektive populasjonsparametrene som mulig. Dette betyr at utvalgets standardavvik skal beregnes på en slik måte at resultatet er nærmest mulig populasjonsstandardavviket.

Dette tilsier at de bør beregnes med ekvivalente formler, men dette er ikke alltid tilfelle. Problemet er at utvalgets standardavvik måler spredningen rundt utvalgets gjennomsnitt, ikke populasjonsgjennomsnittet. Selv om utvalgets gjennomsnitt er en statistikk som brukes som en estimator av populasjonsgjennomsnittet, er det ikke helt likt det. Dette fører til at de individuelle verdiene i hvert utvalg er nærmere utvalgets gjennomsnitt (som faktisk er målet for sentral tendens for disse dataene) enn populasjonsgjennomsnittet. Forfall,

For å korrigere for dette avviket trekkes én enhet fra nevneren for å gjøre utvalgets standardavvik større, og derfor nærmere populasjonsstandardavviket.

Forskjell 3: De er sjelden like

Uansett hvilke korrigeringer som kan gjøres på utvalgets standardavvik, er det sjelden lik populasjonsstandardavviket. Dette er fordi data innenfor en populasjon kan variere tilfeldig, så forskjellige utvalg vil resultere i forskjellige standardavvik. Faktisk er det en hel fordeling av mulige verdier av prøvestandardavvikene avhengig av størrelsen på prøven.

Differanse 4: Utvalgets standardavvik kan alltid være kjent eller bestemt, mens populasjonsstandardavviket nesten aldri er kjent med sikkerhet.

En annen viktig forskjell mellom disse to spredningsmålene er at populasjonsstandardavviket (og faktisk en hvilken som helst populasjonsparameter) sjelden er kjent. Dette skyldes, i noen tilfeller, tekniske eller økonomiske begrensninger, siden det er svært kostbart, og dessuten er det usannsynlig å kunne måle absolutt alle dataene til en populasjon. I andre tilfeller er det rett og slett umulig å bestemme populasjonsparametrene, enten fordi populasjonen er uendelig, eller rett og slett fordi vi ikke har tilgang til alle elementene som utgjør den.

Med andre ord, vi kjenner nesten aldri alle N- verdiene til x i i en populasjon, noe som gjør det umulig å beregne populasjonsmiddelverdien, variansen og i forlengelsen av standardavviket. Det beste vi kan få vite er et punktestimat av en parameter som standardavviket, eller et intervall av verdier som vi har en viss grad av tillit til at standardavviket eller en annen populasjonsparameter ligger innenfor.

Når det gjelder prøver, derimot, kjenner vi alle dataene, så vi kan alltid beregne standardavviket til ethvert utvalg, uansett størrelse.

Oppsummering av forskjeller mellom populasjons- og utvalgsstandardavvik

Følgende tabell oppsummerer forskjellene mellom populasjonsstandardavviket og utvalgets standardavvik diskutert i de foregående avsnittene:

Karakteristisk Populasjonsstandardavvik Eksempel på standardavvik
Symbol σ ja
Det er beregnet for befolkningsdata eksempeldata
Den grenen av statistikken den brukes i Beskrivende statistikk inferensiell statistikk
Type tiltak Parameter Statistisk
Formel Del på N, størrelsen på befolkningen Del på n – 1, der n er prøvestørrelsen
Variabilitet Det er fastsatt for en gitt befolkning på et gitt tidspunkt Varierer fra utvalg til utvalg, uavhengig av om prøvene er av samme størrelse og trukket fra samme populasjon
Sikkerhet i verdien Det er generelt ukjent. Bare et estimat av det er tilgjengelig. Det er kjent for hver prøve

Referanser

Felles læringssentre. (nd). Standardavviket . http://www.cca.org.mx/cca/cursos/estadistica/html/m11/desviacion_estandar.htm

Levy Sarfin, R. (sf). Hva er forskjellen mellom utvalget og populasjonens standardavvik . Stemmen. https://pyme.lavoztx.com/what-is-the-difference-entre-la-sample-and-the-standard-deviation-of-the-population-5641.html

MateMobile. (2021, 1. januar). Varians og standardavvik, eksempler og øvelser . https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/

Molina, M. (2016, 27. januar). Hvorfor spare en? Estimering av populasjonsparametere . Bedøve. https://anestesiar.org/2016/por-que-sobra-uno-estimando-parametros-de-la-poblacion/

Serra, BR (2020, 26. oktober). Typisk eller standardavvik . Universformler. https://www.universoformulas.com/estadistica/descriptiva/desviacion-típica/

-Annonse-

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados