Tabla de Contenidos
Standardavvikelsen, representerad antingen av den grekiska bokstaven σ (sigma) eller av bokstaven S , är ett mått på variabiliteten hos en dataserie. Närmare bestämt representerar det ett mått på de genomsnittliga avvikelserna för data från ett urval eller en population med avseende på populationsmedelvärdet, vilket indikerar hur spridd data är kring nämnda centrala tendensvärde.
En hög standardavvikelse indikerar att data i genomsnitt är långt ifrån medelvärdet i båda riktningarna (data är mycket spridda), medan en liten standardavvikelse indikerar motsatsen.
Standardavvikelsen beräknas alltid som kvadratroten av ett annat mått på variabilitet, som kallas variansen. Det finns flera sätt att beräkna variansen beroende på vilken typ av data som finns tillgänglig (urval eller population), vilket resulterar i mer än ett sätt att beräkna standardavvikelsen.
I båda fallen används lite olika formler, som beskrivs i nästa avsnitt. Nedan beskrivs hur man beräknar var och en av dem steg för steg och ”för hand”. Den beskriver också hur man använder miniräknare med statistiska funktioner och kalkylblad som Excel eller Google Sheets för att beräkna denna viktiga statistiska variabel.
Det finns två typer av standardavvikelse
I statistiken finns det två typer av beskrivande mått på en dataserie, beroende på om alla data från en population eller bara de från ett urval är tillgängliga. De mått som används för att beskriva populationen kallas populationsparametrar och representeras vanligtvis med grekiska bokstäver. Samtidigt kallas parametrarna som beskriver ett urval statistik och representeras vanligtvis med små bokstäver.
Med tanke på detta finns det två typer av standardavvikelse:
- Populationsstandardavvikelsen , som är en populationsparameter som representeras av den grekiska bokstaven σ (små bokstäver) .
- Provets standardavvikelse , som är en statistisk parameter som representeras av bokstaven S.
Nedan finns formlerna för att beräkna båda typerna av standardavvikelse.
Formler för att beräkna populationens standardavvikelse σ
I dessa ekvationer representerar x i värdet av varje enskild datapost, μ är populationsmedelvärdet och n är det totala antalet dataobjekt i populationen.
Formler för att beräkna provets standardavvikelse S
I dessa ekvationer representerar x i värdet av varje enskild datapost i urvalet, ¯x är sampelmedelvärdet och n är det totala antalet dataobjekt i urvalet.
Den enda verkliga skillnaden i hur de två standardavvikelserna beräknas är att den i ett fall delas med n, medan den i det andra delas med n – 1 . Det senare är att korrigera skillnaden mellan urvalsmedelvärde och populationsmedelvärde, som vanligtvis inte är desamma.
Vilken formel ska användas?
Det enda man bör tänka på när man avgör vilken av formlerna som ska användas är om de data för vilka standardavvikelsen ska beräknas representerar all data i en population eller bara representerar ett urval. Detta framgår vanligtvis av uttalandet (om ett statistiskt problem håller på att lösas) eller av hur data erhölls.
TIPS: När du är osäker är det säkrast att anta att detta är ett urval, eftersom du sällan har all data för en population.
När det gäller att använda den första (den till vänster) eller den andra (den till höger) formeln för σ eller för S, ger i båda fallen de två visade ekvationerna samma resultat. Det är dock mer praktiskt att använda formeln till höger, även om det kan tyckas mer komplicerat. Anledningen är mycket enkel: färre steg krävs för att beräkna standardavvikelsen med formlerna till höger än med de till vänster.
Hur man beräknar standardavvikelsen ”för hand”
Nedan presenterar vi stegen som måste utföras för att beräkna standardavvikelsen, med hjälp av ett exempel för att illustrera processen.
Problem
Tiden som ett prov på 15 bilar tog att fylla bränsletanken på en bensinstation fastställdes. Data, mätt i sekunder, presenteras nedan:
71 | 65 | 48 | 76 | 80 |
64 | 42 | 55 | 80 | 66 |
53 | 49 | 70 | 67 | 42 |
Bestäm standardavvikelsen.
Lösning: i det här fallet specificerar uttalandet att data motsvarar ett urval, så ekvationen vi kommer att använda för att bestämma standardavvikelsen (prov) kommer att vara:
För att tillämpa denna formel behöver vi bara beräkna summan av data (∑X i ), summan av kvadraterna av datan (∑X i 2 ) och det totala antalet data (n). Detta görs enkelt genom följande steg:
Steg 1: Organisera data vertikalt
Att beräkna standardavvikelsen är enklare om du har dina data ordnade i en vertikal lista, eftersom det gör nästa steg enklare. Det är inte strikt nödvändigt, men det hjälper också att ha varje datapost identifierad med ett nummer, eftersom det enkelt ger det totala antalet dataobjekt (n) som är nödvändigt för att formeln ska kunna användas. Uppgifterna behöver inte beställas på något sätt.
# | Xi _ | x i 2 |
1 | 71 | |
2 | 65 | |
3 | 48 | |
4 | 76 | |
5 | 80 | |
6 | 64 | |
7 | 42 | |
8 | 55 | |
9 | 80 | |
10 | 66 | |
elva | 53 | |
12 | 49 | |
13 | 70 | |
14 | 67 | |
femton | 42 |
Steg 2: beräkna kvadraten av varje data
Nästa steg är att kvadrera varje enskild datapost och sedan skriva resultatet i en kolumn bredvid.
# | Xi _ | x i 2 |
1 | 71 | 5041 |
2 | 65 | 4225 |
3 | 48 | 2304 |
4 | 76 | 5776 |
5 | 80 | 6400 |
6 | 64 | 4096 |
7 | 42 | 1764 |
8 | 55 | 3025 |
9 | 80 | 6400 |
10 | 66 | 4356 |
elva | 53 | 2809 |
12 | 49 | 2401 |
13 | 70 | 4900 |
14 | 67 | 4489 |
femton | 42 | 1764 |
Steg 3: Summa all originaldata
Vi lägger till alla värden som visas i kolumnen som vi identifierar som X i och skriver ner resultatet i slutet av den kolumnen.
Steg 4: Lägg till alla kvadrater av data och skriv resultatet längst ner i kolumnen
Vi lägger till alla värden som visas i kolumnen som vi identifierar som X i 2 och skriver ner resultatet i slutet av den kolumnen. Efter att ha utfört steg 3 och 4 kommer tabellen att se ut så här:
# | Xi _ | x i 2 |
1 | 71 | 5041 |
2 | 65 | 4225 |
3 | 48 | 2304 |
4 | 76 | 5776 |
5 | 80 | 6400 |
6 | 64 | 4096 |
7 | 42 | 1764 |
8 | 55 | 3025 |
9 | 80 | 6400 |
10 | 66 | 4356 |
elva | 53 | 2809 |
12 | 49 | 2401 |
13 | 70 | 4900 |
14 | 67 | 4489 |
femton | 42 | 1764 |
Antal data (n) | Summa av data ( ∑X i ) | Summan av kvadrater ( ∑X i 2 ) |
femton | 928 | 59750 |
Steg 5: Tillämpa standardavvikelsens formel
Det sista steget är helt enkelt att ersätta värdena i slutet av tabellen i respektive formel:
Hur man beräknar standardavvikelse med statistisk kalkylator
De flesta vetenskapliga och finansiella räknare har speciella funktioner för att underlätta beräkningen av alla mått på central tendens och spridning som används i statistik. Tillvägagångssättet, oavsett modell av räknaren, är alltid detsamma:
Steg 1 – Gå in i statistikläge
Miniräknare har vanligtvis ett speciellt läge för statistiska funktioner. Den nås vanligtvis genom att trycka på MODE- knappen följt av en siffra som vanligtvis visas på skärmen bredvid STAT , SD (för standardavvikelse ) eller något liknande.
Steg 2 – Rensa upp minnet
På äldre miniräknare visas inte om det redan finns data lagrade i räknarens minne eller inte, så det är alltid en bra idé att rensa minnet innan du börjar. För att göra detta, tryck på CLR- eller MCL- tangenten och välj sedan alternativet MODE (detta raderar endast data som lagrats i statistikläget). I många fall är det nödvändigt att återgå till statistikläget efter detta steg.
Steg 3: ange alla uppgifter
Alla data matas in sekventiellt, en efter en, genom att trycka på DT , DATA -tangenten eller liknande däremellan.
Steg 4: få resultatet
Det sista steget är helt enkelt att be räknaren om standardavvikelsen. Var resultaten finns varierar mycket mellan modeller och märken av räknare. I vissa måste du trycka på SHIFT -tangenten följt av tangenten som säger S-VAR ovan , i andra är det annorlunda. Det är tillrådligt att hänvisa till manualen för räknaren.
När vi får rätt meny måste vi välja vilken av de två standardavvikelserna vi behöver. Om det är populationsdata väljer vi alternativet som säger σ eller σ(n). Om det är exempeldata väljer vi alternativet som säger σ(n-1) eller S.
Hur man beräknar standardavvikelse i Microsoft® Excel™
Det enklaste sättet att beräkna standardavvikelsen är genom kalkylblad som Excel eller Google Sheets. Dessa program har redan alla protokoll för att beräkna de olika statistiska variablerna som vi kan behöva. Detta görs i två enkla steg:
Steg 1: klistra in eller lägg till data
Detta är så enkelt som att kopiera data direkt, en efter en till separata celler (i form av kolumner, rader eller matriser, det spelar ingen roll vad). I fallet med vårt exempel:
STEG 2: Skriv formeln för standardavvikelsen vi behöver
Detta beror på vilket kalkylblad som används och vilket språk det är inställt på. När det gäller Microsoft® Excel™, spansk version, är formlerna för standardavvikelsen:
Exempel på standardavvikelse (S): | =STDEV.M(data 1; data 2;…;data n) |
Populationsstandardavvikelse (σ): | =STDEV.P(data 1; data 2;…;data n) |
Du behöver inte ange de individuella uppgifterna, välj bara de celler som uppgifterna redan har klistrats in i. I vårt exempel ligger data i intervallet från cell B1 till cell F3, vilket skrivs som B2:F3.
Slutligen trycks ENTER -tangenten och KLAR! Standardavvikelsen erhålls.
Referenser
- Bhandari, P. (2021, 21 januari). Förstå och beräkna standardavvikelse . Hämtad från https://www.scribbr.com/statistics/standard-deviation/
- Espinoza, CI, & Echecopar, AL (2020). Statistiska applikationer som använder MS Excel med steg-för-steg-exempel (spanska upplagan) ( första upplagan ). Lima, Peru: Luis Felipe Arizmendi Echecopar och Duo Negocios SAC.
- Webster, A. (2001). Statistik tillämpad på företag och ekonomi (spanska upplagan) . Toronto, Kanada: Irwin Professional Publishing.
- DEVESTA (DEVESTA-funktion) . Microsoft Office-stöd. Hämtad från https://support.microsoft.com/es-es/office/desvesta-funci%C3%B3n-desvesta-5ff38888-7ea5-48de-9a6d-11ed73b29e9d .