Tabla de Contenidos
Varianta și abaterea standard sunt doi termeni de mare importanță, atât în statistică, cât și în toate ramurile științei și ingineriei. Ambele sunt măsuri de dispersie în raport cu o valoare centrală, dar în funcție de contextul în care sunt utilizate, pot fi definite în moduri diferite.
În domeniile statistică și probabilitate, varianța și abaterea standard măsoară cât de mult diferă valorile unei variabile aleatoare (reprezentate aproape întotdeauna prin litera X) de valoarea lor medie.
Cu toate acestea, atunci când acești termeni sunt utilizați în știință sau inginerie, varianța și abaterea standard se referă la dispersia unei serii de date, fie a unei întregi populații, fie a unui eșantion, în jurul mediei populației sau eșantionului. Deviația standard a unei serii de măsurători repetitive folosind același instrument de măsurare este, de asemenea, adesea folosită pentru a da o idee despre nivelul de precizie al instrumentului menționat.
În primul caz, varianța și abaterea standard măsoară variabilitatea unei variabile aleatoare, în timp ce în al doilea măsoară dispersia datelor experimentale. În ambele cazuri, o varianță sau o abatere standard de zero indică nicio variație (variabila aleatoare este de fapt constantă, sau datele sunt exact aceleași), în timp ce o valoare mare indică contrariul.
Acești doi termeni sunt strâns legați și uneori pot fi confundați unul cu celălalt, totuși există diferențe cheie între cei doi la care vom ajunge imediat.
Diferențele dintre variație și abaterea standard
1. Au definiții diferite
Prima diferență între acești doi termeni statistici este definiția lor:
Definiţia variance
În statistică, varianța este definită ca valoarea așteptată a pătratului diferenței dintre valoarea unei variabile aleatoare și valoarea medie a acesteia.
Din punct de vedere matematic, aceasta este scrisă astfel:
Într-un mod puțin mai puțin formal, poate fi definit și ca media pătratelor diferențelor dintre datele individuale ale unei serii de date (populație sau eșantion) și valoarea medie a acesteia.
Definiția deviației standard
Indiferent de contextul în care este utilizată, abaterea standard, cunoscută și sub denumirea de abatere standard, este definită ca rădăcina pătrată pozitivă a varianței.
Din punct de vedere matematic, aceasta este scrisă astfel:
2. Sunt reprezentate cu simboluri diferite
Varianta și abaterea standard sunt reprezentate în moduri diferite atât în textele de statistică, cât și în formule și ecuații:
Varianta:
- σ 2 când ne referim la varianța populației
- S 2 când se face referire la varianța eșantionului
- Var(X) când ne referim la varianța unei variabile aleatoare, în acest caz X.
Deviație standard:
- σ când se face referire la abaterea standard a populației
- S când se face referire la deviația standard a eșantionului
- SD(X) când se face referire la abaterea standard a unei variabile aleatoare, în acest caz X.
3. Au formule diferite
Atât pentru varianță, cât și pentru abaterea standard, există două formule, în funcție de faptul dacă seriile de date pentru care se calculează varianța sau abaterea standard sunt date dintr-o populație sau dintr-un eșantion.
Formula varianței populației (σ 2 )
În oricare dintre cele două formule pentru varianța populației, μ reprezintă media populației, X i reprezintă a i-a valoare a datelor populației și N reprezintă dimensiunea populației sau numărul total de puncte de date.
Formula de varianță eșantion (S 2 )
Aici, x-bar reprezintă media datelor eșantionului (media eșantionului), x i reprezintă valoarea celui de-al i-lea eșantion de date și n reprezintă dimensiunea sau numărul total de date din eșantion.
Formula abaterii standard a populației (σ)
În cazul abaterii standard, aceasta poate fi calculată în trei moduri diferite:
Exemplu de formule a abaterii standard (e)
Și aici poate fi folosit unul dintre cele trei moduri diferite:
Trebuie făcută o notă cu privire la ultimele două formule. Este obișnuit ca, la calcularea abaterii standard, mai întâi să fie calculată varianța și apoi să se ia rădăcina pătrată. Abaterea standard este rareori determinată folosind ecuațiile din urmă fără a calcula mai întâi varianța, astfel încât prima o precedă aproape întotdeauna pe cea din urmă.
4. Au unități diferite
Atât unitățile varianței, cât și abaterea standard depind de natura și unitățile datelor sau de variabila aleatoare la care se referă, totuși, unitățile sunt diferite în fiecare caz.
Abaterea standard are aceleași unități ca datele originale sau variabila aleatoare, în timp ce varianța vine în aceste unități la pătrat.
Exemplu:
Dacă aveți datele greutăților în kilograme (kg) ale unui eșantion de elevi de clasa a VIII-a dintr-o anumită instituție de învățământ, atunci varianța acestor date va avea unități de kg 2 în timp ce abaterea standard va veni în kg .
5. Ele diferă în interpretarea lor
Atât pentru varianță, cât și pentru abaterea standard, interpretarea este aceeași cu cea menționată deja: dacă valorează zero, atunci nu există dispersie și toate datele sunt exact egale între ele; dacă sunt valori mici, atunci va fi puțin scatter și dacă sunt mari va fi mult scatter.
Cu toate acestea, atunci când înțelegeți ce înseamnă a fi o valoare mare sau mică, valorile abaterii standard sunt mult mai ușor de interpretat decât valorile varianței, deoarece sunt în aceleași unități cu datele. Acest lucru nu este atât de simplu în cazul variației.
6. Se deosebesc prin sensibilitatea la valorile extreme
Ca măsurători de dispersie, atât varianța, cât și abaterea standard suferă de sensibilitate la existența valorilor extreme (fie foarte mari, fie foarte scăzute). Aceasta înseamnă că atunci când se descrie o serie de date în care toate datele sunt foarte asemănătoare, cu excepția uneia care este mult mai mare sau mai mică decât celelalte, nici varianța și nici abaterea standard nu vor reprezenta bine răspândirea datelor (ambele vor da valori mari în ciuda faptului că marea majoritate a datelor arată o dispersie foarte mică).
Cu toate acestea, atunci când se compară varianța cu abaterea standard, varianța este mult mai sensibilă la aceste valori aberante, deoarece toate abaterile sunt la pătrat, în timp ce abaterea standard nu este.
7. Se deosebesc prin proprietățile lor matematice
Ultima diferență la care ne vom uita cuprinde de fapt câteva diferențe mult mai profunde care sunt importante în primul rând pentru statisticieni (sau cei care studiază statisticile).
Ca funcții matematice, varianța și abaterea standard diferă în ceea ce privește efectul înmulțirii datelor cu o constantă, efectul adunării constantelor, adunării variabilelor aleatoare împreună, ridicarea la puteri și așa mai departe.
Aceste diferențe sunt însă în afara domeniului de aplicare al acestui articol.
Exemplu de calcul a variației și a abaterii standard
Să presupunem că a fost cântărit un eșantion de 12 tauri de la un producător local. Greutățile, în kilograme, sunt prezentate mai jos:
507 | 497 | 510 | 508 | 491 | 510 |
500 | 509 | 496 | 491 | 505 | 503 |
Vi se cere să determinați varianța și abaterea standard a acestui eșantion.
SOLUŢIE
După cum sa menționat mai sus, atunci când aveți o serie de date, este convenabil să determinați mai întâi varianța și apoi abaterea standard.
Calculul varianței eșantionului (S 2 )
Vom folosi cea de-a doua formulă a variației eșantionului, deoarece este mai practică. Pentru a face acest lucru, se parcurg următorii pași:
- Pasul 1: Se face o listă verticală cu toate datele
- Pasul 2: Pătratul fiecărei date este calculat și scris lângă el într-o coloană nouă.
- Pasul 3: Toate datele sunt adăugate și rezultatul este înregistrat la sfârșitul primei coloane.
- Pasul 4: Adaugă toate pătratele și notează rezultatul la sfârșitul celei de-a doua coloane.
Acești primi 5 pași sunt rezumați în următorul tabel:
Xi _ | x i 2 |
500 | 250000 |
509 | 259081 |
496 | 246016 |
491 | 241081 |
505 | 255025 |
503 | 253009 |
507 | 257049 |
497 | 247009 |
510 | 260100 |
508 | 258064 |
491 | 241081 |
510 | 260100 |
∑Xi _ | ∑X i 2 |
6027 | 3027615 |
- Pasul 5: Formula este utilizată pentru a calcula varianța:
Deci varianța eșantionului este de aproximativ S 2 = 50 kg 2 .
Calculul abaterii standard a probei (S)
Acum că avem varianța, calcularea abaterii standard este la fel de simplă ca și luarea rădăcinii pătrate a primei:
După cum se poate observa, compararea abaterii standard, care este de 7 kg, cu greutatea medie a taurilor, care este de 502,25 kg (calculată separat), ne permite să concluzionăm că această probă are o dispersie scăzută, întrucât este doar 1,4% din greutatea medie a taurilor.
Referințe
Espinoza, CI și Echecopar, AL (2020). Aplicații statistice folosind MS Excel cu exemple pas cu pas (ediția în spaniolă) ( ed . I). Lima, Peru: Luis Felipe Arizmendi Echecopar și Duo Negocios SAC.
Investopedia. (2021, 16 aprilie). Aflați cum se determină abaterea standard utilizând variația. Preluat la 24 iulie 2021, de la https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp
Lopez, JF (18 noiembrie 2017). Varianta . Preluat de la https://economipedia.com/definiciones/varianza.html
Institutul Național de Standarde și Tehnologie. (nd). Definiții de bază ale incertitudinii. Preluat la 24 iulie 2021, de la https://physics.nist.gov/cuu/Uncertainty/basic.html
Webster, A. (2001). Statistici aplicate afacerilor și economiei (ediția în spaniolă) . Toronto, Canada: Irwin Professional Publishing.