Care este diferența dintre varianță și abaterea standard?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Varianta și abaterea standard sunt doi termeni de mare importanță, atât în ​​statistică, cât și în toate ramurile științei și ingineriei. Ambele sunt măsuri de dispersie în raport cu o valoare centrală, dar în funcție de contextul în care sunt utilizate, pot fi definite în moduri diferite.

În domeniile statistică și probabilitate, varianța și abaterea standard măsoară cât de mult diferă valorile unei variabile aleatoare (reprezentate aproape întotdeauna prin litera X) de valoarea lor medie.

Cu toate acestea, atunci când acești termeni sunt utilizați în știință sau inginerie, varianța și abaterea standard se referă la dispersia unei serii de date, fie a unei întregi populații, fie a unui eșantion, în jurul mediei populației sau eșantionului. Deviația standard a unei serii de măsurători repetitive folosind același instrument de măsurare este, de asemenea, adesea folosită pentru a da o idee despre nivelul de precizie al instrumentului menționat.

Abaterea standard a unei serii de măsurători repetitive oferă o idee despre nivelul de precizie al instrumentului de măsurare.

În primul caz, varianța și abaterea standard măsoară variabilitatea unei variabile aleatoare, în timp ce în al doilea măsoară dispersia datelor experimentale. În ambele cazuri, o varianță sau o abatere standard de zero indică nicio variație (variabila aleatoare este de fapt constantă, sau datele sunt exact aceleași), în timp ce o valoare mare indică contrariul.

Acești doi termeni sunt strâns legați și uneori pot fi confundați unul cu celălalt, totuși există diferențe cheie între cei doi la care vom ajunge imediat.

Diferențele dintre variație și abaterea standard

1. Au definiții diferite

Prima diferență între acești doi termeni statistici este definiția lor:

Definiţia variance

În statistică, varianța este definită ca valoarea așteptată a pătratului diferenței dintre valoarea unei variabile aleatoare și valoarea medie a acesteia.

Din punct de vedere matematic, aceasta este scrisă astfel:

Definiția statistică a varianței

Într-un mod puțin mai puțin formal, poate fi definit și ca media pătratelor diferențelor dintre datele individuale ale unei serii de date (populație sau eșantion) și valoarea medie a acesteia.

Definiția deviației standard

Indiferent de contextul în care este utilizată, abaterea standard, cunoscută și sub denumirea de abatere standard, este definită ca rădăcina pătrată pozitivă a varianței.

Din punct de vedere matematic, aceasta este scrisă astfel:

Definiția statistică a abaterii standard.

2. Sunt reprezentate cu simboluri diferite

Varianta și abaterea standard sunt reprezentate în moduri diferite atât în ​​textele de statistică, cât și în formule și ecuații:

Varianta:

  • σ 2 când ne referim la varianța populației
  • S 2 când se face referire la varianța eșantionului
  • Var(X) când ne referim la varianța unei variabile aleatoare, în acest caz X.

Deviație standard:

  • σ când se face referire la abaterea standard a populației
  • S când se face referire la deviația standard a eșantionului
  • SD(X) când se face referire la abaterea standard a unei variabile aleatoare, în acest caz X.

3. Au formule diferite

Atât pentru varianță, cât și pentru abaterea standard, există două formule, în funcție de faptul dacă seriile de date pentru care se calculează varianța sau abaterea standard sunt date dintr-o populație sau dintr-un eșantion.

Formula varianței populației (σ 2 )

Formule pentru varianța varianței populației

În oricare dintre cele două formule pentru varianța populației, μ reprezintă media populației, X i reprezintă a i-a valoare a datelor populației și N reprezintă dimensiunea populației sau numărul total de puncte de date.

Formula de varianță eșantion (S 2 )

formule pentru varianța eșantionului

Aici, x-bar reprezintă media datelor eșantionului (media eșantionului), x i reprezintă valoarea celui de-al i-lea eșantion de date și n reprezintă dimensiunea sau numărul total de date din eșantion.

Formula abaterii standard a populației (σ)

În cazul abaterii standard, aceasta poate fi calculată în trei moduri diferite:

Formula pentru abaterea standard a populației.

O altă formulă pentru abaterea standard a populației

Formula practică pentru abaterea standard a populației.

Exemplu de formule a abaterii standard (e)

Și aici poate fi folosit unul dintre cele trei moduri diferite:

Formula pentru abaterea standard a probei.

O altă formulă pentru abaterea standard a eșantionului.

Formula practică pentru abaterea standard a probei.

Trebuie făcută o notă cu privire la ultimele două formule. Este obișnuit ca, la calcularea abaterii standard, mai întâi să fie calculată varianța și apoi să se ia rădăcina pătrată. Abaterea standard este rareori determinată folosind ecuațiile din urmă fără a calcula mai întâi varianța, astfel încât prima o precedă aproape întotdeauna pe cea din urmă.

4. Au unități diferite

Atât unitățile varianței, cât și abaterea standard depind de natura și unitățile datelor sau de variabila aleatoare la care se referă, totuși, unitățile sunt diferite în fiecare caz.

Abaterea standard are aceleași unități ca datele originale sau variabila aleatoare, în timp ce varianța vine în aceste unități la pătrat.

Exemplu:

Dacă aveți datele greutăților în kilograme (kg) ale unui eșantion de elevi de clasa a VIII-a dintr-o anumită instituție de învățământ, atunci varianța acestor date va avea unități de kg 2 în timp ce abaterea standard va veni în kg .

5. Ele diferă în interpretarea lor

Atât pentru varianță, cât și pentru abaterea standard, interpretarea este aceeași cu cea menționată deja: dacă valorează zero, atunci nu există dispersie și toate datele sunt exact egale între ele; dacă sunt valori mici, atunci va fi puțin scatter și dacă sunt mari va fi mult scatter.

interpretarea varianței și a abaterii standard.

Cu toate acestea, atunci când înțelegeți ce înseamnă a fi o valoare mare sau mică, valorile abaterii standard sunt mult mai ușor de interpretat decât valorile varianței, deoarece sunt în aceleași unități cu datele. Acest lucru nu este atât de simplu în cazul variației.

6. Se deosebesc prin sensibilitatea la valorile extreme

Ca măsurători de dispersie, atât varianța, cât și abaterea standard suferă de sensibilitate la existența valorilor extreme (fie foarte mari, fie foarte scăzute). Aceasta înseamnă că atunci când se descrie o serie de date în care toate datele sunt foarte asemănătoare, cu excepția uneia care este mult mai mare sau mai mică decât celelalte, nici varianța și nici abaterea standard nu vor reprezenta bine răspândirea datelor (ambele vor da valori mari în ciuda faptului că marea majoritate a datelor arată o dispersie foarte mică).

Cu toate acestea, atunci când se compară varianța cu abaterea standard, varianța este mult mai sensibilă la aceste valori aberante, deoarece toate abaterile sunt la pătrat, în timp ce abaterea standard nu este.

7. Se deosebesc prin proprietățile lor matematice

Ultima diferență la care ne vom uita cuprinde de fapt câteva diferențe mult mai profunde care sunt importante în primul rând pentru statisticieni (sau cei care studiază statisticile).

Ca funcții matematice, varianța și abaterea standard diferă în ceea ce privește efectul înmulțirii datelor cu o constantă, efectul adunării constantelor, adunării variabilelor aleatoare împreună, ridicarea la puteri și așa mai departe.

Aceste diferențe sunt însă în afara domeniului de aplicare al acestui articol.

Exemplu de calcul a variației și a abaterii standard

Să presupunem că a fost cântărit un eșantion de 12 tauri de la un producător local. Greutățile, în kilograme, sunt prezentate mai jos:

507 497 510 508 491 510
500 509 496 491 505 503

Vi se cere să determinați varianța și abaterea standard a acestui eșantion.

SOLUŢIE

După cum sa menționat mai sus, atunci când aveți o serie de date, este convenabil să determinați mai întâi varianța și apoi abaterea standard.

Calculul varianței eșantionului (S 2 )

Vom folosi cea de-a doua formulă a variației eșantionului, deoarece este mai practică. Pentru a face acest lucru, se parcurg următorii pași:

  • Pasul 1: Se face o listă verticală cu toate datele
  • Pasul 2: Pătratul fiecărei date este calculat și scris lângă el într-o coloană nouă.
  • Pasul 3: Toate datele sunt adăugate și rezultatul este înregistrat la sfârșitul primei coloane.
  • Pasul 4: Adaugă toate pătratele și notează rezultatul la sfârșitul celei de-a doua coloane.

Acești primi 5 pași sunt rezumați în următorul tabel:

Xi _ x i 2
500 250000
509 259081
496 246016
491 241081
505 255025
503 253009
507 257049
497 247009
510 260100
508 258064
491 241081
510 260100
∑Xi _ ∑X i 2
6027 3027615
  • Pasul 5: Formula este utilizată pentru a calcula varianța:
Exemplu de calcul al variației eșantionului

Deci varianța eșantionului este de aproximativ S 2 = 50 kg 2 .

Calculul abaterii standard a probei (S)

Acum că avem varianța, calcularea abaterii standard este la fel de simplă ca și luarea rădăcinii pătrate a primei:

Exemplu de calcul al abaterii standard

După cum se poate observa, compararea abaterii standard, care este de 7 kg, cu greutatea medie a taurilor, care este de 502,25 kg (calculată separat), ne permite să concluzionăm că această probă are o dispersie scăzută, întrucât este doar 1,4% din greutatea medie a taurilor.

Referințe

Espinoza, CI și Echecopar, AL (2020). Aplicații statistice folosind MS Excel cu exemple pas cu pas (ediția în spaniolă) ( ed . I). Lima, Peru: Luis Felipe Arizmendi Echecopar și Duo Negocios SAC.

Investopedia. (2021, 16 aprilie). Aflați cum se determină abaterea standard utilizând variația. Preluat la 24 iulie 2021, de la https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp

Lopez, JF (18 noiembrie 2017). Varianta . Preluat de la https://economipedia.com/definiciones/varianza.html

Institutul Național de Standarde și Tehnologie. (nd). Definiții de bază ale incertitudinii. Preluat la 24 iulie 2021, de la https://physics.nist.gov/cuu/Uncertainty/basic.html

Webster, A. (2001). Statistici aplicate afacerilor și economiei (ediția în spaniolă) . Toronto, Canada: Irwin Professional Publishing.

-Publicitate-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados