Tabla de Contenidos
La varianza e la deviazione standard sono due termini di grande importanza, sia in statistica che in tutte le branche della scienza e dell’ingegneria. Entrambe sono misure di dispersione rispetto a un valore centrale, ma a seconda del contesto in cui vengono utilizzate possono essere definite in modi diversi.
Nei campi della statistica e della probabilità, la varianza e la deviazione standard misurano quanto i valori di una variabile casuale (rappresentata quasi sempre dalla lettera X) differiscono dal suo valore medio.
Tuttavia, quando questi termini sono usati nella scienza o nell’ingegneria, la varianza e la deviazione standard si riferiscono alla dispersione di una serie di dati, di un’intera popolazione o di un campione, attorno alla media della popolazione o del campione. La deviazione standard di una serie di misurazioni ripetitive utilizzando lo stesso strumento di misura viene spesso utilizzata anche per dare un’idea del livello di precisione di detto strumento.
Nel primo caso la varianza e la deviazione standard misurano la variabilità di una variabile casuale, mentre nel secondo misurano la dispersione dei dati sperimentali. In entrambi i casi, una varianza o deviazione standard pari a zero indica nessuna variazione (la variabile casuale è in realtà costante, oppure i dati sono tutti esattamente gli stessi), mentre un valore elevato indica il contrario.
Questi due termini sono strettamente correlati e talvolta possono essere confusi tra loro, tuttavia ci sono differenze fondamentali tra i due che vedremo subito.
Differenze tra varianza e deviazione standard
1. Hanno definizioni diverse
La prima differenza tra questi due termini statistici è la loro definizione:
Definizione di varianza
In statistica, la varianza è definita come il valore atteso del quadrato della differenza tra il valore di una variabile casuale e il suo valore medio.
Matematicamente, questo è scritto come:
In modo un po’ meno formale, può anche essere definito come la media dei quadrati delle differenze tra i singoli dati di una serie di dati (popolazione o campione) e il suo valore medio.
Definizione di deviazione standard
Indipendentemente dal contesto in cui viene utilizzata, la deviazione standard, nota anche come deviazione standard, è definita come la radice quadrata positiva della varianza.
Matematicamente, questo è scritto come:
2. Sono rappresentati con simboli diversi
La varianza e la deviazione standard sono rappresentate in modi diversi sia nei testi statistici che nelle formule ed equazioni:
Varianza:
- σ 2 quando ci si riferisce alla varianza della popolazione
- S 2 quando si fa riferimento alla varianza campionaria
- Var(X) quando si fa riferimento alla varianza di una variabile casuale, in questo caso X.
Deviazione standard:
- σ quando si fa riferimento alla deviazione standard della popolazione
- S quando si fa riferimento alla deviazione standard del campione
- SD(X) quando si fa riferimento alla deviazione standard di una variabile casuale, in questo caso X.
3. Hanno formule diverse
Sia per la varianza che per la deviazione standard esistono due formule, a seconda che le serie di dati per le quali viene calcolata la varianza o la deviazione standard provengano da una popolazione o da un campione.
Formula della varianza della popolazione (σ 2 )
In una delle due formule per la varianza della popolazione, μ rappresenta la media della popolazione, X i rappresenta l’i-esimo valore dei dati della popolazione e N rappresenta la dimensione della popolazione o il numero totale di punti dati.
Formula della varianza campionaria (S 2 )
Qui, x-bar rappresenta la media dei dati del campione (media del campione), x i rappresenta il valore dell’iesimo dato del campione e n rappresenta la dimensione o il numero totale di dati nel campione.
Formula della deviazione standard della popolazione (σ)
Nel caso della deviazione standard, essa può essere calcolata in tre modi diversi:
Esempi di formule di deviazione standard
Anche in questo caso è possibile utilizzare uno dei tre diversi modi:
Una nota va fatta rispetto alle ultime due formule. È comune che, quando si calcola la deviazione standard, si calcoli prima la varianza e poi si estragga la radice quadrata. La deviazione standard viene raramente determinata utilizzando le ultime equazioni senza calcolare prima la varianza, quindi la prima precede quasi sempre la seconda.
4. Hanno unità diverse
Sia le unità della varianza che della deviazione standard dipendono dalla natura e dalle unità dei dati o dalla variabile casuale a cui si riferiscono, tuttavia le unità sono diverse in ciascun caso.
La deviazione standard ha le stesse unità dei dati originali o della variabile casuale, mentre la varianza è espressa in queste unità al quadrato.
Esempio:
Se si dispone dei dati dei pesi in chilogrammi (kg) di un campione di studenti di terza media in un determinato istituto scolastico, allora la varianza di tali dati avrà unità di kg 2 mentre la deviazione standard sarà espressa in kg .
5. Differiscono nella loro interpretazione
Sia per la varianza che per la deviazione standard l’interpretazione è la stessa di quella già citata: se valgono zero allora non c’è dispersione e tutti i dati sono esattamente uguali tra loro; se sono valori piccoli allora ci sarà poca dispersione e se sono grandi ci sarà molta dispersione.
Tuttavia, quando si comprende cosa significa essere un valore grande o piccolo, i valori di deviazione standard sono molto più facili da interpretare rispetto ai valori di varianza, poiché sono nelle stesse unità dei dati. Questo non è così semplice nel caso della varianza.
6. Differiscono nella loro sensibilità ai valori estremi
In quanto misure di dispersione, sia la varianza che la deviazione standard soffrono di sensibilità all’esistenza di valori estremi (molto alti o molto bassi). Ciò significa che quando si descrive una serie di dati in cui tutti i dati sono molto simili tranne uno che è molto più grande o più piccolo degli altri, né la varianza né la deviazione standard rappresenteranno bene la diffusione dei dati (entrambe daranno valori grandi nonostante la stragrande maggioranza dei dati mostri una dispersione molto ridotta).
Tuttavia, quando si confronta la varianza con la deviazione standard, la varianza è molto più sensibile a questi valori anomali poiché tutte le deviazioni sono al quadrato, mentre la deviazione standard no.
7. Differiscono nelle loro proprietà matematiche
L’ultima differenza che esamineremo in realtà comprende diverse differenze molto più profonde che sono importanti principalmente per gli statistici (o per coloro che studiano statistica).
In quanto funzioni matematiche, la varianza e la deviazione standard differiscono in termini di effetto della moltiplicazione dei dati per una costante, effetto dell’aggiunta di costanti, aggiunta di variabili casuali, elevazione a potenze e così via.
Queste differenze, tuttavia, esulano dall’ambito di questo articolo.
Esempio di calcolo della varianza e della deviazione standard
Supponiamo di pesare un campione di 12 tori di un produttore locale. I pesi, in chili, sono presentati di seguito:
507 | 497 | 510 | 508 | 491 | 510 |
500 | 509 | 496 | 491 | 505 | 503 |
Ti viene chiesto di determinare la varianza e la deviazione standard di questo campione.
SOLUZIONE
Come accennato in precedenza, quando si dispone di una serie di dati, è conveniente determinare prima la varianza e quindi la deviazione standard.
Calcolo della varianza campionaria (S 2 )
Useremo la seconda formula di varianza campionaria, poiché è più pratica. Per fare ciò, vengono seguiti i seguenti passaggi:
- Passaggio 1: viene creato un elenco verticale di tutti i dati
- Passaggio 2: il quadrato di ciascun dato viene calcolato e scritto accanto ad esso in una nuova colonna.
- Passaggio 3: tutti i dati vengono aggiunti e il risultato viene registrato alla fine della prima colonna.
- Passaggio 4: Somma tutti i quadrati e scrivi il risultato in fondo alla seconda colonna.
Questi primi 5 passi sono riassunti nella seguente tabella:
X i | x io 2 |
500 | 250000 |
509 | 259081 |
496 | 246016 |
491 | 241081 |
505 | 255025 |
503 | 253009 |
507 | 257049 |
497 | 247009 |
510 | 260100 |
508 | 258064 |
491 | 241081 |
510 | 260100 |
∑Xi_ _ | ∑X io 2 |
6027 | 3027615 |
- Passaggio 5: la formula viene utilizzata per calcolare la varianza:
Quindi la varianza campionaria è approssimativamente S 2 = 50 kg 2 .
Calcolo della deviazione standard del campione (S)
Ora che abbiamo la varianza, calcolare la deviazione standard è semplice come prendere la radice quadrata della prima:
Come si vede, il confronto della deviazione standard, che è di 7 chili, con il peso medio dei tori, che è di 502,25 chili (calcolati a parte), ci permette di concludere che questo campione ha una bassa dispersione, dato che è solo 1,4% del peso medio dei rialzisti.
Riferimenti
Espinoza, CI, & Echecopar, AL (2020). Applicazioni statistiche che utilizzano MS Excel con esempi passo-passo (edizione spagnola) (1a ed .). Lima, Perù: Luis Felipe Arizmendi Echecopar e Duo Negocios SAC.
Investopedia. (2021, 16 aprile). Scopri come viene determinata la deviazione standard utilizzando la varianza. Estratto il 24 luglio 2021 da https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp
Lopez, JF (18 novembre 2017). Varianza . Estratto da https://economipedia.com/definiciones/varianza.html
Istituto nazionale di standard e tecnologia. (nd). Definizioni fondamentali di incertezza. Estratto il 24 luglio 2021 da https://physics.nist.gov/cuu/Uncertainty/basic.html
Webster, A. (2001). Statistiche applicate alle imprese e all’economia (edizione spagnola) . Toronto, Canada: Irwin Professional Publishing.