La varianza è la misura di dispersione più utilizzata, insieme alla deviazione standard. È una misura affidabile quando si analizzano i dati di una distribuzione. Confrontandola con la media, è possibile riconoscere la presenza di valori anomali o di dati distanti.
Scopriamo di più su questa misura, le sue caratteristiche, i suoi vantaggi e come calcolarla.
Cos’è la varianza
La varianza è una misura di dispersione che rappresenta la variabilità di una serie di dati rispetto alla sua media.
Formalmente, viene calcolata come la somma dei quadrati dei residui divisa per il totale delle osservazioni.
Può anche essere calcolato come la deviazione standard al quadrato.
Per inciso, intendiamo il residuo come la differenza tra il valore di una variabile alla volta e il valore medio dell’intera variabile.
Il calcolo della varianza è necessario per calcolare la deviazione standard.
Potresti essere interessato a sapere cosa sono la media, la mediana e la modalità.
Vantaggi e svantaggi della varianza
La varianza viene utilizzata per vedere come i singoli numeri all’interno di un insieme di dati sono correlati, piuttosto che utilizzare tecniche matematiche più ampie.
Si distingue anche per il fatto di trattare tutte le deviazioni dalla media come se fossero uguali, indipendentemente dalla loro direzione.
Gli scarti al quadrato non possono sommarsi a zero e danno l’impressione che non ci sia variabilità nei dati.
Tuttavia, uno svantaggio è che dà più peso agli outlier.
Si tratta di numeri che si allontanano dalla media.
La quadratura di questi numeri può distorcere i dati.
Un altro svantaggio dell’uso della varianza è che non è facile da interpretare.
Si usa principalmente per prendere la radice quadrata del suo valore, che indica la deviazione standard dei dati.
Esempio di varianza
Ecco un esempio ipotetico per dimostrare come funziona la varianza, in questo caso in finanza.
Supponiamo che i rendimenti delle azioni della società ABC siano del 10% nel primo anno, del 20% nel secondo anno e del -15% nel terzo anno.
La media di questi tre rendimenti è del 5%.
Le differenze tra ogni rendimento e la media sono del 5%, 15% e -20% per ogni anno consecutivo.
Elevando al quadrato questi scarti si ottiene rispettivamente lo 0,25%, il 2,25% e il 4,00%.
Elevando al quadrato questi scarti, otteniamo un totale di 6,5%.
Se dividiamo la somma del 6,5% per uno meno il numero di rendimenti della serie di dati, dato che si tratta di un campione (2 = 3-1), otteniamo una varianza del 3,25% (0,0325).
Prendendo la radice quadrata della varianza si ottiene una deviazione standard del 18% (√0,0325 = 0,180) per i rendimenti.
Come si calcola la varianza
Segui questi passaggi per calcolare la varianza:
- Calcola la media dei dati.
- Trova la differenza di ogni punto di dati dal valore medio.
- Piazza ciascuno di questi valori.
- Somma tutti i valori al quadrato.
- Dividi questa somma di quadrati per n – 1 (per un campione) o N (per la popolazione).
Formula per il calcolo della varianza
Prima di esaminare la formula, va detto che la varianza in statistica è molto importante.
Infatti, sebbene sia una misura semplice, può fornire molte informazioni su una particolare variabile.
L’unità di misura è sempre quella corrispondente ai dati ma al quadrato.
La varianza è sempre maggiore o uguale a zero.
Poiché i residui sono al quadrato, è matematicamente impossibile che la varianza sia negativa.
Pertanto, non può essere inferiore a zero.
Qual è la differenza tra varianza e deviazione standard?
In realtà, entrambi misurano la stessa cosa.
La varianza è la deviazione standard al quadrato.
O al contrario, la deviazione standard è la radice quadrata della varianza.
La deviazione standard viene fatta funzionare nelle unità di misura originali.
Ovviamente, dato che questo è normale, ci si chiede a cosa serva la varianza come concetto.
Ebbene, sebbene l’interpretazione del valore che restituisce non ci dia molte informazioni, il suo calcolo è necessario per ottenere il valore degli altri parametri.
Per calcolare la covarianza abbiamo bisogno della varianza e non della deviazione standard, mentre per calcolare alcune matrici econometriche usiamo la varianza e non la deviazione standard.
Si tratta di una questione di comodità nel lavorare con i dati a seconda dei calcoli.
Perché la deviazione standard viene spesso utilizzata più della varianza?
La deviazione standard è la radice quadrata della varianza.
A volte è più utile, perché la radice quadrata elimina le unità dall’analisi.
In questo modo è possibile fare confronti diretti tra elementi diversi che possono avere unità o grandezze diverse.
Ad esempio, dire che l’aumento di X di un’unità aumenta Y di due deviazioni standard permette di comprendere la relazione tra X e Y indipendentemente dalle unità in cui sono espressi.
Conclusione
La varianza viene utilizzata in statistica e probabilità come misura per caratterizzare la dispersione di una distribuzione o di un campione.
In particolare, è definita come la media dei quadrati delle deviazioni dalla media.
Prendendo in considerazione il quadrato di queste deviazioni si evita che le deviazioni positive e negative si annullino a vicenda.
Visivamente, una distribuzione con una grande varianza sarà più diffusa, mentre una distribuzione con una piccola varianza sarà molto stretta intorno alla sua media.
Ricorda che abbiamo anche altri strumenti come la calcolatore di campioni e, naturalmente, la nostra piattaforma di sondaggi online. Crea subito il tuo account!