A variação é a medida de dispersão mais comummente utilizada, juntamente com o desvio-padrão. É uma medida fiável quando se analisam dados de uma distribuição. Quando comparada com a média, pode ser reconhecida a presença de dados anómalos ou distantes.
Vamos saber mais sobre esta medida, as suas características, vantagens e como a calcular.
O que é a variância
A variância é uma medida de dispersão que representa a variabilidade de uma série de dados em relação à sua média. Formalmente, é calculado como a soma dos quadrados dos resíduos dividida pelo total de observações.
Também pode ser calculado como o desvio padrão ao quadrado. A propósito, entendemos o resíduo como a diferença entre o valor de uma variável de cada vez e o valor médio de toda a variável.
O cálculo da variância é necessário para calcular o desvio-padrão.
Podes estar interessado em saber o que são a média, a mediana e a moda.
Vantagens e desvantagens da variância
A variância é utilizada para ver como os números individuais de um conjunto de dados estão relacionados, em vez de utilizar técnicas matemáticas mais amplas.
Distingue-se também por tratar todos os desvios da média como se fossem iguais, independentemente da sua direção. Os desvios ao quadrado não podem ser iguais a zero e dão a impressão de que não existe variabilidade nos dados.
No entanto, uma desvantagem é que dá mais peso aos valores atípicos. Estes números estão longe da média. Se elevares estes números ao quadrado, os dados podem ficar distorcidos.
Outra desvantagem da utilização da variância é o facto de não ser fácil de interpretar. É utilizado principalmente para obter a raiz quadrada do seu valor, que indica o desvio padrão dos dados.
Exemplo de variância
Segue-se um exemplo hipotético para demonstrar como funciona a variância, neste caso na área das finanças. Considera que a rendibilidade das acções ABC é de 10% no primeiro ano, 20% no segundo ano e -15% no terceiro ano. A média destes três rendimentos é de 5%. As diferenças entre cada desempenho e a média são de 5%, 15% e -20% para cada ano consecutivo.
Ao quadrado destes desvios obtém-se 0,25%, 2,25% e 4,00%, respetivamente. Se somarmos estes desvios ao quadrado, obtemos um total de 6,5%. Dividindo a soma de 6,5% por um menos o número de retornos no conjunto de dados, uma vez que se trata de uma amostra (2 = 3-1), obtém uma variância de 3,25% (0,0325). Se tirares a raiz quadrada da variância, obténs um desvio padrão de 18% (√0,0325 = 0,180) para os rendimentos.
Como é calculada a variância
Segue estes passos para calcular a variância:
- Calcula a média dos dados.
- Encontra a diferença de cada ponto de dados em relação ao valor médio.
- Eleva ao quadrado cada um destes valores.
- Soma todos os valores ao quadrado.
- Divide esta soma de quadrados por n – 1 (para uma amostra) ou N (para a população).
Fórmula para calcular a variância
Antes de analisares a fórmula, é preciso dizer que a variância em estatística é muito importante. Porque, embora seja uma medida simples, pode fornecer muita informação sobre uma determinada variável.
A unidade de medida será sempre a unidade de medida correspondente aos dados, mas ao quadrado. A variância é sempre maior ou igual a zero. Uma vez que os resíduos são elevados ao quadrado, é matematicamente impossível que a variância seja negativa. E, portanto, não pode ser inferior a zero.
Qual é a diferença entre a variância e o desvio padrão?
Na realidade, ambos estão a medir a mesma coisa. A variância é o desvio padrão ao quadrado. Por outro lado, o desvio padrão é a raiz quadrada da variância.
O desvio padrão é operado nas unidades de medida originais. É claro que, dado que isto é normal, pergunta-se qual é o sentido da variância enquanto conceito. Bem, embora a interpretação do valor que devolve não nos dê muita informação, o seu cálculo é necessário para obter o valor dos outros parâmetros.
Para calcular a covariância precisamos da variância e não do desvio padrão, para calcular algumas matrizes econométricas usamos a variância e não o desvio padrão. Trata-se de uma questão de conveniência no trabalho com os dados, dependendo dos cálculos.Sabe também qual é o desvio médio.
Porque é que o desvio padrão é frequentemente mais utilizado do que a variância?
O desvio padrão é a raiz quadrada da variância. Por vezes, é mais útil, uma vez que a raiz quadrada elimina as unidades da análise. Isto permite fazer comparações directas entre coisas diferentes que podem ter unidades diferentes ou magnitudes diferentes.
Por exemplo, dizer que o aumento de uma unidade em X aumenta Y em dois desvios-padrão permite compreender a relação entre X e Y, independentemente das unidades em que são expressos.
Conclusão
A variância é utilizada em estatística e probabilidade como uma medida para caraterizar a dispersão de uma distribuição ou amostra. Especificamente, define-se como a média dos quadrados dos desvios da média. A tomada em consideração do quadrado destes desvios evita que os desvios positivos e negativos se anulem mutuamente.
Visualmente, uma distribuição com uma variância grande será mais espalhada, enquanto uma distribuição com uma variância pequena será muito apertada em torno da sua média.
Lembra-te que também temos outras ferramentas, como a calculadora de amostras e, claro, a nossa plataforma de inquéritos online. Cria a tua conta agora!