Análise da variabilidade de dados sempre cai nas provas de Enem e vestibulares. E não é por menos! Esse tema é muito importante e está presente em diversos estudos, desde a biologia até a sociologia. Sendo assim, vamos juntos aprender como fazer os cálculos?
A análise de dados é de extrema importância para compreender como se comportam as mais variadas populações, desde bactérias até populações de grandes cidades. O estudo dos comportamentos populacionais auxilia na compreensão do que está se passando no momento, bem como na previsão da maneira como essas populações vão se comportar.
As análises mais conhecidas são a média aritmética, a média ponderada e a mediana. Mas a partir destes dados podemos encontrar medidas de dispersão, como a variância e o desvio padrão, que trazem significados e conclusões bem específicas. Vamos estudar como fazer esses cálculos?
Ao calcularmos medidas de tendência como a média, mediana e moda, obtemos resultados médios de um grupo de dados. Mas esquecemos que dentre esses dados existe muita variabilidade de indivíduos e valores.
Medidas de dispersão
A variância e o desvio padrão são medidas de dispersão que permitem a análise da dispersão dos dados, ou seja, são utilizados para medir a dispersão “média” em torno da média aritmética. Através dessas medidas é possível observar e analisar como os dados se distribuem em torno da medida de tendência central.
A seguir, iremos entender como funcionam cada uma dessas medidas de dispersão e como calcular cada uma delas, mas antes sugiro que acesse esse resumo de estatística para que não restem dúvidas básicas. Ao final da aula, observe o exemplo onde calculamos a variância e o desvio padrão com o mesmo conjunto de dados.
Variância
Como dito anteriormente, tanto a variância quanto o desvio padrão analisam dados que estão flutuando em volta de um valor central, que no caso, é a média desses valores. Em específico, a variância permite que verifiquemos o quão próximos da média estão os valores. Quanto maior a variância, mais distantes da média estão os valores da amostra. E, caso contrário, quanto menor o valor da variância, mais próximo os dados da amostra estão da medida central.
Desvio padrão
O desvio padrão é a medida mais comum da dispersão estatística. O resultado traz informações importantes sobre o conjunto de dados. Um baixo desvio padrão indica que os dados tendem a estar próximos da média. Já um alto desvio padrão indica que os dados estão mais espalhados e distantes da média. O desvio padrão é o método mais conveniente no cálculo da dispersão.
Como calcular a variância e o desvio padrão?
O cálculo da variância populacional é dado a partir da soma dos quadrados da diferença entre cada valor, e a média aritmética dividida pela quantidade de elementos observados. Parece confuso ao ler dessa forma, mas você vai notar que é mais simples do que parece.
O desvio padrão de uma amostra (representado pela letra Sigma) é definido como sendo a raiz quadrada da variância da amostra.
Acompanhe os cálculos no exemplo abaixo.
Exemplo
A professora resolveu registrar em tabela as notas dos seus quatro melhores alunos (Ana, Bruno, Carol e Douglas) durante o ano para verificar o desempenho deles. Como o ano é dividido em quatro trimestres, as notas foram as seguintes:
Aluno | 1º trimestre | 2º trimestre | 3º trimestre | 4º trimestre |
A | 10 | 8 | 6 | 8 |
B | 7 | 3 | 8 | 10 |
C | 9 | 5 | 10 | 10 |
D | 10 | 10 | 10 | 8 |
Para saber nota média de cada aluno, a professora fez o cálculo da média aritmética das notas, somando as notas de cada trimestre e dividindo pela quantidade de trimestres:
Tendo o cálculo das médias, vamos agora calcular a variância para cada aluno:
var (A) = [(10 – 8)² + (8 – 8)² + (6 – 8)² + (8 – 8)² ] / 4
var (A) = 8 / 4 = 2
var (B) = [(7 – 7)² + (3 – 7)² + (8 – 7)² + (10 – 7)² ] / 4
var (B) = 26 / 4 = 6,5
var (C) = [(9 – 8,5)² + (5 – 8,5)² + (10 – 8,5)² + (10 – 8,5)²] / 4
var (C) = 17 / 4 = 4,25
var (D) = [(10 – 9,5)² + (10 – 9,5)² + (10 –9,5)² + (8 – 9,5)² ] / 4
var (D) = 3 / 4 = 0,75
Lembre que quanto maior for a variância, mais distante da média estão os dados da população, e quanto menor for a variância, mais próximos os valores estarão da média. Sendo assim, as notas do aluno D são as notas mais uniformes ao se comparar com as notas de outros alunos, enquanto as notas do aluno B são as mais desiguais.
Vamos agora calcular o desvio padrão das notas de cada aluno:
Ana:
dp(A) = √var (A)
dp(A) = √2,0
dp(A) ≈ 1,41
Bruno:
dp(B) = √var (B)
dp(B) = √6,5
dp(B) ≈ 2,55
Carol:
dp(C) = √var (C)
dp(C) = √4,25
dp(C) ≈ 2,06
Douglas:
dp(D) = √ar (D)
dp(D) = √0,75
dp(D) ≈ 0,86
Um baixo desvio padrão indica que os pontos dos dados tendem a estar próximos da média ou do valor esperado. Enquanto um alto desvio padrão indica que os pontos dos dados estão espalhados por uma ampla gama de valores. Sendo assim, o aluno que melhor teve aproveitamento nas suas notas foi, de fato, o aluno Douglas.
Viu como saber aplicar medidas de tendências sobre conjuntos de dados pode apresentar características que não estavam tão aparentes somente com a média ou mediana?
Resumo sobre estatística
Quer entender melhor como o desvio padrão e a variância são aplicados na estatística? Assista ao vídeo abaixo, em que o professor Lucas faz um resumo sobre o assunto!
Exercícios sobre desvio padrão e variância
Para terminar, resolva os exercícios sobre desvio padrão e variância selecionados pela professora!
Questão 01)
As afirmações abaixo são falsas, EXCETO
a) Quando a distribuição dos valores da variável é mais heterogênea, o desvio padrão é mais próximo de zero.
b) Quando todos os valores da variável são iguais, o desvio padrão é diferente de zero.
c) A variância não é suficiente para diferenciar a dispersão; somente o desvio padrão é suficiente.
d) Quando a distribuição dos valores da variável é mais homogênea, o desvio padrão é mais próximo de zero.
Questão 02)
Um produtor de café irrigado em Minas Gerais recebeu um relatório de consultoria estatística, constando, entre outras informações, o desvio padrão das produções de uma safra dos talhões de suas propriedades. Os talhões têm a mesma área de 30 000 m2 e o valor obtido para o desvio padrão foi de 90 kg/talhão. O produtor deve apresentar as informações sobre a produção e a variância dessas produções em sacas de 60 kg por hectare (10 000 m2).
A variância das produções dos talhões expressa em (sacas/hectare)2 e
a) 20,25.
b) 4,50.
c) 0,71
d) 0,50.
e) 0,25.
Questão 03)
O histograma de frequências abaixo mostra as vendas de um determinado produto ao longo de 20 meses em uma loja A.
Após um estudo sobre as vendas desse produto, no mesmo período, em duas outras lojas B e C, observou-se que a variância na loja B é 9 e o desvio padrão na loja C é 4. Pode-se concluir que a (o)
a) variância na loja A é 15.
b) produto tem uma venda mais regular na loja B.
c) quantidade de vendas do produto na loja A ao longo do período analisado foi de 18 unidades.
d) desvio padrão na loja B é 81.
e) produto tem uma venda mais regular na loja C.
1) Gab: D
2) Gab: E
3) Gab: B