FACEV - Faculdade de Ciências Econômicas de Vitória
Introdução à Estatística Econômica - 2º ano
Prof. Paulo Cézar Ribeiro da Silva
* A U L A NET - 14 *
.Medidas de Dispersão ou Variabilidade
Dispersão ou Variabilidade:
É a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central ( média ou mediana ) tomado como ponto de comparação.
A média - ainda que considerada como um número que tem a faculdade de representar uma série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto.
Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z:
X = { 70, 70, 70, 70, 70 }
Y = { 68, 69, 70 ,71 ,72 }
Z = { 5, 15, 50, 120, 160 }
Observamos então que os três conjuntos apresentam a mesma média aritmética = 350/5 = 70
Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média representativa.
Concluímos então que o conjunto X apresenta dispersão nula e que o conjunto Y apresenta uma dispersão menor que o conjunto Z.
MEDIDAS DE DISPERSÃO ABSOLUTA
Amplitude total : É a única medida de dispersão que não tem na média o ponto de referência.
Quando os dados não estão agrupados a amplitude total é adiferença entr o maior e o menor valor observado: AT = X máximo - X mínimo.
Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total será: AT = 70 - 40 = 30
Quando os dados estão agrupados sem intervalos de classe ainda temos : AT = X máximo - X mínimo.
Exemplo:
xi | fi |
0 | 2 |
1 | 6 |
3 | 5 |
4 | 3 |
AT = 4 - 0 = 4
Com intervalos de classe a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. Então AT = L máximo - l mínimo
Exemplo:
Classes | fi |
4 |------------- 6 | 6 |
6 |------------- 8 | 2 |
8 |------------- 10 | 3 |
AT = 10 - 4 = 6
A amplitude total tem o incoveniente e só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem muita exatidão.
Desvio quartil
Também chamado de amplitude semi-interquatílica e é baseada nos quartis.
Símbolo: Dq e a Fórmula: Dq = (Q3 - Q1) / 2
Observações:
1 - O desvio quartil apresenta como vantagem o fato de ser uma medida fácil de calcular e de interpretar. Além do mais, não é afetado pelos valores extremos, grandes ou pequenos, sendo recomendado, por conseguinte, quando entre os dados figurem valores extremos que não se consideram representativos.
2- O desvio quartil deverá ser usado preferencialmente quando a medida de tendência central for a mediana.
3- Trata-se de uma medida insensível ã distribuição dos itens menores que Q1, entre Q1 e Q3 e maiores que Q3.
Exemplo: Para os valores 40, 45, 48, 62 e 70 o desvio quartil será:
Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5) / 2 = 11,75
Desvio médio absoluto
Para dados brutos
É a média aritmética dos valores absolutos dos desvios tomados em relação a uma das seguintes medidas de tendência central: média ou mediana. Símbolo = Dm
Fórmula : para a Média
= E | Xi - | /
n
Fórmula : para a Mediana = E | Xi - Md | / n
As barras verticais indicam que são tomados os valores absolutos, prescindindo do sinal dos desvios.
Exemplo: Calcular o desvio médio do conjunto de números { - 4 , - 3 , - 2 , 3 , 5 }
= - 0, 2 e
Md = - 2
Tabela auxiliar para cálculo do desvio médio
Xi | Xi - |
| Xi - |
Xi - Md | | Xi - Md | | |
- 4 | (- 4) - (-0,2) = -3,8 | 3,8 | (- 4) - (-2) = - 2 | 2 | |
- 3 | (- 3) - (-0,2) = -2,8 | 2,8 | (- 3) - (-2) = - 1 | 1 | |
- 2 | (- 2) - (-0,2) = -1,8 | 1,8 | (- 2) - (-2) = 0 | 0 | |
3 | 3 - (-0,2) = 3,2 | 3,2 | 3 - (-2) = 5 | 5 | |
5 | 5 - (-0,2) = 5,2 | 5,2 | 5 - (-2) = 7 | 7 | |
E = | 16,8 | E = | 15 |
Pela Média : Dm = 16,8 / 5 = 3,36 Pela Mediana : Dm = 15 / 5 = 3
Desvio médio para Dados Tabulados
Se os valores vierem dispostos em uma tabela de frequências, agrupados ou não em classes, serão usadas as seguintes fórmulas:
Cálculo pela média:
Dm = (E |Xi -
|. fi ) /
E fi
Cálculo pela mediana: Dm = (E |Xi - Md |. fi ) / E fi
Exemplo de cálculo pela média:
Xi | f i | Xi . f i | |
Xi - |
| Xi - |
| Xi - |
|
3 | 2 | 6 | 4,7 | - 1,7 | 1,7 | 3,4 | |
4 | 2 | 8 | 4,7 | - 0,7 | 0,7 | 1,4 | |
5 | 3 | 15 | 4,7 | 0,3 | 0,3 | 0,9 | |
6 | 3 | 18 | 4,7 | 1,3 | 1,3 | 3,9 | |
E = | 10 | 47 | E = | 9,6 |
Dm = 9,6 / 10 = 0,96
Para o cáculo do Desvio médio pela mediana segue-se o mesmo raciocínio.
Xi | f i | Md | Xi - Md | | Xi - Md | | | Xi - Md | . f i | |
3 | 2 | 5 | - 2 | 2 | 4 | |
4 | 2 | 5 | - 1 | 1 | 2 | |
5 | 3 | 5 | 0 | 0 | 0 | |
6 | 3 | 5 | 1 | 1 | 1 | |
E = | 10 | E = | 7 |
Dm = 7 / 10 = 0,70
Obs: Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra, não é tão frequentemente empregado como o desvio-padrão. O desvio médio despreza o fato de alguns desvios serem negativos e outros positivos, pois essa medida os trata como se fossem todos positivos. Todavia será preferido o uso do desvio médio em lugar do desvio-padrão, quando esse for indevidamente influenciado pelos desvios extremos.