Método estatístico.
Distribuições de frequências.
Elaboração de tabelas e gráficos
1.1 - ORGANIZAÇÃO DE UMA TABELA COM INFORMAÇÕES NUMÉRICAS
No capítulo anterior, foi apresentado o método estatístico. Uma das questões discutidas foi a coleta de informações para levantamento estatístico de opiniões ou dados numéricos. Após o levantamento, provavelmente teremos em mãos uma grande quantidade de números que deverão ser processados (organizados) para serem posteriormente estudados e interpretados. Finalmente, os resultados serão apresentados.
Neste capítulo veremos como é possível organizar e apresentar quantidades numéricas.
Para entender um problema que envolve uma grande quantidade de valores (podemos falar também em grandes massas numéricas ou grande quantidade de números), a primeira providência é organizar e apresentar estes valores.
Acompanhe passo-a-passo, no exemplo abaixo, a organização de uma tabela com valores numéricos.
Passo 1 - Entendendo a origem dos valores de uma tabela
Uma empresa realizou uma pesquisa entre seus funcionários para saber quanto tempo, em média, eles gastavam para chegar à sede da empresa pela manhã.
Para isso, 100 funcionários escolhidos aleatoriamente receberam cronômetros e foram instruídos a ligar o cronômetro quando saíssem de casa pela manhã e o desligassem ao chegar à empresa. Eles deveriam realizar as medições durante uma semana (de segunda a sexta-feira).
Com os cinco valores obtidos, eles deveriam calcular a média e apresentar o número para a empresa.
A tabela a seguir apresenta os números obtidos pelos 100 funcionários. Cada número, expressos em minutos, representa o tempo médio que o trabalhador leva desde que sai de casa até quando chega à empresa, medido durante uma semana.
44,0 |
35,4 |
28,4 |
37,0 |
46,0 |
35,4 |
19,4 |
20,4 |
56,4 |
43,2 |
36,2 |
38,4 |
49,2 |
31,8 |
86,4 |
12,6 |
27,4 |
14,0 |
39,4 |
39,4 |
15,8 |
28,8 |
38,0 |
44,0 |
38,4 |
74,0 |
23,0 |
11,4 |
39,8 |
30,2 |
29,2 |
40,6 |
49,6 |
30,4 |
12,2 |
123,8 |
42,0 |
47,0 |
32,4 |
39,2 |
35,2 |
56,4 |
31,0 |
45,0 |
90,2 |
100,0 |
39,0 |
37,0 |
49,4 |
28,2 |
12,6 |
27,0 |
47,8 |
52,6 |
41,0 |
40,0 |
28,0 |
23,6 |
37,6 |
37,8 |
30,0 |
45,8 |
18,0 |
41,0 |
22,6 |
24,2 |
89,6 |
90,4 |
43,0 |
29,8 |
56,2 |
24,8 |
12,6 |
53,6 |
125,4 |
16,2 |
39,0 |
40,8 |
33,6 |
39,4 |
45,6 |
37,4 |
18,0 |
50,6 |
103,4 |
52,4 |
20,2 |
64,6 |
22,2 |
60,0 |
42,2 |
42,0 |
16,2 |
108,2 |
44,0 |
42,6 |
39,4 |
37,6 |
41,4 |
40,4 |
A simples listagem dos números, como apresentado na tabela acima, não ajuda muito a tornar o problema mais compreensível. É impossível tirar qualquer tipo de conclusão olhando-se esta tabela.
Passo 2 - Organizando a tabela
Para organizar-se uma tabela, a primeira providencia é colocar os números da mesma em ordem, crescente ou decrescente, como apresentado a seguir. Se ao invés de números tivéssemos palavras, poderíamos organizá-las em ordem alfabética. O importante é ordenar a tabela com algum critério, para facilitar sua interpretação.
Com a tabela organizada, já é possível visualizar os valores máximo e mínimo, além de podermos notar uma grande concentração de valores na faixa entre 30 e 50 minutos.
11,4 |
18,0 |
27,0 |
30,4 |
37,0 |
39,2 |
41,0 |
44,0 |
49,6 |
74,0 |
12,2 |
19,4 |
27,4 |
31,0 |
37,4 |
39,4 |
41,0 |
44,0 |
50,6 |
86,4 |
12,6 |
20,2 |
28,0 |
31,8 |
37,6 |
39,4 |
41,4 |
45,0 |
52,4 |
89,6 |
12,6 |
20,4 |
28,2 |
32,4 |
37,6 |
39,4 |
42,0 |
45,6 |
52,6 |
90,2 |
12,6 |
22,2 |
28,4 |
33,6 |
37,8 |
39,4 |
42,0 |
45,8 |
53,6 |
90,4 |
14,0 |
22,6 |
28,8 |
35,2 |
38,0 |
39,8 |
42,2 |
46,0 |
56,2 |
100,0 |
15,8 |
23,0 |
29,2 |
35,4 |
38,4 |
40,0 |
42,6 |
47,0 |
56,4 |
103,4 |
16,2 |
23,6 |
29,8 |
35,4 |
38,4 |
40,4 |
43,0 |
47,8 |
56,4 |
108,2 |
16,2 |
24,2 |
30,0 |
36,2 |
39,0 |
40,6 |
43,2 |
49,2 |
60,0 |
123,8 |
18,0 |
24,8 |
30,2 |
37,0 |
39,0 |
40,8 |
44,0 |
49,4 |
64,6 |
125,4 |
Passo 3 - Uma organização estatística :- construindo uma distribuição de frequências
É possível organizar de forma ainda melhor esta tabela, tornando-a simples de ser analisada. Estamos avaliando quantos minutos os funcionários levam em média para chegar ao emprego. Vamos agrupar estes tempos em intervalos ou classes entre os valores mínimo (11,4 minutos) e máximo (125,4 minutos). Preencha você mesmo a tabela abaixo, distribuindo os tempos médios apresentados pelos trabalhadores nos intervalos definidos na primeira linha da tabela. Depois compare com a tabela da página seguinte.
INTERVALO |
10 a |
20 a |
30 a |
40 a |
50 a |
60 a |
70 a |
80 a |
90 a |
100 a |
110 a |
120 a |
(minutos) |
20 |
30 |
40 |
50 |
60 |
70 |
80 |
90 |
100 |
110 |
120 |
130 |
PONTO MÉDIO |
15 |
25 |
35 |
45 |
55 |
65 |
75 |
85 |
95 |
105 |
115 |
125 |
11,4 |
20,2 |
30,2 |
40,4 |
50,6 |
64,6 |
74,0 |
86,4 |
90,2 |
103,4 |
- |
123,8 |
|
12,2 |
20,4 |
30,4 |
40,6 |
52,4 |
- |
- |
89,6 |
90,4 |
108,2 |
- |
125,4 |
|
12,6 |
22,2 |
31,0 |
40,8 |
52,6 |
- |
- |
- |
100,0 |
- |
- |
- |
|
12,6 |
22,6 |
31,8 |
41,0 |
53,6 |
- |
- |
- |
- |
- |
- |
- |
|
12,6 |
23,0 |
32,4 |
41,0 |
56,2 |
- |
- |
- |
- |
- |
- |
- |
|
14,0 |
23,6 |
33,6 |
41,4 |
56,4 |
- |
- |
- |
- |
- |
- |
- |
|
15,8 |
24,2 |
35,2 |
42,0 |
56,4 |
- |
- |
- |
- |
- |
- |
- |
|
16,2 |
24,8 |
35,4 |
42,0 |
60,0 |
- |
- |
- |
- |
- |
- |
- |
|
16,2 |
27,0 |
35,4 |
42,2 |
- |
- |
- |
- |
- |
- |
- |
- |
|
18,0 |
27,4 |
36,2 |
42,6 |
- |
- |
- |
- |
- |
- |
- |
- |
|
V |
18,0 |
28,0 |
37,0 |
43,0 |
- |
- |
- |
- |
- |
- |
- |
- |
A |
19,4 |
28,2 |
37,0 |
43,2 |
- |
- |
- |
- |
- |
- |
- |
- |
L |
- |
28,4 |
37,4 |
44,0 |
- |
- |
- |
- |
- |
- |
- |
- |
O |
- |
28,8 |
37,6 |
44,0 |
- |
- |
- |
- |
- |
- |
- |
- |
R |
- |
29,2 |
37,6 |
44,0 |
- |
- |
- |
- |
- |
- |
- |
- |
E |
- |
29,8 |
37,8 |
45,0 |
- |
- |
- |
- |
- |
- |
- |
- |
S |
- |
30,0 |
38,0 |
45,6 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
38,4 |
45,8 |
- |
- |
- |
- |
- |
- |
- |
- |
|
- |
- |
38,4 |
46,0 |
- |
- |
- |
- |
- |
- |
- |
- |
|
- |
- |
39,0 |
47,0 |
- |
- |
- |
- |
- |
- |
- |
- |
|
- |
- |
39,0 |
47,8 |
- |
- |
- |
- |
- |
- |
- |
- |
|
- |
- |
39,2 |
49,2 |
- |
- |
- |
- |
- |
- |
- |
- |
|
- |
- |
39,4 |
49,4 |
- |
- |
- |
- |
- |
- |
- |
- |
|
- |
- |
39,4 |
49,6 |
- |
- |
- |
- |
- |
- |
- |
- |
|
- |
- |
39,4 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
|
- |
- |
39,4 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
|
- |
- |
39,8 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
|
- |
- |
40,0 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
|
FREQUÊNCIA |
12 |
17 |
28 |
24 |
8 |
1 |
1 |
2 |
3 |
2 |
0 |
2 |
A tabela está agora perfeitamente organizada. Analisando-se a frequência de cada classe, podemos tirar conclusões de uma maneira simples e rápida.
1.2 OS CONCEITOS DE POPULAÇÃO, AMOSTRA E VARIÁVEL
Vamos agora tomar contato com alguns conceitos de grande importância quando se trata de organizar dados coletados estatisticamente.
População é um grupo de indivíduos com pelo menos uma característica comum. Rigorosamente, se um conjunto de dados é formado por todas as observações possíveis de um determinado fenômeno ou evento, ele é chamado de população. População finita é aquela onde é possível enumerar todos os seus elementos componentes. Exemplos: os alunos desta classe; o número de parafusos produzidos numa empresa num determinado dia; o número de eleitores do país; etc. População infinita é aquela onde não é possível enumerar todos os seus componentes. Exemplos: o número de casas decimais do p ; o número de estrelas do universo; o número de grãos de areia de uma praia; o número de vezes que se pode lançar uma moeda no jogo de cara-ou-coroa; etc.
Para efeitos práticos, uma quantidade infinita é aquela que não podemos contar em um espaço de tempo razoável. Este é um conceito prático, que não se aplica a cálculos científicos rigorosos. Como exemplo, podemos citar o número de grãos de areia contidos em um carrinho de mão de pedreiro. Rigorosamente, o número de grãos de areia contidos em um carrinho de mão é finito, já que os grãos de areia estão contidos em um espaço delimitado. No entanto, contá-los tomaria muito tempo. Além do mais, para o uso que fazemos da areia, não tem a menor importância saber o número exato de grãos utilizados. Desta forma, podemos considerar que seu número é infinito. O mesmo podemos dizer da quantidade de estrelas contidas em uma galáxia, do número de átomos de oxigênio contidos na atmosfera terrestre, etc.
DESAFIO - Você poderia planejar uma maneira prática, rápida e estatisticamente válida de avaliar a quantidade aproximada de grãos contidos em uma tonelada de areia?
Amostra - é um grupo de indivíduos, objetos ou dados de uma população. Uma amostra representativa da população tem como característica representar esta população com um determinado grau de certeza. Amostra aleatória - é aquela na qual qualquer elemento da população tem exatamente a mesma chance de integrar a amostra desta população. Para que uma amostra seja representativa de uma população, é fundamental que ela seja aleatória.
Variável - é uma característica de indivíduos ou objetos de uma população, que pode assumir diferentes valores, isto é, valores variáveis. Por exemplo: a altura dos estudantes desta classe; o número de mulheres da classe; o número de carros produzidos diariamente numa montadora; etc. Variável discreta - é aquela que pode assumir um número finito de valores. Por exemplo: o número de alunos de uma escola; o número de filhos de uma família; o número de casas de uma rua; o número de estrelas da Via Láctea; etc. Como regra prática, as variáveis discretas são aquelas que podem ser obtidas por contagem da amostra. Variável contínua - é aquela que pode assumir um número infinito de valores. Por exemplo, as alturas possíveis entre 1,50 m e 1,70 m; o peso dos estudantes de uma escola; o tamanho dos grãos de areia de uma praia; etc. Como regra prática, as variáveis contínuas são aquelas que podem ser obtidas por mensuração da amostra.
1.3 CONCEITOS ENVOLVIDOS NA ORGANIZAÇÃO DE UMA TABELA
Para entender melhor a tabela com a distribuição de frequências dos tempos médios que os trabalhadores levam para chegar ao trabalho e os conceitos envolvidos em sua preparação, leia os conceitos e responda às questões abaixo:
a - Qual é a variável com que estamos lidando nesta tabela? Qual a sua unidade de medida?
_____________________________________________________________________
b - Como os valores foram obtidos?
_____________________________________________________________________
_____________________________________________________________________
_____________________________________________________________________
c - A variável é discreta ou contínua?
______________________________________________________________________
d - Numa distribuição de frequências, a amplitude total ou "range" da distribuição é definida como sendo a diferença entre o maior e o menor valor observado. Calcule a amplitude total da distribuição na tabela.
______________________________________________________________________
e - Classe, categoria ou intervalo é cada um dos grupos em que se subdivide a amplitude total para construção da distribuição de frequências. Na tabela acima, quais foram as classes empregadas?
______________________________________________________________________
______________________________________________________________________
f - Limites de classe são os limites extremos (ou limites mínimo e máximo) de cada classe. Aponte quais são os limites das classes empregadas na tabela acima.
______________________________________________________________________
______________________________________________________________________
g - Existem quatro formas possíveis de distribuir os valores da variável nas classes escolhidas, o que é conhecido como intervalo de classe. Por exemplo, se os limites de classe fossem 0 e 10, poderíamos ter:
g1 - todos os valores entre 0 e 10, exclusive os extremos, ou seja, intervalo aberto nos extremos;
g2 - todos os valores entre 0 e 10, inclusive os extremos, ou seja, intervalo fechado nos extremos;
g3 - todos os valores entre 0 e 10, exclusive o limite inferior ( 0 ) e inclusive o limite superior ( 10 ), ou seja, intervalo aberto à esquerda e fechado à direita;
g4 - todos os valores entre 0 e 10, inclusive o limite inferior ( 0 ) e exclusive o limite superior ( 10 ), ou seja, intervalo fechado à esquerda e aberto à direita. Esta é a forma mais comum empregada nas distribuições de frequência.
Na tabela acima, qual foi a opção empregada?
______________________________________________________________________
h - O ponto médio das classes é a média aritmética entre o limite superior e o limite inferior da classe ( ou seja, soma-se o limite superior com o inferior e divide-se o resultado por 2 ). Quais são os pontos médios das classes empregadas na tabela acima?
______________________________________________________________________
______________________________________________________________________
i - A frequência absoluta das classes é definida como o número de ocorrências ou de elementos em cada classe. Quais são as frequências absolutas das classes na distribuição apresentada na tabela acima?
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
j - A frequência relativa das classes é definida como o quociente entre a frequência absoluta da classe e o total dos elementos da distribuição. Calcule a frequência relativa de cada classe na distribuição apresentada na tabela.
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
k - A frequência porcentual simples das classes pode ser obtida multiplicando-se por 100 os valores da frequência relativa de cada classe. Calcule a frequência porcentual simples das classes apresentadas na tabela acima.
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
l - A frequência acumulada crescente de uma distribuição corresponde à soma da frequência de determinada classe com as frequências das classes anteriores. Calcule a frequência acumulada crescente para cada classe da tabela acima.
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
m - A frequência acumulada decrescente de uma distribuição de frequências corresponde à soma da frequência de determinada classe com as frequências das classes seguintes. Calcule a frequência acumulada decrescente para cada classe da tabela acima.
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
1.4 EXERCÍCIOS
15,8 |
26,4 |
17,3 |
11,2 |
23,9 |
24,8 |
18,7 |
13,9 |
9,0 |
13,2 |
22,7 |
9,8 |
6,2 |
14,7 |
17,5 |
26,1 |
12,8 |
28,6 |
17,6 |
23,7 |
26,8 |
22,7 |
18,0 |
20,5 |
11,0 |
20,9 |
15,5 |
19,4 |
16,7 |
10,7 |
19,1 |
15,2 |
22,9 |
26,6 |
20,4 |
21,4 |
19,2 |
21,6 |
16,9 |
19,0 |
18,5 |
23,0 |
24,6 |
20,1 |
16,2 |
18,0 |
7,7 |
13,5 |
23,5 |
14,5 |
14,4 |
29,6 |
19,4 |
17,0 |
20,8 |
24,3 |
22,5 |
24,6 |
18,4 |
18,1 |
8,3 |
21,9 |
12,3 |
22,3 |
13,3 |
11,8 |
19,3 |
20,0 |
25,7 |
31,8 |
25,9 |
10,5 |
15,9 |
27,5 |
18,1 |
17,9 |
9,4 |
24,1 |
20,1 |
28,5 |
(a) construa uma distribuição de frequências levando em conta os seguintes limites de intervalos (em toneladas):
5,0 a 8,9;
9,0 a 12,9;
13,0 a 16,9;
17,0 a 20,9;
21,0 a 24,9;
25,0 a 28,9;
29,0 a 32,9.
(b) calcule os pontos médios de classes (pontos de classe, marcas de classe) para cada uma das classes acima.
(c) calcule todas as frequências da distribuição obtida (absoluta, relativa, porcentual simples, acumulada crescente e acumulada decrescente)
1.4.2 - O número de enfermeiras trabalhando todos os dias em um hospital foi agrupado em uma distribuição tendo as seguintes classes:
15 a 29;
30 a 44;
45 a 59;
60 a 74;
75 a 89.
Encontre: (a) - os limites de classe; (b) - os intervalos de classe.
1.4.3 - Uma companhia de ônibus com linha São Paulo - Rio realizou uma pesquisa durante 100 viagens consecutivas para saber quantos assentos vazios seus ônibus tinham em cada viagem. Os resultados foram agrupados em uma tabela com as classes:
0 a 4;
5 a 9;
10 a 14;
15 a 19;
20 a 24;
25 ou mais.
Seria possível determinar exatamente a partir desta tabela o numero de viagens nas quais ocorrem:
(a) - pelo menos 10 assentos vazios;
(b) - mais de 10 assentos vazios;
(c) - mais de 14 assentos vazios;
(d) - pelo menos 14 assentos vazios;
(e) - exatamente 9 assentos vazios;
Atenção: pelo menos significa no mínimo.
1.4.4 - A tabela abaixo mostra a distribuição de peso de 125 amostras de minério coletadas numa mina:
PESO |
AMOSTRAS |
(g) |
|
0,0 a 19,9 |
16 |
20,0 a 39,9 |
38 |
40,0 a 59,9 |
35 |
60,0 a 79,9 |
20 |
80,0 a 99,9 |
11 |
100,0 a 119,9 |
4 |
120,0 a 139,9 |
1 |
TOTAL |
125 |
Se possível, encontre o número de espécies que obedecem cada item abaixo:
( a ) - pesem pelo menos 40,0 g;
( b ) - pesem mais que 59,9 g;
( c ) - pesem mais que 80,0 g;
( d ) - pesem 80,0 g ou menos;
( e ) - pesem exatamente 70,0 g;
( f ) - pesem no mínimo 60,0 e no máximo 119,9 g.
1.4.5 Os dados abaixo são as intensidades solares diretas (watts/m2) medidas em um local no sul da Espanha em dias diferentes: 562, 869, 708, 775, 775, 704, 809, 856, 655, 806, 878, 909, 918, 558, 768, 870, 918, 940, 946, 661, 820, 898, 935, 952, 957, 693, 835, 905, 939, 955, 960, 498, 653, 730 e 753. (a) Construa uma distribuição de frequências considerando 450 (watts/m2) como limite mínimo da distribuição e 1000 (watts/m2) como limite máximo. Construa classes com amplitude de 50 (watts/m2) e use intervalo fechado à esquerda e aberto à direita (adaptado de Montgomery/Runger); (b) calcule todas as frequências da distribuição.
1.4.6 A porcentagem de algodão em 64 amostras de tecido usado na manufatura de roupas foi medida. Os dados estão apresentados abaixo. (a) Construa uma distribuição de frequências com 11 classes. Use intervalo fechado à esquerda e aberto à direita; (b) calcule todas as frequências da distribuição (adaptado de Montgomery/Runger).
34,2 |
33,6 |
33,8 |
34,7 |
37,8 |
32,6 |
35,8 |
34,6 |
33,1 |
34,7 |
34,2 |
33,6 |
36,6 |
33,1 |
37,6 |
33,6 |
34,5 |
35,0 |
33,4 |
32,5 |
35,4 |
34,6 |
37,3 |
34,1 |
35,6 |
35,4 |
34,7 |
34,1 |
34,6 |
35,9 |
34,6 |
34,7 |
36,3 |
36,2 |
34,6 |
35,1 |
33,8 |
34,7 |
35,5 |
35,7 |
35,1 |
36,8 |
35,2 |
36,8 |
37,1 |
33,6 |
32,8 |
36,8 |
34,7 |
35,1 |
35,0 |
37,9 |
34,0 |
32,9 |
32,1 |
34,3 |
33,6 |
35,3 |
34,9 |
36,4 |
34,1 |
33,5 |
34,5 |
32,7 |
1.5 ELABORAÇÃO DE GRÁFICOS
A forma mais prática de se apresentar informações numéricas é elaborar um gráfico com elas. Em um gráfico pode-se entender rapidamente como a informação se distribui, onde ela se concentra, os máximos e mínimos, as tendências, etc.
Existem muitos tipos de gráficos. Os mais comuns são: gráfico de áreas, de barras, de colunas, de linhas, torta, rosca e de superfície.
Com os dados da tabela de distribuição de frequências dos tempos médios que os trabalhadores levam para chegar à empresa, vamos elaborar passo-a-passo um gráfico de colunas.
Passo 1 - Construindo o eixo das abscissas.
O eixo das abscissas, também conhecido como eixo x ou eixo horizontal, é onde vamos distribuir a variável independente. Variável independente é aquela que tomamos como base de referência para construir um gráfico. A outra variável, a variável dependente, vai ser distribuída no gráfico em função da variável independente.
Em problemas onde estamos estudando como uma determinada variável se comporta em função do tempo, é comum tomarmos o tempo como variável independente e a outra como dependente. Portanto, em problemas onde o tempo é uma das variáveis, ele normalmente é utilizado como variável independente.
No nosso caso, queremos saber quanto tempo os trabalhadores levam para chegar ao trabalho. Logo, vamos utilizar o tempo como variável independente e distribuí-lo no eixo das abscissas, eixo x ou eixo horizontal.
Para distribuir a variável no eixo, é preciso observar inicialmente qual seu valor mínimo e qual seu valor máximo. No nosso caso, o valor mínimo é 11,4 minutos e o valor máximo é 125,4 minutos. Nosso eixo deverá ser dimensionado para este intervalo. Isto significa que o valor mínimo no eixo das abscissas não poderá ser maior que 11,4 e o valor máximo não poderá ser menor que 125,4.
É recomendável utilizar na escala do gráfico, valores inteiros e se possível múltiplos de 10, de 100, de 1000, etc., dependendo do nosso range. Isto vai tornar o gráfico mais facilmente compreensível e de fácil interpretação. No entanto, isto não é obrigatório.
Como nossa tabela está dividida em intervalos múltiplos de 10, vamos utilizar esta divisão em nosso eixo das abscissas, o que vai deixá-lo facilmente compreensível e interpretável. O eixo vai ficar então como apresentado abaixo:
O primeiro intervalo, de 0 a 10, tem função exclusivamente estética, já que no nosso caso não temos informação nenhuma para colocar aí. No entanto, a estética é muito importante quando construímos um gráfico, pois vai torná-lo mais agradável de ser visto e mais fácil de ser entendido.
Finalmente, devemos indicar qual a variável vai ser distribuída neste eixo e qual sua unidade de medida. No nosso caso a variável é o tempo para chegar ao trabalho e é medida em minutos. O eixo das abscissas completo fica então:
Passo 2 - Construindo o eixo das ordenadas
O eixo das ordenadas, também chamado de eixo y ou eixo vertical, é onde distribuímos a variável dependente. Este eixo é construído de forma similar ao eixo das abscissas. Isto quer dizer que devemos seguir os mesmos passos: avaliar os valores mínimos e máximos e ajustá-los a uma escala de fácil compreensão.
Na nossa tabela, os valores que vão ser distribuídos no eixo das ordenadas são as frequências. A menor frequência é zero e a maior 28. Logo podemos tomar o zero como mínimo valor no eixo das ordenadas e 30 como o máximo (lembre-se: de preferência, utilizar múltiplos de 10, 100, 1000 etc. para construir o eixo).
Assim, o nosso eixo das ordenadas será:
Ao juntarmos os dois eixos, teremos pronto o espaço para distribuirmos nossos valores.
Um sistema de dois eixos, um vertical e um horizontal, também é conhecido como sistema de eixos cartesianos (em homenagem ao matemático e filósofo francês Renè Descartes).
Passo 3 - Distribuindo os valores no sistema de eixos
Em nossa tabela, a cada intervalo associamos uma frequência, gerando os seguintes pares ordenados:
ABSCISSA |
ORDENADA |
PAR ORDENADO |
Intervalo de tempo (minutos) |
Frequência |
(x, y) |
0-10 |
0 |
(0-10, 0) |
10-20 |
12 |
(10-20, 12) |
20-30 |
17 |
(20-30, 17) |
30-40 |
28 |
(30-40, 28) |
40-50 |
24 |
(40-50, 24) |
50-60 |
8 |
(50-60, 8) |
60-70 |
1 |
(60-70, 1) |
70-80 |
1 |
(70-80, 1) |
80-90 |
2 |
(80-90, 2) |
90-100 |
3 |
(90-100, 3) |
100-110 |
2 |
(100-110, 2) |
110-120 |
0 |
(110-120, 0) |
120-130 |
2 |
(120-130, 2) |
Vamos distribuir os pares ordenados no nosso sistema de eixos:
Poderíamos ter optado por um gráfico de linhas ao invés de um gráfico de colunas. No gráfico de linhas, cada par ordenado é representado por um ponto no sistema de eixos. Após distribuirmos todos os pares ordenados, unimos os pontos que os representam por uma reta. Desta forma, teríamos a seguinte figura.
Num gráfico de barras, a variável independente é locada no eixo vertical enquanto a variável dependente é locada no eixo horizontal. Esta forma de distribuição é a oposta em relação ao gráfico de colunas ou ao gráfico de linhas. Se utilizarmos gráfico de barras, teremos a seguinte figura:
Num gráfico tipo torta ou pizza, a variável independente é representada por uma circunferência e a variável dependente por partes desta circunferência, de tal forma que as áreas das partes, quando somadas, representem toda a circunferência. Se distribuíssemos nossa variável dependente em uma circunferência, teríamos:
Similarmente, em um gráfico tipo rosca teríamos:
1.6 HISTOGRAMAS, POLÍGONOS DE FREQUÊNCIA E OGIVAS
Histograma é a representação gráfica de uma distribuição de frequências, através de retângulos justapostos, em que a base, colocada no eixo das abscissas, corresponde aos intervalos de classe e a sua altura é proporcional às frequências observadas em cada uma das classes.
Polígono de frequências é um gráfico de linhas onde cada classe da distribuição de frequências é representada por seu ponto médio, locado no eixo das abscissas. Na intersecção entre a perpendicular a cada ponto médio e a paralela a cada frequência correspondente, desenhamos um ponto. A união desses pontos por segmentos de reta desenha um polígono de frequência. O polígono de frequência também pode ser construído unindo-se por segmentos de reta os pontos médios dos topos das colunas do histograma. Um polígono de frequência construído com as frequências acumuladas é chamado de ogiva.
O gráfico de colunas construído na seção anterior, apresentando a demanda de tempo para chegar ao trabalho, pode ser refeito como um histograma e seu correspondente polígono de frequência.
Os histogramas podem ser simétricos ou assimétricos. A assimetria é medida em relação ao eixo vertical, podendo ser à direita (positiva) ou à esquerda (negativa). Se o histograma tem uma cauda direita longa e uma cauda esquerda curta, diz-se que é assimétrico à direita. Se tem uma cauda esquerda longa e uma cauda direita curta, será assimétrico à esquerda.
Histograma simétrico
Histograma assimétrico à direita ou com assimetria positiva
Histograma assimétrico à esquerda ou com assimetria negativa
Ogiva de frequência acumulada crescente
Ogiva de frequência acumulada decrescente
1.7 RESUMO
A organização de grandes quantidades de números obtidas a partir de algum levantamento de informações, deve seguir alguns passos básicos :
1 - Entenda melhor a relação de números colocando-os de forma organizada, por exemplo em ordem crescente ou alguma outra ordem de interesse;
2 - Escolha intervalos (ou classes, ou categorias) para poder agrupá-los, definindo os limites ou fronteiras destes intervalos;
3 - Distribua os valores entre os intervalos (ou classes, ou categorias) selecionados;
4 - Conte o número de valores em cada intervalo. Esta é a frequência daquele intervalo;
5 - Apresente os resultados em forma gráfica.
1.8 EXERCÍCIOS
1.8.1 - Uma maternidade paulista realizou um levantamento entre as 50 mulheres internadas num determinado dia. A pesquisa visava levantar dois tipos de informação : uma sobre a idade das pacientes e outra sobre seu número de filhos. Os resultados estão apresentados nas tabelas abaixo.
Idades
22 |
22 |
19 |
23 |
25 |
26 |
16 |
40 |
31 |
28 |
19 |
29 |
21 |
14 |
23 |
23 |
33 |
25 |
23 |
21 |
18 |
41 |
16 |
26 |
26 |
29 |
23 |
25 |
22 |
21 |
36 |
27 |
42 |
21 |
22 |
17 |
14 |
26 |
26 |
19 |
31 |
24 |
23 |
32 |
29 |
24 |
28 |
24 |
25 |
31 |
Número de filhos
2 |
1 |
4 |
1 |
1 |
3 |
2 |
3 |
2 |
1 |
4 |
2 |
0 |
2 |
5 |
3 |
6 |
1 |
3 |
2 |
0 |
7 |
1 |
3 |
5 |
1 |
2 |
0 |
3 |
1 |
6 |
2 |
7 |
0 |
1 |
8 |
2 |
1 |
9 |
2 |
6 |
4 |
2 |
2 |
5 |
3 |
1 |
4 |
3 |
0 |
Com estas informações, construir dois gráficos de colunas. O primeiro apresentando a frequência do número de filhos. O segundo, a frequência das idades, levando-se em conta três categorias : adolescentes (menores de 19 anos), jovens (de 20 a 35 anos) e maduras (acima de 35 anos).
1.8.2 - A tabela abaixo mostra o consumo de combustível em Km / L obtido em 40 testes com um carro popular:
24,5 |
24,2 |
23,9 |
22,8 |
23,6 |
23,7 |
24,8 |
24,4 |
24,7 |
24,5 |
24,6 |
24,1 |
24,9 |
24,6 |
25,3 |
23,9 |
24,7 |
24,1 |
25,7 |
25,2 |
24,9 |
24,1 |
22,9 |
24,8 |
24,3 |
23,6 |
24,7 |
25,1 |
23,1 |
24,0 |
24,4 |
24,7 |
24,5 |
23,8 |
23,4 |
23,9 |
25,0 |
25,0 |
23,3 |
24,6 |
( a ) - agrupe estes dados em uma distribuição com as seguintes classes:
22,5 a 22,9;
23,0 a 23,4;
23,5 a 23,9;
24,0 a 24,4;
24,5 a 24,9;
25,0 a 25,4;
25,5 a 25,9.
( b ) - construa um histograma com a distribuição de frequências;
( c ) construa uma ogiva de frequência acumulada crescente.
1.8.3 - A tabela abaixo mostra a distribuição de gastos de 200 clientes durante um determinado dia em uma loja de brinquedos:
GASTOS |
FREQUÊNCIA |
(R$) |
|
0,00 A 19,99 |
22 |
20,00 A 39,99 |
47 |
40,00 A 59,99 |
66 |
60,00 A 79,99 |
35 |
80,00 A 99,99 |
21 |
100,00 A 119,99 |
9 |
Construa um histograma com esta distribuição.
1.8.4 Os dados abaixo representam o número de vezes que um botão de liga desliga de 70 amostras de gabinetes de computador foi apertado antes de quebrar. O teste foi realizado por uma máquina que apertava o botão uma vez a cada 3 segundos. (a) Construa uma distribuição de frequências com limite mínimo de 350 vezes e limite máximo de 2450 vezes, amplitudes de classe de 300 vezes e intervalo fechado à esquerda e aberto à direita; (b) Construa um histograma com os dados da distribuição de frequências; (c) Construa uma ogiva de frequência acumulada decrescente da distribuição; (d) Você acredita que este teste é representativo da carga a que estes botões são submetidos no uso doméstico de computadores? (adaptado de Montgomery/Runger)
1115 |
1567 |
1223 |
1782 |
1055 |
798 |
1016 |
2100 |
910 |
1501 |
1310 |
1883 |
375 |
1522 |
1764 |
1020 |
1102 |
1594 |
1730 |
1238 |
1540 |
1203 |
2265 |
1792 |
1330 |
865 |
1605 |
2023 |
1102 |
990 |
1502 |
1270 |
1910 |
1000 |
1608 |
2130 |
706 |
1315 |
1578 |
1468 |
1258 |
1015 |
1018 |
1820 |
1535 |
1421 |
2215 |
1269 |
758 |
1512 |
1315 |
845 |
1452 |
1940 |
1781 |
1109 |
785 |
1260 |
1416 |
1750 |
1085 |
1674 |
1890 |
1120 |
1750 |
1481 |
885 |
1888 |
1560 |
1642 |
1.8.5 A tabela abaixo mostra a distribuição de frequência dos salários mensais, em Reais, de 65 empregados da Companhia P&R. Com referência à tabela, determinar: (a) o limite inferior da sexta classe; (b) o limite superior da quarta classe; (c) o ponto médio da terceira classe; (d) a frequência da terceira classe; (e) a frequência relativa da terceira classe; (f) a porcentagem de empregados que ganham menos de R$ 800,00 por mês; (g) a porcentagem de empregados que ganham menos de R$ 1.000,00 e pelo menos R$ 600,00 por mês. Construa o histograma e o polígono de frequência da distribuição. (adaptado de Spiegel)
Salários (R$) |
Funcionários |
500 a 599 |
8 |
600 a 699 |
10 |
700 a 799 |
16 |
800 a 899 |
14 |
900 a 999 |
10 |
1000 a 1099 |
5 |
1100 a 1199 |
2 |
1.8.6 Se os pontos médios de uma distribuição de frequência dos pesos dos estudantes de uma classe são: 64; 68,5; 73; 77,5; 82; 86,5 e 91 quilos, determinar: (a) a amplitude do intervalo de classe; (b) os limites reais de classe; (c) os limites de classe, admitindo-se que os pesos foram determinados com precisão de até meio quilo. (Spiegel)
1.8.7 Em um conjunto de 150 medidas, o menor valor é 5,18 metros e o maior valor é 7,44 metros. Determinar um conjunto conveniente de:
(a) intervalos de classe;
(b) limites de classe;
(c) pontos médios de classe;
que podem ser usados na formação de uma distribuição de frequência dessas medidas. (Spiegel
1.8.8 Na tabela abaixo estão relacionados os pesos em quilos de 50 estudantes da Universidade. (a) Construir uma distribuição de frequência com estes dados; (b) Construir o histograma da distribuição; (c) Construir a ogiva de frequência acumulada decrescente da distribuição. (Adaptado de Spiegel).
75 |
101 |
68 |
84 |
63 |
49 |
77 |
52 |
92 |
58 |
37 |
71 |
59 |
58 |
54 |
82 |
62 |
53 |
67 |
61 |
61 |
67 |
78 |
69 |
69 |
58 |
49 |
48 |
71 |
72 |
64 |
58 |
66 |
79 |
70 |
62 |
64 |
82 |
54 |
94 |
90 |
69 |
67 |
57 |
82 |
73 |
72 |
64 |
63 |
70 |