Estimação
Denise Aparecida Botter
Clélia Maria de Castro Toloi
Gilberto Alvarenga Paula
Objetivo: Estimar uma proporção p
Tipos de Estimação
Exemplos
p: proporção de estudantes de 1o grau do estado de São Paulo que necessitam de algum tratamento Fonoaudiológico;
p: proporção de veículos cadastrados no Detran de São Paulo fabricados até o ano passado que estejam emitindo monóxido de carbono acima do permitido;
p: proporção de eleitores que votaram num de determinado candidato na última eleição;
p: proporção de eleitores da cidade de São Paulo que votariam num determinado candidato a prefeito se a eleição fosse hoje;
p: proporção de domicílios brasileiros com microcomputador.
Considere
Seja
k: número de estudantes que numa pesquisa responderam "sim" dentre n entrevistados.
Estimativa Pontual
Suponha que foram entrevistados n=500 estudantes e que k=100 afirmaram que foram ao teatro pelo menos uma vez no último mês. Então, a estimativa pontual fica dada por
Ou seja, 20% dos estudantes afirmaram que foram ao teatro pelo menos uma vez.
onde:
e : erro ou margem de erro.
Afirma-se ainda que a estimativa intervalar tem coeficiente de confiança g = P(e ).
Formalmente,
que pode ser escrito na forma
Supondo que K ~ B(n,p) temos
que para n grande) a variável aleatória tem distribuição N(0,1). Assim, para n grande
onde Z ~ N(0,1).
Chamando temos que P(e ) = P{ -z £ Z £ z }.
Assim, podemos obter z conhecendo P(e ).
Podemos também mostrar que o tamanho amostral n dados z e a margem de erro e fica dado por
De forma similar podemos mostrar que o erro e é dado por
Note que dado P(e ) podemos obter facilmente z pela tabela normal através da relação
P(e ) = 2A(z)-1, z ³ 0
onde A(z) = P(Z £ z). Segue abaixo alguns exemplos
P(e ) = 0,954 Þ z=2,00
P(e ) = 0,950 Þ z=1,96
P(e ) = 0,900 Þ z=1,65
Exemplo da USP
Vamos supor que temos k=100 e n=500. Qual é a probabilidade da estimativa pontual estar a uma distância de no máximo 3% proporção verdadeira?
Dados no problema: n=500
e =0,03
Como p é
desconhecido utilizamos a estimativa no lugar
de p. Para obter P(e ) precisamos conhecer z que depende
de e e de p.
Cálculo de z:
Logo, obtemos
= 2A(1,68) - 1
= 2x0,953 - 1
= 0,906 (90,6%)
Como vimos anteriormente o tamanho amostral que garante a confiabilidade P(e ) e erro e é dado por
que depende de p(1-p). Para
eliminarmos p(1-p) da expressão acima, substituimos
esse valor pelo seu máximo, que é . Assim, trabalha-se na prática com um n maior que o
necessário
Exemplo da USP
Quantos estudantes precisamos consultar de modo que a estimativa pontual esteja no máximo a 2% da proporção verdadeira com uma probabilidade aproximada de 0,95 ?
Dados no problema: e =0,02
P(e )=0,95 Þ z=1,96
Então,
= 2401 estudantes
Pergunta: é possível reduzir o tamanho da amostra quando tem-se alguma informação a respeito de p?
Por exemplo, sabemos que
p não é superior a 0,30
p é pelo menos 0,80
p está entre 0,30 e 0,60
Resposta: depende da informação sobre p. Em alguns casos poderemos substituir a expressão p(1-p) que aparece na expressão de n por um valor menor que 0,25.
Vamos construir a Figura 7.1(p. 126 do texto). No eixo X (abcissa) temos os valores de p e no eixo Y (ordenada) temos os valores de p(1-p). Segue abaixo alguns valores:
p | p(1-p) |
0,10 | 0,09 |
0,20 | 0,16 |
0,30 | 0,21 |
0,40 | 0,24 |
0,50 | 0,25 |
0,60 | 0,24 |
0,70 | 0,21 |
0,80 | 0,16 |
0,90 | 0,09 |
Podemos notar pela figura o seguinte:
Na fórmula de n substituimos p(1-p) pelo seu valor máximo. Se p varia no intervalo [0,1] então
Porém, se p é no máximo 0,30 (p£ 0,30) então o máximo de p(1-p) é dado por 0,3x0,7=0,21. Logo, reduzimos n para
Se p é pelo menos 0,80 (p³ 0,80) então o máximo de p(1-p) é dado por 0,8x0,2=0,16. Logo, temos
Por outro lado, se 0,30£ p£ 0,60 o
máximo de p(1-p) é dado por 0,5x0,5=0,25 e portanto
não havendo nenhuma redução nesse caso.
Exemplo da USP
Temos a informação de que no máximo 30% dos alunos da USP foram ao teatro no último mês. Logo, temos que p£ 0,30 e como vimos anteriormente o máximo de p(1-p) nesse caso é dado por 0,21. Assim, precisamos consultar
= 2017 estudantes
Uma redução de 2401-2017=384 estudantes.
A estimativa intervalar para p tem a forma
onde
Na prática substituimos p por obtendo
a estimativa intervalar
Exemplo da USP
Temos que e
. Vamos obter uma
estimativa intervalar de coeficiente g =0,95 para p. Logo P(e )
= 0,95 Þ z=1,96.
Essa estimativa é dada por
=
=
[0,20-0,035; 0,20 +0,035] =
[0,165; 0,235]