DISTRIBUCIONES MUESTRALES
El campo de la inferencia estadística trata básicamente
con generalizaciones y predicciones. Por ejemplo consideremos una máquina
despachadora de refresco en la que la cantidad promedio de bebida servida se
mantiene en 240 mililitros. Un funcionario de la compañía calcula la media de
40 bebidas y obtiene
= 236 mililitros, y con
base en este valor decide que la máquina aún sirve bebidas con un contenido
promedio de m = 240 mililitros. Las 40 bebidas
representan una muestra de la población infinita de posibles bebidas que esta
máquina servirá.
En este ejemplo calculamos una estadística a partir de
una muestra que se selecciona de la población, y de esta estadística hacemos
afirmaciones con respecto al valor de un parámetro de la población que puede
ser cierto o no. El funcionario de la compañia toma la desición de que la
máquina despachadora sirve bebidas con un contenido promedio de 240 ml, aunque
la muestra de la media fue de 236 ml, porque sabe de la teoría de muestreo que
es probable que ocurra tal valor en la muestra. De hecho, si realiza pruebas
similares, digamos cada hora, esperaría que los valores de
fluctuaran por arriba y por abajo de m = 240 ml.
Sólo cuando el valor de
es
considerablemente diferente de 240 ml el funcionario iniciará una acción de
ajustar la máquina.
Como una estadística es una variable aleatoria que depende sólo de la muestra observada, debe tener una distribución de probabilidad.
La distribución de probabilidad de una estadística se llama distribución muestral.
La distribución de probabilidad de
se
llama distribución muestral de la media.
La distribución muestral de una estadística depende del
tamaño de la población, el tamaño de las muestras y el método de elección
de las muestras. La distribución muestral de
con tamaño muestral n es la distribución que resulta cuando un experimento se
lleva a cabo una y otra vez (siempre con tamaño muestral n) y resultan los
diversos valores de
. Esta distribución
muestral, entonces, describe la variabilidad de los promedios muestrales
alrededor de la media de la población m.
Distribución muestral de la media
Suponga que una muestra aleatoria de n observaciones se toma de una
población normal con media m y varianza s2.
Cada observación Xi, i= 1,2,... n, de la muestra aleatoria tendrá
entonces la misma distribución normal que la población que se muestrea.
Entonces
tiene
distribución normal con:
m
= m
s2
= s2/n
Si tomamos muestras de una población con distribución desconocida, finita o
infinita, la distribución mustral de
aún será aproximadamente normal con media m y varianza
s2/n siempre que
el tamaño de la muestra sea grande. Este asombroso resultado es una
consecuencia inmediata del siguiente teorema, que se llama teorema central del
límite.
Si
es la media de
una muestra aleatoria de tamaño n tomada de una población con media m y
varianza finita s2, entonces la forma límite de la distribución de
Z = (
- m) / (s / Ön)
conforme n -> ¥, tiende a la distribución normal
estándard n(z; 0,1).
La aproximación normal para
por lo general será buena si n ³ 30 sin importar la forma de la población.
Si n < 30, la aproximación es buena sólo si la población no es muy
diferente de una distribución normal y, como se estableció antes, si se sabe
que la población es normal, la distribución muestral de
seguirá una distribución normal exacta, no importa que tan pequeño sea el
tamaño de la muestra.
Ejemplo: Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media (m) de 800 horas y desviación estándard (s) de 40 hs. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de 775 hs.
m = 800 hs
s = 40hs
n = 16
= 775
La distribución muestral de
será aproximadamente normal, con
m
= 800
s
= 40/Ö16 = 10
La probabilidad que se desea está dada por la región sombreada en la figura.

En correspondencia con
= 775, encontramos que
z = (775-800)/10 = -2,5
y por tanto
P(
< 775) = P(Z < -2,5) = 0,0062