Elementos de Estadística - Distribuciones Muestrales

El campo de la inferencia estadística trata básicamente con generalizaciones y predicciones. Por ejemplo consideremos una máquina despachadora de refresco en la que la cantidad promedio de bebida servida se mantiene en 240 mililitros. Un funcionario de la compañía calcula la media de 40 bebidas y obtiene

= 236 mililitros, y con base en este valor decide que la máquina aún sirve bebidas con un contenido promedio de m = 240 mililitros. Las 40 bebidas representan una muestra de la población infinita de posibles bebidas que esta máquina servirá.

En este ejemplo calculamos una estadística a partir de una muestra que se selecciona de la población, y de esta estadística hacemos afirmaciones con respecto al valor de un parámetro de la población que puede ser cierto o no. El funcionario de la compañia toma la desición de que la máquina despachadora sirve bebidas con un contenido promedio de 240 ml, aunque la muestra de la media fue de 236 ml, porque sabe de la teoría de muestreo que es probable que ocurra tal valor en la muestra. De hecho, si realiza pruebas similares, digamos cada hora, esperaría que los valores de

fluctuaran por arriba y por abajo de m = 240 ml. Sólo cuando el valor de

es considerablemente diferente de 240 ml el funcionario iniciará una acción de ajustar la máquina.

Como una estadística es una variable aleatoria que depende sólo de la muestra observada, debe tener una distribución de probabilidad.

La distribución de probabilidad de una estadística se llama distribución muestral.

La distribución de probabilidad de

se llama distribución muestral de la media.

La distribución muestral de una estadística depende del tamaño de la población, el tamaño de las muestras y el método de elección de las muestras. La distribución muestral de

con tamaño muestral n es la distribución que resulta cuando un experimento se lleva a cabo una y otra vez (siempre con tamaño muestral n) y resultan los diversos valores de

. Esta distribución muestral, entonces, describe la variabilidad de los promedios muestrales alrededor de la media de la población m.

Suponga que una muestra aleatoria de n observaciones se toma de una población normal con media m y varianza s². Cada observación X_i, i= 1,2,... n, de la muestra aleatoria tendrá entonces la misma distribución normal que la población que se muestrea. Entonces

tiene distribución normal con:

Si tomamos muestras de una población con distribución desconocida, finita o infinita, la distribución mustral de

aún será aproximadamente normal con media m y varianza s²/n siempre que el tamaño de la muestra sea grande. Este asombroso resultado es una consecuencia inmediata del siguiente teorema, que se llama teorema central del límite.

Teorema central del límite

Si es la media de una muestra aleatoria de tamaño n tomada de una población con media m y varianza finita s², entonces la forma límite de la distribución de

Z = ( - m) / (s / Ön)

conforme n -> ¥, tiende a la distribución normal estándard n(z; 0,1).

La aproximación normal para

por lo general será buena si n ³ 30 sin importar la forma de la población. Si n < 30, la aproximación es buena sólo si la población no es muy diferente de una distribución normal y, como se estableció antes, si se sabe que la población es normal, la distribución muestral de

seguirá una distribución normal exacta, no importa que tan pequeño sea el tamaño de la muestra.

Ejemplo: Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media (m) de 800 horas y desviación estándard (s) de 40 hs. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de 775 hs.

m = 800 hs
s = 40hs
n = 16
= 775

La distribución muestral de será aproximadamente normal, con

m = 800
s = 40/Ö16 = 10

La probabilidad que se desea está dada por la región sombreada en la figura.

En correspondencia con = 775, encontramos que

z = (775-800)/10 = -2,5

y por tanto

P( < 775) = P(Z < -2,5) = 0,0062