DISTRIBUCIONES DE PROBABILIDAD

Indice

Distribuciones discretas de probabilidad

Binomial

Distribuciones contínuas de probabilidad

Normal
Normal estándard
Ji-Cuadrado
t de student

Distribuciones discretas de probabilidad

Cuando en un solo ensayo de algún proceso o experimento puede ocurrir sólo uno de dos resultados mutuamente excluyentes, como vida o muerte, alivio o enfermedad, macho o hembra, el ensayo se llama ensayo de Bernoulli.

Una secuencia de ensayos de Bernoulli forma un proceso de Bernoulli, si se cumplen las siguientes condiciones:

En cada ensayo ocurre uno de dos posibles resultados, mutuamente excluyentes. Uno de los posibles resultados se denota (arbitrariamente) como un éxito y el otro como un fracaso.
La probabilidad de un éxito, denotado por p, permanece constante de un ensayo a otro, y la probabilidad de fracaso, 1-p, se denota con q.
Los ensayos son independientes, es decir, el resultado de algún ensayo en particular no es afectado por el resultado de cualquier otro ensayo.

Se utiliza la siguiente fórmula:

f(x) = _nC_x p^x q^n-x

Otra forma de escribirlo:

p(x) = p^x (1-p)^1-x para x=0 y x=1; 0 £ p £ 1

p(x) = 0 para otros valores de x

y tiene

E(x) = np
V(x) = np(1-p)

EL cálculo de la probabilidad utilizando esta ecuación puede ser una labor difícil si el tamaño de la muestra es grande. Por eso las probabilidades para diferentes valores de n, p y x ya están tabuladas.

Ejemplo: se sabe que el 30 por ciento de la población es inmune a alguna enfermedad. Si se escoge una muestra de 10 elementos de entre esta población, ¿cual es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes?

p= 0,3
q = 0,7
n = 10
x = 4

Utilizando la fórmula:

f(4) = ₁₀C₄ (0,7)⁶ (0,3)⁴ = 10!/4!6! * (0,1176) (0,0081) = 0,2001

Utilizando la tabla:

Se busca en la tabla el valor para n=10, x=4 y p=0,30. Este valor representa la probabilidad acumulada hasta x=4, es decir es igual a P(X £ 4). Para hallar P(x=4) se le debe restar a este valor el de P(X £ 3). Entonces:

P(X £ 4) = 0,8497
P(X £ 3) = 0,6496

P(x=4) = 0,8497 - 0,6496 = 0,2001

Cuando p > 0,5

Se deberá replantear el problema en términos de la probabilidad de un fracaso (1-p), en lugar de la probabilidad de un éxito:

P(X = x|n, p > 0,5) = P(X = n-x|n, 1-p)

Que se lee: "la probabilidad de que X sea igual a algún valor específico, dado el tamaño de la muestra y la probabilidad de éxito mayor a 0,5 es igual a la probabilidad de que X sea igual a n-x dado el tamaño de la muestra y la probabilidad de un fracaso, 1-p.

Distribuciones contínuas de probabilidad

Si tuviéramos una gran cantidad de valores de una variable contínua y construyéramos un histograma con intervalos muy pequeños, la forma del mismo se acercaría a la de una curva suave.

El área inferior a la curva igual a 1.
La frecuencia relativa de ocurrencia para los valores entre dos puntos específicos cualesquiera, sobre el eje de las x, es igual al área total delimitada por la curva, el eje de las x y las rectas perpendiculares levantadas sobre ambos puntos del eje eje de las x.
La probabilidad de cualquier valor específico de la variable aleatoria es cero.

Función de densidad:

Para calcular las subáreas por debajo de la curva se debe utilizar el cálculo integral. Por ejemplo, para calcular el área bajo la curva entre dos puntos a y b, se integra la función de densidad de a a b. Una función de densidad es una fórmula empleada para representar la distribución de una variable aleatoria contínua.

Distribución normal

La función de densidad es:

f(x) = ( 1 / sÖ(2p) ) * e^-^{1/2 ((x-m)/s)2}

y tiene

E(x) = m
V(x) = s²

Los datos p y e son conocidos, por lo que los únicos parámetros m (media) y s (desviación estándard).
La gráfica de ésta distribución produce la conocida curva en forma de campana.

Características importantes de la distribución normal:

Es simétrica respecto a su media.
La media, mediana y modo son iguales.
El área total bajo la curva es uno.
Los parámetros m y s determinan completamente la distribución normal. En otras palabras, por cada valor diferente de de m y s se especifica una distribución normal diferente. Los valores de m trasladan la gráfica a lo largo del eje x. Los valores de s determinan el grado de aplanamiento o levantamiento de la gráfica.
Si se levantan perpendiculares a ambos lados de la media, a distancias de:

una desviación estándard: el área delimitada será de un 68% del total.
dos desviaciones estándard: el área delimitada será del 95% aprox.
tres desviaciones estándard: el área delimitada será aprox el 99,7%

Distribución normal estándard

Tiene las siguientes características:

Media (m) = 0
Desviación estándard (s)= 1
Se utiliza z en vez de x.

Para ésta distribución no es necesario realizar cálculos porque existen tablas con los reultados de todas las integraciones en las que se pueda estar interesado.

Para resolver casos que poseen una distribución normal no estándard, es posible transformarlas en estándard. Lo que se hace es transformar todos los valores de X en valores correspondientes de z. Esto significa que la media de X debe igualar a 0, que es la media de z. Se utiliza la siguiente fórmula:

z = (x - m) / s

Se transforma en cantidad de desviaciones estándard a la distancia entre la x y la media.

Ejemplo:

Un profesor piensa que los puntajes de un exámen tienen una distribución aproximadamente normal, con una media de 10 y una desviación estándard de 2.5. Si a un individuo, elegido aleatoriamente, se le aplica el exámen, ¿cuál es la posibilidad de que logre un puntaje de 15 o más puntos?

Primero se dibuja la campana centrado en m = 10, y se sombrea el subárea a partir de x=15 hacia la derecha.
Se deben estandarizar los datos: se debe determinar que valor de z corresponde a una x de 15.

z = (15-10) / 2,5 = 5 / 2,5 = 2

Analizando, vemos que la distancia desde la media, 10, para el valor de interés de x=15 es 5, que es una distancia de dos desviaciones estándard. Cuando los valores de x son transformados a valores de z quedan expresados en unidades de desviación estándard.
Al consultar la tabla se encuentra que el área a la derecha de z=2 es 0,0228.
El análisis se resume de la siguiente forma:

P(x ³ 15) = P (z ³ (15-10)/2,5) = P(z ³ 2) = 0,0228
Respuesta: la probabilidad de que un individuo, elegido aleatoriamente, obtenga 15 o más puntos en el exámen es de 0,0228...

Distribución Ji-Cuadrado (C²)

Sean X₁, X₂, ..., X_n n variables aleatorias contínuas, independientes y cada una con distribución normal de media m_i y varianza s²_i. La variable aleatoria:

U = å ((X_i - m_i)/s_i)² = å Z_i²

tiene función de densidad:

f(U) = (1 / ([(n/2)-1]! . 2^n/2)) * U^(n/2)-1 * e^-U/2

y tiene:

E(U) = n
V(U) = 2n

donde n representa el número o cantidad de términos independientes que son sumados para construir la variable U y recibe el nombre de grados de libertad. Es es el único parámetro de la distribución.

La función de distribución f(U) está tabulada para diversos valores del parámetro grados de libertad y permite calcular probabilidades del tipo P(U £ u).

Notación:
X²_n = variable aleatoria con ditribución ji-cuadrado
X²_n;(1-a) = valor particular de la variable aleatoria que acumula entre 0 y él mismo el 100(1-a)% del área total, con 0 £ a £ 1.

Ejemplo: se representa la función X²_10;(1-a)

Distribución t de Student

Sean las variables aleatorias X y U, independientes y con distribución N(m;s²) (normal) y X²_n (ji-cuadrado) respectivamente. La variable aleatoria:

t = ((X - m) / s ) / Ö(U/n)

que se puede escribir:

t = Z / Ö(X²/n)

tiene función de densidad:

f(t) = [((n-1)/2)! / Ö(np) ((n-2)/2)!] * [1+(t²/n)]^(n+1)/2

y tiene:

E(t) = 0
V(t) = n/(n-2)

La variable aleatoria t se contruye mediante el cociente entre una variable aleatoria N(0;1) y la raíz cuadrada de una variable aleatoria ji-cuadrado dividida por sus grados de libertad. La restricción fundamental es de que las dos variables deben ser estadísticamente independientes. Como consecuencia de su estructura esta distribución depende del parámetro n llamado grados de libertad. La función de distribución, F(t), está tabulada para diversos valores de n.

Notación:
t_n = variable aleatoria con distribución de Student con n grados de libertad
t_n;(1-a) = valor particular de la variable aleatoria tal que (1-a) = P(t_n £ t_n;(1-a))

La distribución tiene las siguientes propiedades:

Tiene una media de 0.
Es simétrica con respecto a la media.
En general, tiene una varianza mayor que 1, pero ésta tiende a 1 a medida que aumenta el tamaño de la muestra.
La variable t va desde -¥ hasta +¥.
Hay una distribución diferente para cada valor de la muestra de n-1.
La distribución t es menos espigada que la normal y tiene colas más largas.
La distribución t se aoproxima a la distribución normal a medida que n-1 se aproxima al infinito.
Historia de la distribución t de Student