|
||
|
Un portal en el océano de Internet |
|
|
||
|
||
Variable aleatoria |
||
Estadística
2. Variables aleatorias
2.1 Variable aleatoria
Al describirse un espacio muestral correspondiente a un experimento aleatorio no siempre se obtienen resultados numéricos, por ejemplo, si se define como experimento el observar el resultado de un tratamiento, se considera el espacio muestral:
S1 ={mejoró; empeoró; sigue igual}
En el cual los sucesos elementales no son resultados numéricos.
En numerosas experiencias no va a interesar observar un resultado no numérico y anotarlo como numérico para facilitar el cálculo de probabilidades.
Podemos entonces asignar a cada resultado no numérico del experimento un valor numérico, por ejemplo en S1: “mejoró”= 1, “sigue igual”= 0, “empeoró”= -1.
De ésta manera, a cada elemento del espacio muestral le hacemos corresponder un número real. Ese número real que asignamos a cada elemento de S1 podemos pesarlo como el valor de una función del espacio muestral S1 en el conjunto R de los números reales. Si a esa función la designamos con X, será X: S1 → R
X(mejoró) = 1; X(empeoró) = -1; X(sigue igual) = 0
Si arrojamos un dado y observamos el número que queda hacia arriba, el espacio de resultados será:
S={1; 2; 3; 4; 5; 6} En éste caso y también podemos definir una función W: S→R asignándole a cada resultado el mismo número, es decir, definiendo W(s)=s
A éste tipo de funciones definidas en un espacio muestral que toman valores en los números reales las llamaremos variables aleatorias, y las vamos a designar con letras latinas mayúsculas (W; X; Y….).
Si S es el espacio de resultados de un experimento aleatorio, una variable aleatoria es una función que a cada elemento de S le hace corresponder un número real. Si llamamos X a la variable aleatoria
; si , X(s)
Si el experimento aleatorio consiste en colocar 5 semillas en distintas macetas y observar cuantas de ellas germinan, podríamos definir al variable aleatoria:
Z = número de semillas que germinan en una maceta de un total de 5 semillas.
El espacio muestral S2 sería:
S2 = {0; 1; 2; 3; 4; 5}
Con esta definición el número real asignado a cada elemento de S2 coincidirá con ese resultado y la función definida será la identidad;
Z(s) = s
Llamaremos recorrido de una variable aleatoria X al conjunto de todos los valores que puede tomar X.
Lo designaremos con Rx y será entonces un subconjunto de los números reales.
En el ejemplo del dado Rx = {1; 2; 3; 4; 5; 6} y en el de las semillas será Rz = {0; 1; 2; 3; 4; 5}
2.2 Variables aleatorias discretas
Variable aleatoria discreta es aquella cuyo recorrido es un conjunto finito o infinito numerable de los números reales.
Los valores de una variable aleatoria discreta pueden ponerse en correspondencia biunívoca con los números enteros o con una parte de ellos, por lo tanto entre dos valores consecutivos de una variable aleatoria discreta hay números reales que no pueden pertenecer al recorrido de la variable aleatoria. Es evidente que si Z = número de semillas que germinan en una maceta de un total de 5, entre los valores 0 y 1 no hay ningún valor de la variable puesto que no podemos observar, por ejemplo, 0,7 semillas que germinan.
Si X es una variable aleatoria discreta podremos escribir:
Rx = {x1; x2; x3;…..xn;….}
Donde cada xi indica un valor de la variable aleatoria.
No todos esos valores serán, en general, igualmente probables, sino que cada xi tendrá asignada una probabilidad de acuerdo con la experiencia.
Para caracterizar una variable aleatoria debemos conocer su recorrido y la probabilidad de cada elemento de su recorrido.
Si X es una variable aleatoria discreta llamaremos función de probabilidad de X a la función Rx → R que a cada valor de X le asigna su correspondiente valor de probabilidad.
Si xi Rx, P(xi) = P(X = xi)
Ejemplo:
Consideremos la variable aleatoria X = número de caras que se obtienen al arrojar dos monedas.
S = {CC; CS; SC; SS} y Rx = {0; 1; 2}
2 1 1 0
Si las monedas están equilibradas, podemos suponer que los cuatro elementos del espacio de resultados son igualmente probables, entonces cada uno tendrá probabilidad de ¼.
Definiremos entonces la siguiente función de probabilidad P: Rx → R
p(0) = P (X=0) = ¼ corresponde al suceso {SS}
p(1) = P (X=1) = ½ corresponde al suceso {CS; SC}
p(2) = P (X=2) = ¼ corresponde al suceso {CC}
Esto lo podemos expresar por medio de una tabla
Valor xi de X |
0 |
1 |
2 |
p(xi) |
1/4 |
1/2 |
1/4 |
Si hacemos el gráfico de p tenemos:
Gráfico de la función de probabilidad para la variable aleatoria X
p(xi) |
|
|
|
|
|
|
|
1/2 |
|
|
|
|
|
|
|
1/4 |
|
|
|
|
|
|
|
0 |
1 |
2 |
xi |
La función de probabilidad de una variable aleatoria discreta tiene las siguientes propiedades:
1) p(xi) ≥ 0
2) ∑ p(xi) = 1
xi
Ejemplo 2:
Si tiramos un dado equilibrado todos los resultados serán igualmente probables, ¿cómo definimos entonces la función de probabilidad?
Si W= número que obtenemos al tirar un dado equilibrado, la función de probabilidad p: Rw → R será p(wi)= 1/6 , puesto que hay 6 resultados posibles, todos con igual probabilidad.
Valor wi de W |
1 |
2 |
3 |
4 |
5 |
6 |
p(wi) |
1/6 |
1/6 |
1/6 |
1/6 |
1/6 |
1/6 |
Gráfico de la función de probabilidad para la variable aleatoria W
|
|
|
|
|
|
|
|
|
|
|
|
p(wi) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1/6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
|
wi |
|
|
Si conocemos el recorrido de una variable aleatoria discreta X y su correspondiente función de probabilidad, diremos que conocemos la distribución de probabilidad de la variable aleatoria, o simplemente la distribución de X.
Conocida la distribución de probabilidad de una variable X podemos calcular P(a < X ≤ b) para cualquier par de números reales a,b con a < b.
Por ejemplo, si X = número de caras obtenidas al arrojar dos monedas, para calcular P(-1 < X ≤ 1) debemos ver que valores de X pertenecen al intervalo (-1; 1] y sumar las probabilidades correspondientes.
Como esos valores son 0 y 1 será:
P(-1 < X ≤ 1) = p(0) + p(1) = ¾ ; es decir, P(-1 < X ≤ 1) = ∑ p(xi)
-1<xi≤1
En general tendremos el siguiente resultado:
P(a < X ≤ b) = ∑ p(xi) si el intervalo (a;b] no contiene valores de la variable, P(a<X≤b)=0
a<X≤b
Podemos entonces definir para una variable aleatoria X una función que a cada le asigna .
Fijada la variable aleatoria X, será un número perteneciente al intervalo [0;1] , que dependerá del valor que tome t.
Si X es una variable aleatoria discreta llamaremos función de distribución de X a la función FX: R → R definida por: FX(t) =
Si RX = {x1; x2; x3;………;xn}
P() = ∑ p(xi) ; entonces
FX(t) = ∑ p(xi)
Hallaremos ahora la función de distribución para la variable aleatoria W del ejemplo 2, donde p(wi) = 1/6
0 si t < 1
1/6 si< 2
1/3 si< 3
FW(t) = ½ si< 4
2/3 si< 5
5/6 si 5< 6
1 si
Gráfico de la función de distribución para la variable aleatoria W.
La probabilidad de que una variable aleatoria tome valores pertenecientes a un intervalo la podemos calcular conociendo P() para cualquier , es decir, conociendo la función de distribución de X, esto lo podemos hacer utilizando la siguiente fórmula:
P(a < X) = FX(b) – FX(a)
Si quisiéramos hallar la probabilidad de obtener más de una cara al tirar dos monedas, deberíamos calcular P(X > 1). Esto no lo podemos obtener utilizando directamente la función de distribución, pero sabemos que .los sucesos {X > 1] y {} son complementarios, entonces:
P(X > 1) = 1 – P( ) = 1 – FX(1) = 1 – ¾ = ¼
En general vale la siguiente fórmula:
Si , P(X > a) = 1 – FX(a)
Cuando trabajamos con variables aleatorias discretas y calculamos P(a < X) debemos tener en cuenta que estamos excluyendo el número “a” de los valores de X para los cuales hallamos la probabilidad. Si RX obtenemos el mismo resultado al calcular P( que al calcular , pero si a RX y p(a) ≠ 0 el resultado no es el mismo.
2.3 Variables aleatorias continuas
Variable aleatoria continua es aquella cuyo recorrido es el conjunto de los números reales o un intervalo de los números reales.
Las variables aleatorias X: peso del contenido de un envase y T: tiempo que transcurre hasta que llega el primer cliente, son variables aleatorias continuas.
En general se definirán variables aleatorias continuas en espacios de resultados correspondientes a experiencias que consisten en medir sobre una escala de medida, peso, longitud, tiempo, etc.; mientras que se definirán variables aleatorias discretas en espacios de resultados en los que la experiencia consiste en conteo o numeración, o en la observación de alguna cualidad.
En las variables aleatorias discretas se observa que entre dos valores consecutivos de la variable existen siempre números reales que no forman parte del recorrido; esto no ocurre con las variables aleatorias continuas. Una variable aleatoria continua puede tomar cualquier valor a lo largo de un intervalo de números reales, y, entre dos valores de la variable hay siempre otros valores posibles de ella.
Si consideramos por ejemplo la variable aleatoria X: peso del contenido de un envase expresado en gr., algunos de los valores observados pueden ser 98, 105, 120. Si nuestro instrumento de medición sólo registra los gramos, el valor observado no indica exactamente que el peso estará comprendido entre 119,5 y 120,5 gr.
Es decir que cualquier lectura de una variable aleatoria continua es una aproximación al valor exacto que, en la práctica, jamás podemos conocer.
Puesto que no podemos numerar los elementos del recorrido de una variable aleatoria continua, tampoco podemos definir una función de probabilidad como se hizo para las variables aleatorias discretas.
Necesitamos entonces una función que para cada valor x de la variable aleatoria, nos permita calcular la probabilidad de que la variable tome valores cercanos a ese valor x.
Dicha función deberá estar definida para todos los valores de posibles de X, es decir, para todos los números reales, y, por medio de ella, debemos poder calcular P(a < X para cada intervalo ( a ; b ) de la recta. La llamaremos función de densidad y calcularemos esa probabilidad hallando el área limitada por su grafico sobre el intervalo ( a ; b ).
Si X es una variable aleatoria continua llamaremos función de densidad de X a la función f: R → R que tiene las siguientes propiedades:
1) f(x)
2) -∞ ∫ +∞ f(x) dx = 1
3) si a,b son números reales, a < b = a ∫ b f(x) dx.
El área rayada es
De la definición de función de densidad se deduce que:
, P( x = a) = a ∫ a f(x) dx = 0
Este resultado está de acuerdo con el hecho que el valor exacto de X=a en la práctica no podemos observarlo.
Si x es una variable aleatoria continua valen las siguientes igualdades:
Debemos tener en cuenta que el valor de f(x) no representa una probabilidad, sólo si integramos f(x) entre dos límites obtenemos la probabilidad de que la variable aleatoria tome valores entre esos límites.
Si X es una variable aleatoria continua llamaremos función de distribución de X a la función FX : R → R definida por:
FX(t) =
Para hallar el valor de la función de distribución en un punto, debemos calcular el área encerrada por la función de densidad a la izquierda de ese punto.
Para cada t , FX(t) es el valor del área rayada.
Como el área se calcula mediante una integral, si f es la función de densidad de X:
FX(t) = -∞ ∫ t f(x) dx
Si a y b son números reales (a < b), vale la siguiente propiedad:
P(= Fx(b) – Fx(a)
2.4 Esperanza de una variable aleatoria
Si conocemos la distribución de una variable aleatoria podemos hallar ciertos números que caracterizan a la distribución y nos proporcionan información acerca de la variable y del fenómeno al que está asociada. A estos números los llamaremos parámetros de la distribución.
El primer parámetro que vamos a definir es la esperanza. Para definirla distinguiremos entre variables aleatorias continuas y discretas
Si X es una variable aleatoria discreta, su recorrido es Rx = {x1; x2; …….xn…} y p: Rx → R es la función de probabilidad, la esperanza de X la definiremos como:
E(X) = ∑ xi . p(xi)
A este valor también lo llamaremos media, valor medio o valor esperado y, en algunos casos lo designaremos con la letra griega μ.
Calcularemos la E(X) para la variable aleatoria del ejemplo X: númerode cara s obtenidas al arrojar dos monedas.
Recordemos que p(0) = ¼ ; p(1) = ½ ; p(2) = ¼
Entonces: 3
E(X) = ∑ xi . P(xi) = 0 . ¼ + 1 . ½ + 2 . ¼ = 1
i = 1
Esto significa que si repetimos la experiencia un gran número de veces y sacamos el promedio de los valores obtenidos éste se acercará mucho al valor obtenido para E(X).
Si X es una variable aleatoria continua y f: R → R es su función de densidad, la esperanza la definiremos como:
E(X) = -∞ ∫ +∞ x f(x) dx
Supongamos que tenemos la siguiente función de densidad:
¼ x + ½ si
f(x) =
0 si
E(X) = -∞ ∫ +∞ x f(x) dx = -1 ∫ 1 x (1/4x + ½) dx = -1 ∫ 1 ( ¼ x2 + ½ x) dx =
¼ x3/3 + ½ x2/2 |1-1 = 1/6
Las siguientes propiedades son válidas tanto para variables aleatorias continuas como discretas:
Si X e Y son variables aleatorias y c es un número real:
1) E(c) = c
2) E(cX) = c E(X)
3) E(X + Y) = E(X) + E(Y)
4) Si X1; X2; ……; Xn son variables aleatorias: E( ∑ Xi ) = ∑ E (Xi)
5) Si X e Y son variables aleatorias independientes: E( X . Y) = E(X) . E(Y)
2.5 Varianza de una variable aleatoria
Dijimos que los parámetros de una distribución nos sirven para caracterizar la variable aleatoria y obtener información sobre la experiencia relacionada con ella, la esperanza nos da el valor promedio de los resultados que se obtendrán realizando la experiencia un gran número de veces, o sea el valor esperado para el resultado individual de la experiencia, pero no es suficiente para conocer el comportamiento de la variable este valor dado que, si bien los resultados obtenidos al realizar la experiencia un gran número de veces estarán muy cercanos al valor de la esperanza en torno a el, es necesario tener un valor que nos de una medida de la dispersión de los resultados alrededor del valor medio.
La medida o parámetro de dispersión que definiremos es la varianza.
Si X es una variable aleatoria definimos varianza de X como:
Var(X) = E [ X – E(X) ]2
La indicaremos generalmente como σ2.
La varianza es un número mayor o igual que cero por ser la esperanza del cuadrado de una variable aleatoria. Esta se expresa en unidades cuadradas de X, es decir, si X se expresa en minutos, Var(X) se expresa en (minutos)2, por lo cual consideraremos la desviación estándar que se expresa en las mismas unidades que X.
Si X es una variable aleatoria llamamos desviación estándar de X a la raíz cuadrada positiva de Var(X).
La denotamos con σ, es decir que σ = +√ [Var(X)]
El cálculo de la varianza de una variable aleatoria se simplifica notablemente utilizando la siguiente fórmula:
Var(X) = E(X2) – [ E(X)]2
Calculemos la varianza para la variable aleatoria X: número de caras obtenidas al arrojar dos monedas:
E(X) = 1 (calculado anteriormente)
E(X2) = ∑ xi2 . p(xi) = 02 . ¼ + 12 . ½ + 22 . ¼ = 3/2
Entonces Var(X) = E(X2) – [ E(X)]2 = 3/2 - 12 = ½
Ahora calcularemos la varianza de la variable aleatoria que presenta la siguiente función de densidad:
¼ x + ½ si
f(x) =
0 si
E(X) = 1/6
E(X2) = -∞ ∫ +∞ x2f(x) dx = -1 ∫ 1 x2 (1/4x + ½) dx = -1 ∫ 1 (1/4x3 + 1/2x2) dx =
1/16x4 + 1/6x3 |1-1 = 1/3
entonces Var(X) = 1/3 – (1/6)2 = 11/36
Las siguientes propiedades son válidas para variables aleatorias discretas y continuas:
Si x e Y son variables aleatorias y c es un número real:
1) Var(c) = 0
2) Var(X + C) = Var(X)
3) Var(cX) = c2 Var(X)
4) Si X e Y son variables aleatorias independientes, Var(X + Y) = Var(X) + Var(Y)
5) Si X1; X2;…..; Xn son variables aleatorias independientes,
Var(∑ Xi) = ∑ Var(Xi)
Autor: Gustavo Di Iorio
¿Buscas algo? |
|
|
|
Más monografías | Descarga de juegos | Volver a la página principal de Pesce |
|
Haz click en el link para descargar gratis el nuevo navegador Firefox |
Conoce más sobre Firefox, el navegador que te permite navegar mucho más rápido |