Medidas de Posición y Dispersión

Indice

Medidas de Posición

Media Aritmética

Es la suma de todos los valores de una población o muestra, dividida entre el número de valores sumados.
Los valores extremos tienen efectos importantes sobre la media.

Población: Se utiliza la letra griega µ para simbolizar la media de la población, y N para el número de valores de la población.
Muestra: se utiliza para identificar a la media de la muestra y n para indicar el número de valores de la muestra

Para n valores no agrupados:

M(x) = = (å xi) / n

Para n valores ordenados en una tabla de frecuencias:

M(x)  = = 1/n å xi fi = å xi hi

 

Mediana

La mediana de un conjunto finito de valores es aquel valor que divide al conjunto en dos partes iguales, dejando a su izquierda y a su derecha la misma cantidad de datos. 
Los valores deben estar ordenados de menor a mayor. 
Los valores extremos no tienen efectos importantes sobre la mediana, lo que sí ocurre con la media.
Para n impar: la mediana es el valor de la posición (n+1)/2
Para n par: la mediana es la media aritmética de los dos valores centrales.

Para tabla de frecuencias de variables discretas:

PosMe = (n+1) / 2

Luego buscamos en la tabla el Fi que contenga este valor.
La media será el xi que corresponda a ese Fi.

Para tabla de frecuencias de variables contínuas (con intervalos):

Me = Li + c [ (PosMe - F(i-1)) / fi ]

Donde:

PosMe = (n+1) / 2   (luego buscamos en la tabla el Fi que contenga este valor. El intervalo mediana será el que corresponda a ese Fi)
Li = límite inferior del intervalo mediana
c = amplitud del intervalo
F(i-1) = frecuencia acumulada del intervalo anterior al intervalo mediana
fi = frecuencia absoluta del intervalo mediana

Ejemplos

Para la Tabla 1:

PosMe = (10 + 1) / 2 = 5,5

Le corresponde la F3 = 8

Me = x3 = 2

Para la Tabla 2:

PosMe = (20 + 1) / 2 = 10,5

Le corresponde la F3 = 14. El intervalo mediana es el [15 - 19,9]

Me = 15 + 5 [ (10,5 - 10) / 4) ] = 15.625

Se debe adicionar al límite inferior del intervalo mediana una parte de él que sea proporcional al número de observaciones que le corresponde. 

Modo

El modo de un conjunto de valores es aquel valor que ocurre con mayor frecuencia (al que le corresponde la mayor frecuencia absoluta). Si todos los valores son diferentes no hay modo. Por otra parte, un conjunto de valores puede tener más de un modo.

Para n valores sin agrupar: es el valor de la variable de mayor frecuencia.

Para tabla de frecuencias de variables discretas: es el xi correspondiente al mayor fi

Para tabla de frecuencias de variables contínuas (con intervalos):

Existirá un intervalo modal, correspondiente al mayor fi. Luego:

Md = Li + c [ f(i+1) / (f(i+1) + f(i-1)) ]

Se aumenta el límite inferior del intervalo modal en una cantidad proporcional a las frecuencias de las clases que rodean a este intervalo.

Ejemplos

Para la Tabla 1:

El valor 1 (x2) es el que tiene mayor frecuencia (f2 = 4)

Para la Tabla 2:

Intervalo modal = [5 - 9,9]

Md = 5 + 5 [ 4 / (4 + 0) ] = 10

 

Medidas de Dispersión

Una medida de dispersión conlleva información respecto a la cantidad total de variablidad presente en el conjunto de datos. Si todos los datos son iguales, no hay dispersión, pero mientras más difieran entre sí existirá mayor dispersión. La magnitud de la dispersión es pequeña cuando los datos son cercanos entre sí.

En el siguiente ejemplo vemos dos distribuciones con igual media pero diferente cantidad de dispersión.

 

Varianza

Mide  la dispersión en función del esparcimiento alrededor de su media.

Para n valores no agrupados:

S2 = [ å xi2 - ((å xi)2 / n)] / (n-1)

Para n valores ordenados en una tabla de frecuencias:

S2 = [ å xi2 fi  -  ((å xifi)2 / n)] / (n-1)

La razón de dividir entre (n-1), en lugar de n, es una consideración teórica conocida como grados de libertad, que será discutido más adelante.

 

Desviación Estándard

Se utiliza para obtener un resultado con las mismas unidades que las de la variable original. Simplemente de aplica la raiz cuadrada a la varianza.

S = Ö(S2)

 

Coeficiente de Variación

Se utiliza cuando se quiere comparar la dispersión de dos conjuntos de datos, ya que la comparación de las dos desviaciones estándar puede dar un resultado equivocado. Esto ocurre porque los dos conjuntos de datos pueden estar expresados con distintas unidades, o los datos pueden ser de distinta magnitud, pero las desciaciones estándard dan igual.

C.V. = (S / ) 100

Se lo suele multiplicar por 100 para expresarlo como porcentaje.