Il vettore
diventa dunque il seguente:
Dato un set di categorie
, ciascuna
categoria avente (per semplicità) un numero di documenti
(ad es:
), vengono date le seguenti
definizioni:
dove come già definiti,
sono il numero di categorie e
il numero di
documenti per ciascuna categoria
mentre l'Espressività
di un termine
nella k-esima categoria è
calcolata tramite:
E' importante far notare come lo stesso termine in categorie differenti abbia
diversi valori di espressività. Per un esempio di ciò, si guardi la Tabella 3.1.
Un termine
è presente in tutte e tre le categorie e la sua presenza
è mostrata nella prima riga. La seconda riga mostra i valori di espressività
dello stesso termine per ogni categoria.
|
Si nota come il termine
della categoria
abbia una espressività maggiore
poichè lo stesso termine ha un relativamente piccola presenza nel resto del
dominio.
Alessio Pace 2004-03-26