Definizione di
Per ogni categoria, se la i-esima
caratteristica della categoria stessa è presente nel documento da classificare allora
è
settato a
, in caso contrario a
:
![\begin{displaymath}
\Pi(nuovo_documento) = \left[
\begin{array}{c}
x_1 \\
\...
...dots \\
x_w
\end{array} \right], \qquad x_i \in \{ 0, 1\}
\end{displaymath}](img140.png) |
(3.22) |
La variabile
è settata a
(cfr. [1]) poichè è la
soluzione migliore per normalizzare l' output della funziona Gaussiana a
.
Infatti, quando la Presenza di un termine
è uguale a
per una certa
categoria (ovvero, il valor medio della rispettiva
è uguale a
), allora
l'output della stessa
è uguale a
quando un documento contiene il
termine
.
Se il termine non è presente invece, chiaramente il risultato
della i-esima funzione Gaussiana equivale a
.
Alessio Pace
2004-03-26