Hard Categorization vs Ranked Categorization

Una categorizzazione come quella esposta nella prima parte di questa sezione, ovvero una funzione del tipo:

\begin{displaymath}
\phi: D \times C \longrightarrow \left\{True, False\right\}
\end{displaymath}

compie quella che viene chiamata Hard Categorization.

La possibile alternativa (Ranked Categorization) è quella di permettere a $\phi$ di avere come risultato un valore reale nell' intervallo $\left[0, 1\right]$, in modo da aver una stima di quanto un documento sia appropriato per una certa categoria.

GAME (e SpamGAME nel particolare), rientra in questo ultimo ambito, infatti il classificatore, come si vedrà in seguito, riporta una misura da $0$ a $1$ di quando un documento (un messaggio email in SpamGAME) dovrebbe appartenere a una certa categoria predefinita (in SpamGAME le due categorie spam e ham).



Alessio Pace 2004-03-26