I risultati dei test

Nei test le white list e black list non sono state usate, sono state pertanto lasciate come da default vuote. Il loro uso avrebbe potuto contribuire sicuramente ad miglioramento delle prestazioni, e il loro uso è certamente raccomandato in situazioni di utilizzo ``reale'' dell' applicazione.

Come già detto, ogni benchmark è stato ripetuto due volte: la prima volta usando la stoplist dell' Appendice A, la seconda senza usare alcun elenco di parole non rilevanti. In questo modo si è voluto cercare di capire l' importanza o no di questo fattore nelle prestazioni della classificazione di messaggi di posta elettronica.

I parametri variabili durante le misurazioni in ogni tipo di benchmark per ciascuna classe di test sono stati i valori dei due threshold: ThreshP e ThreshE. Dai test sperimentali effettuati sull'algorimo GAME generico, i valori di default sono stati impostati rispettivamente a $0.02$ e $0.9$, ma durante i benchmark del sistema queste variabili sono state variate leggermente per vedere quali valori realmente portassero alle migliori prestazioni.



Subsections
Alessio Pace 2004-03-26