Come già detto, ogni benchmark è stato ripetuto due volte: la prima volta usando la stoplist dell' Appendice A, la seconda senza usare alcun elenco di parole non rilevanti. In questo modo si è voluto cercare di capire l' importanza o no di questo fattore nelle prestazioni della classificazione di messaggi di posta elettronica.
I parametri variabili durante le misurazioni in ogni tipo di benchmark per ciascuna classe di test sono stati
i valori dei due threshold: ThreshP e ThreshE. Dai test sperimentali effettuati
sull'algorimo GAME generico, i valori di default sono stati impostati
rispettivamente a
e
, ma durante i benchmark del sistema queste variabili
sono state variate leggermente per vedere quali valori realmente portassero alle migliori prestazioni.