Innovazioni rispetto ai filtri dello Stato dell' Arte
SpamGAME è il primo filtro anti spam ad avere come metodo (principale) di classificazione GAME e
le prestazioni raggiunte sono sullo stesso livello di quelle di filtri euristici (come
SpamAssassin) o filtri statistici basati sul metodo Naive Bayes o sue dirette variazioni
(come SpamBayes, Bogofilter e altri ancora). In aggiunta alle buone prestazioni, c'è
da sottolineare, come già detto nella sezione 6.1, che SpamGAME utilizza l' algoritmo
GAME in modo generico, senza applicare particolari accorgimenti al caso di messaggi di posta elettronica,
mentre la quasi totalità dei filtri anti spam dello Stato dell' Arte (fra cui quelli personalmente
provati, cfr. Tabella 5.6) impiegano delle tecniche atte a migliorare i risultati
di classificazione delle email, come ad esempio la decodifica di alcuni tipi di allegati.
E' risultato a prima vista bizzarro ma in fase di test buono come risultati ottenuti, il fatto di non effettuare il parsing
di codice html, css, javascript o quanto altro fosse presente nei messaggi.
Tutti i tag vengono considerati dei token validi e vanno pertanto a far parte del database di termini.
Questa tecnica ha portato a buoni risultati perchè statisticamente quasi solo i messaggi spam contengo tale
tipo di codice, e quindi un messaggio nuovo in arrivo viene di conseguenza ``penalizzato'' già in partenza.
Alessio Pace
2004-03-26