Innovazioni rispetto ai filtri dello Stato dell' Arte

SpamGAME è il primo filtro anti spam ad avere come metodo (principale) di classificazione GAME e le prestazioni raggiunte sono sullo stesso livello di quelle di filtri euristici (come SpamAssassin) o filtri statistici basati sul metodo Naive Bayes o sue dirette variazioni (come SpamBayes, Bogofilter e altri ancora). In aggiunta alle buone prestazioni, c'è da sottolineare, come già detto nella sezione 6.1, che SpamGAME utilizza l' algoritmo GAME in modo generico, senza applicare particolari accorgimenti al caso di messaggi di posta elettronica, mentre la quasi totalità dei filtri anti spam dello Stato dell' Arte (fra cui quelli personalmente provati, cfr. Tabella 5.6) impiegano delle tecniche atte a migliorare i risultati di classificazione delle email, come ad esempio la decodifica di alcuni tipi di allegati.

E' risultato a prima vista bizzarro ma in fase di test buono come risultati ottenuti, il fatto di non effettuare il parsing di codice html, css, javascript o quanto altro fosse presente nei messaggi. Tutti i tag vengono considerati dei token validi e vanno pertanto a far parte del database di termini. Questa tecnica ha portato a buoni risultati perchè statisticamente quasi solo i messaggi spam contengo tale tipo di codice, e quindi un messaggio nuovo in arrivo viene di conseguenza ``penalizzato'' già in partenza.

Alessio Pace 2004-03-26