Filtro Black List

Se il mittente del messaggio non fa parte della white list di utenti, allora esso viene confrontato con la cosiddetta black list di indirizzi. In essa sono contenuti tutti gli indirizzi, manualmente settati dall'utente (anche stavolta nel file di configurazione config.xml), da cui l'utente non vuole ricevere messaggi, a prescindere dal loro contenuto.

Molte persone ricevono molto spam sempre dai soliti indirizzi (che magari neanche esistono realmente), e l'uso di tale metodo di filtraggio può aiutare a migliorare le prestazioni in termini di riduzione dei falsi negativi. Ma, come nel caso dell'uso del filtro su white list, in un filtro statistico come SpamGAME l'uso del filtraggio basato black list di utenti non apporta grossi miglioramenti sui risultati poichè in genere tutto lo spam contiene la stessa terminologia, contenuti html e via dicendo e una semplice classificazione statistica basata sul contenuto del messaggio risulta sufficientemente accurata. Tuttavia come sistema di ``pre-classificazione'', o ``pre-filtraggio'' che dir si voglia, è molto utile, in quanto riduce lo sforzo computazionale necessario per applicare l' algoritmo GAME per categorizzare un messaggio.

E' stato scelto di non utilizzare black list distribuite di mittenti riconosciuti come spammer per non aggravare sul costo computazionale del sistema di filtraggio, in quanto ciò avrebbe necessitato di una connessione attiva nel momento in cui si volesse classificare un messaggio magari già scaricato sul proprio sistema per effettuare una query sul database in Rete. Tale overhead in fase di progettazione si è deciso di evitarlo.

Alessio Pace 2004-03-26