L' accuratezza di tale sistema di filtraggio dipende molto dalle capacità dell' utente di definirsi dei filtri personalizzati basati sul contenuto degli specifici messaggi email che ha ricevuto personalmente e che si aspetta di ricevere in futuro. Tale precisione può arrivare ad aggirarsi su un 80% ma anche la percentuale di falsi positivi è tendenzialmente alta. Infatti con tale approccio anche una email assolutamente legittima da parte di un conoscente, verrebbe scartata se ad esempio contenesse un termine che secondo il filtro è indice di spam, senza possibilità di appello. Il filtraggio è infatti ``binario'': se il messaggio contiene anche un solo pattern di termini (ad esempio la parola viagra), allora è spam, altrimenti non lo è. Da tale ultima considerazione si vede come non ci si può affidare a filtrare la propria posta con un approccio del genere, specie se il volume e l' importanza delle email che si riceve è elevato. Infatti i termini andrebbero pesati in base al contesto in cui si trovano (l' intero messaggio), e non presi singolarmente.
Alessio Pace 2004-03-26