Filtri su parole chiave

Ogni client di posta elettronica che si possa considerare tale ha la possibilità di definire filtri basati su termini o espressioni regolari presenti negli header e/o nel corpo di una email.

L' accuratezza di tale sistema di filtraggio dipende molto dalle capacità dell' utente di definirsi dei filtri personalizzati basati sul contenuto degli specifici messaggi email che ha ricevuto personalmente e che si aspetta di ricevere in futuro. Tale precisione può arrivare ad aggirarsi su un 80% ma anche la percentuale di falsi positivi è tendenzialmente alta. Infatti con tale approccio anche una email assolutamente legittima da parte di un conoscente, verrebbe scartata se ad esempio contenesse un termine che secondo il filtro è indice di spam, senza possibilità di appello. Il filtraggio è infatti ``binario'': se il messaggio contiene anche un solo pattern di termini (ad esempio la parola viagra), allora è spam, altrimenti non lo è. Da tale ultima considerazione si vede come non ci si può affidare a filtrare la propria posta con un approccio del genere, specie se il volume e l' importanza delle email che si riceve è elevato. Infatti i termini andrebbero pesati in base al contesto in cui si trovano (l' intero messaggio), e non presi singolarmente.

Alessio Pace 2004-03-26