Persistenza
L'applicazione ha necessità di conservare in maniera persistente i seguenti
dati:
- le categorie di documenti ham e spam con cui è stato addestrato
il sistema
- la lista di indirizzi fidati (la white list)
- la lista di indirizzi da cui non si vuole ricevere messaggi (la
black list)
- la lista di termini non rilevanti nella categorizzazione di testi (la
cosiddetta stop list)
- i threshold di Presenza e Espressività
(cfr. Sezione 3.2 per il significato di questi valori)
Tutti questi dati persistenti vengono conservati in locazioni separate per ogni utente
(caso di sistema operativo multi utente come Linux) o in una locazione unica
(sistema operativo mono utente). Questo perchè la classificazione di un messaggio email e
l' addestramento del sistema di filtraggio sono delle operazioni altamente
personali, e le impostazioni di una persona potrebbero risultare non
soddisfacenti per un' altra.
Subsections
Alessio Pace
2004-03-26