dSPAM Statistical Spamfilter HOWTO

dSPAM ist eine rein statistischer Filter gegen Spam. Für einen erfolgreichen Einsatz müssen ca. 1000-2000 Mails dirch den Filter gehen und die verpassten Spams und die False Positives korrigiert werden. Für die Administration steht ein spezielles Web-Interface zur Verfügung. E-Mails können (mit Tag) weitergeleitet oder in eine Quarantäne, die man regelmässig kontrollieren muss, einsortiert werden.

Konfigurationshilfen

Homepage

Training

Um dspam optimieren zu können, ist es sinnvoll, den Filter mit e-Mails zu füttern.

Vorgehensweise:

  • globaluser muss vorhanden sein: INSERT INTO dspam_virtual_uids VALUES (0,”globaluser”);
  • Erstellen von zwei Verzeichnissen: /tmp/learn/{spam,ham}
  • Kopieren von e-Mails im Quelltext (Original) nach /tmp/learn/{spam,ham} je nach manueller Klassifizierung
  • Aufruf von dspam_train.
Usage: /usr/bin/dspam_train [username] [[-i index]|[spam_dir] [nonspam_dir]]
oxubu:/tmp/x# dspam_train globaluser spam ham
Taking Snapshot...
globaluser        TP:     0 TN:     0 FP:     0 FN:     0 SC:     0 NC:     0
Training ham / spam corpora...
[test: nonspam] 5645.                            result: PASS
[test: spam   ] 198.                             result: FAIL (Innocent)
        [fn] Subject: Take it easy
[test: nonspam] 5644.                            result: PASS
[test: spam   ] 197.                             result: FAIL (Innocent)
        [fn] Subject: From Desmond williams
[test: nonspam] 5643.                            result: PASS
[test: spam   ] 196.                             result: FAIL (Innocent)
        [fn] Subject: In the south of.
[test: nonspam] 5642.                            result: PASS
[test: spam   ] 195.                             result: FAIL (Innocent)
...
[test: spam   ] 142.                             result: PASS
[test: spam   ] 141.                             result: FAIL (Innocent)
        [fn] Subject: Congratulations!!!You are a winner 
[test: nonspam] 5296.                            result: PASS
[test: spam   ] 140.                             result: PASS
TRAINING COMPLETE

Training Snapshot:
globaluser        TP:    35 TN:    50 FP:     0 FN:    24 SC:     0 NC:     0
                  SHR:   59.32%       HSR:    0.00%       OCA:   77.98%

Overall Statistics:
globaluser        TP:    35 TN:    50 FP:     0 FN:    24 SC:     0 NC:     0
                  SHR:   59.32%       HSR:    0.00%       OCA:   77.98%
 
wissen/gpl/spamassassin/dspam-statistical-spam-filter-howto.txt · Zuletzt geändert: 05.09.2010 20:31
 
Recent changes RSS feed Donate Valid XHTML 1.0 Valid CSS Recent cached RSS feed cacert-signed web site: inhalt.serviert.de