elefante PHPSegnalo una interessante implementazione dei filtri bayesiani in php + mysql. Il fenomeno dello spam, ora molto focalizzato sulle caselle email, inizia già a prendere di mira il web “commentabile”. WordPress ha gia l’ottimo Akismet che sbaglia veramente poco ma per una applicazione “from scratch” può tornare molto utile.

Class: Bayesian Spam Filter (spam, filter, classified) – PHP Classes
This class can be used to detect spam in text messages using Bayesian techniques. It analyzes the text words in terms of n-grams in a way that is idiom independent. It can be trained to progressively distinguish what is spam and what is not spam by detecting patterns in training samples. Training data is stored in a MySQL database.