Proudly debugging the system since 1981

Mese: Febbraio 2008 (Pagina 1 di 3)

Filtro Bayesiano in PHP

elefante PHPSegnalo una interessante implementazione dei filtri bayesiani in php + mysql. Il fenomeno dello spam, ora molto focalizzato sulle caselle email, inizia già a prendere di mira il web “commentabile”. WordPress ha gia l’ottimo Akismet che sbaglia veramente poco ma per una applicazione “from scratch” può tornare molto utile.

Class: Bayesian Spam Filter (spam, filter, classified) – PHP Classes
This class can be used to detect spam in text messages using Bayesian techniques. It analyzes the text words in terms of n-grams in a way that is idiom independent. It can be trained to progressively distinguish what is spam and what is not spam by detecting patterns in training samples. Training data is stored in a MySQL database.

Fav.or.it un rss reader da tenere d'occhio

Si un altra volta propongo un prodotto alternativo ad uno offerto gratuitamente, senza limitazioni ed efficentemente da BigG. Ma perchè lo faccio l’ho già espresso.

favorit.pngFav.or.it , che nonostante il dominio Italiano, di italiano non ha nulla, è un feed reader attualmente in beta, con una grafica gradevole, 100% web based, che permette di ripondere ai post ( fatti su wordpress o blogger ) senza lasciare il feed reader stesso.

Purtroppo, oltre il video ufficiale, c’è poco altro da dire. Non ho ancora in mano la beta e tutti gli inviti sono andati esauriti. Per ora continuo ad utilizzare GReader in attesa che nella mia casella di posta poppi un invito.

Reputazione online

reputation2.pngLa difesa della reputazione online è uno dei temi caldi. Su punto-informatico di oggi è segnalato l’ennesimo caso di un blogger denunciato per diffamazione. Ovvero come risolvere il problema delle formiche in cucina con un bazooka. Poi non lamentatevi se c’è odore di bruciato. Nel frattempo qualcuno sente odore di business invece e lancia un servizio a prezzi, tutto sommato, economici. Trackur monitorizza la vostra preziosa reputazione (demo : http://blip.tv/file/667277 ) e i prezzi variano in base a quante ricerche desiderate salvare ( 1 – 5 – 15 ) e la prontezza con la quale deve avvertirvi che qualcuno sta parlando male di voi ( 12 – 6 – 1 ora ).
Trackur non offre, in realtà, nulla di più di quello che si può fare combinando più strumenti liberamente disponibili online.

Continua a leggere

Click Fraud – Le frodi del click

Sono sempre esistite. Sempre esisteranno ? Qual’è la dimensione del fenomeno ?

Viene definita “Click-fraud” l’azione di cliccare sui banner o annunci pay di un sito con il solo scopo di far guadagnare il sito stesso. Azioni di questo tipo sono un problema perchè molti siti esistono solo perchè la “pubblicità gli paga le bollette” (redonweb.com comunque continuerà ad esistere con o senza pubblicità … non spaventatevi o mie 3 lettori)

Invece, se il fenomento diventa fonte di sfiducia verso la pubblicità online, protremmo perdere google, yahoo, flickr, youtube tutto d’un colpo. MSN invece rimarrà online diventando a pagamento.

Che culo.

Continua a leggere

Quanti visitatori ha quel sito ?

Per rispondere a questa domanda ho sempre usato Alexa. Alexa non fornisce direttamente il numero di visitatori mensili di un sito ma, prendendo la percentuale di “reach” e moltiplicandola per la popolazione internet (1.3miliardi) si ottiene una stima vicina al vero. Per i dati che ho io ne esce un valore inferiore al vero del 15/25%.

Oggi ho scoperto Compete. Un servizio simile, ma senza dover fare calcoli dopo. Fornisce subito le sue stime di traffico, per i siti piu trafficati ovviamente.

Qualche confronto :

  • Punto-informatico.it : Compete 6k – Alexa 169k
  • Downloadblog.it : Compete 2k  – Alexa 84k
  • Repubblica.it : Compete 80k – Alexa 1.320k
  • Google.com : Compete 130m – Alexa 351m

Conclusioni ? Per valutare i siti italiani sicuramente meglio Alexa… anche se, in termini relativi e a mio parere sottostimando pesantemente i visitatori, con Compete si riesce comunque a fare una graduatoria sensata.

VisiStat

Continua la mia personale rassegna di alternative a Google Analytics. Ora non che sia un anti-google, ma credo che le alternative debbano sempre esistere, e in una situazione di evidente predominio di un player (Google in questo caso) siano da valutare ancora più attentamente.

Ed ora il candidato di oggi :

VisiStat

Url : http://www.visistat.com/
Url demo : http://www.visistat.com/tracking/index.php?pmc=
Costo annuno (500k pv mensili) : sconosciuto (fino a 100k : 140€)
Drop rate: No
Tempo sul sito: Si
Analisi adwords: Si
Geolocalizzazione: Si (continenti, nazioni e citta)
Esportazione: Si (Excel)
Obbiettivi e ROI: Si (gestione costi e conversioni di vari tipi di campagne)
Commento : Il sistema è promettente, nel 2007 dichiarano di essere cresciuti più del 200%. La realizzazione tecnica dell’interfaccia è sicuramente superiore a Shinystat ma ancora inferiore ad G.Analytics. Sicuramente da ricontrollare tra un qualche tempo.

Vietato l'Astroturfing !

Quasi due anni fa parlavo di astroturfing quale pratica scorretta ma semplice ed efficace per via nella natura sempre più sociale di internet. Ora a quanto sembra esiste una normativa che vieterebbe questa pratica:

1. Sono considerate in ogni caso ingannevoli le seguenti pratiche commerciali:
[…]
aa) dichiarare o lasciare intendere, contrariamente al vero, che il professionista non agisce nel quadro della sua attivita’ commerciale, industriale, artigianale o professionale, o presentarsi, contrariamente al vero, come consumatore

Da : pratichesleali.sviluppoeconomico.gov.it[…].pdf

Basterà questo per mantenere alta la fiducia verso il lato sociale di internet?
Chi viglierà sul rispetto di questa norma, magari chiedendo nome, cognome e professione ad ogni blogger, utente di forum e gruppi di discussione?
E se qualcuno lo farà il 99.9% percento degli utenti 2.0 onesti, sentendosi sotto controllo, non si metteranno ad urlare contro uno “stato di polizia” o un “grande fratello” ?

Da una parte apprezzo l’impegno, dall’altra temo sia solo una grida Manzoniana

Goolag Scanner

PI: Cult of the Dead Cow denuda il Web

Goolag Scanner, questo il nome del tool, è un software di “Web auditing” in grado, a quanto sostiene la crew, di permettere a chiunque di testare il proprio sito web attraverso una tecnologia definita di “Google hacking”, un tipo di ricerca delle vulnerabilità nel codice web sviluppato dall’hacker Johnny I Hack Stuff.

La cDc, a partire dal mitico Back Orifice, non ha mai smesso di stupire. E cosi ecco qua un tool per il controllo del (proprio) sito web per assicurarsi che non ci siano vulnerabilità note.

Su punto informatico l’articolo completo, qua sotto il download (l’ho mirrorizzato visto che si segnalavano problemi nello scaricamento)

Goolag Scanner

Pagina ufficiale per il download : http://www.goolag.org/download.html

« Articoli meno recenti

© 2024 b0sh.net

Tema di Anders NorenSu ↑