Skip to content

Spamschutz Bayes ...

serendipity Malte hat auf mehrfachen Wunsch von Matthias und mir dem Spamblock_Bayes_Plugin einen Import und Export spendiert. Super Sache das.

Hier sind meine Antispamdaten:

spamblock_bayes.csv (etwa 400KB)

Danke dafür!

ACHTUNG: Gerade habe ich festgestellt, dass die Importfunktion noch einen Fehler hat.

Trackbacks

YellowLeds Weblog am : Zeigt her Eure Spam-Datenbanken

Vorschau anzeigen
Das beste Spamschutz-Plugin für die beste Blogengine ist jetzt noch besser: Malte hat auf Wunsch von Dirk und mir dem Spamschutz-Bayes-Plugin für Serendipity eine Import-/Export-Funktion spendiert, die in der Lage ist, CSV-Dateien in die bestehende Daten

onli blogging am : Bayes 0.3.9.1: Datenbankperformance

Vorschau anzeigen
Die Import- und Exportfunktion arbeiteten einwandfrei in meinen Tests mit kleinen Beispieldaten, scheiterten aber an der Größe der Datenbanktabellen bei Dirk und YellowLed. Bei Dirk klappte der Export, aber der Import starb mit einem Timeout, bei Yellowle

NEBELREITER.COM am : Spamzahlen

Vorschau anzeigen
Nachdem ich Anfang November( Kommentarprobleme -Update!) die Kommentarsperre auf den selbstlernenden Filter umgestellt habe, wollte ich eben mal schauen, wieviele Spamkommentare denn mittlerweile gefiltert wurden: Es waren fast 4800 Spamkommentare, von de

Seraphyn Blog am : Captchas abgeschaltet und nutze Spamschutz Bayes

Vorschau anzeigen
Trotz Captchas hatte ich ein nettes SPAM-Problem. Und ich war relativ angenervt, da auch reCaptcha nicht funktionierte Oho. Somit scheinen die Spammer ein wenig aufgerüstet zu haben und ich suchte eine Alternative, da die Captchas hässlich sind und auch

Dirks Logbuch am : Futter für das Spamblock-Bayes-Plugin ...

Vorschau anzeigen
Es ist lange her, dass ich einen Download meiner Datenbank zur Verfügung gestellt habe. spamblock_bayes.csv (763 kB) Importiert werden können die Daten, wenn das Plugin Spamschutz (Bayes) installiert ist über Sapmschutz (Bayes) im Adminmenü, dann Da

w.teiko.org am : PingBack

Vorschau anzeigen

Kommentare

Ansicht der Kommentare: Linear | Verschachtelt

Seraphyn am :

*Ich habe es mir endlich auch mal installiert und werde mal die Captchas abstellen.
Wäre es nicht witzig, wenn man die CSVs irgendwo konzentrieren könnte?
Sprich auf Dropbox, Webspace oder sonst etwas...
So könnte man alle SPAM-Erfahrungen teilen?

Dirk Deimeke am :

*Ja, das ist eine gute Idee, die ich auch schon einmal angedacht habe, Du kannst meine CSV-Datei gerne haben.

Auf Captchas zu verzichten ist ebenfalls klasse. Die Hürde für Kommentatoren muss so niedrig wie möglich sein.

Bei mir kommt mittlerweile kaum ein Spam durch. Akismet wird anscheinend kostenpflichtig, da werden noch einige Wordpress-Blogger fluchen.

Seraphyn am :

*Habe nun auch meine Datenbank freigegeben.
Frage mich im Moment wie man das gerade machen könnte.
Vielleicht ein php-Script bei welchem die eigene CSV einmal im Monat hochgeladen wird, wenn dies jeder macht und das ganze noch direkt über s9y.org läuft kann man damit per cron automatische Updates machen.
Das einzige was vielleicht ein wenig ein Problem machen könnte, ist jenes das derjenige/diejenige welche die CSV hochlädt valid sein sollte, sonst könnten Spammer das ganze nutzen um sich einzuschmuggeln.
Dafür kann ich leider nicht genug PHP, da ist mein können zu begrenzt für.
Falls Du Jemand kennst, würde ich den Webspace dafür zur verfügung stellen.
Man kann ja das validieren per GPG-Key machen, sprich norm haben die meisten einen für Ihre Emailadresse und damit kann man ja dann das Web of trust aufbauen.
Nur so eine Idee...

Dirk Deimeke am :

*Am besten wäre es, wenn das Plugin konfigurierbar einmal alle x Tage einen Export macht und dann unter einer festen URL zur Verfügung stellt.

Der nächste Schritt könnte dann sein, diese URL nur noch als "Lernquelle" einzutragen, um manuell ein Update durchzuführen.

Wir können Malte fragen, der das ganze programmiert hat.

Seraphyn am :

*Wäre eine gute Idee.
Wobei aus Datenschutzgründen es auch möglich sein sollte, den Export zu unterbinden.
Hast Du da eine genaue Adresse wegen der Anfrage im Sinn, oder direkt in das Forum für Plugins?

Seraphyn am :

*Leider kann ich in seinem Blog nicht kommentieren :-( :
Abgewiesen als Spam.
Kommentar wurde nicht hinzugefügt, da Kommentare für diesen Eintrag entweder deaktiviert sind, Sie ungültige Eingaben gemacht haben oder Anti-Spam-Maßnahmen angewendet wurden.

Wollte jenes loslassen:
Hi Dirk,
ich sehe Du hast schon ;-)
Vielleicht sollte man das ganze in das Serendipity-Forum verlegen, dann können vielleicht mehr Benutzer dazu Stellung nehmen.
Und wie gesagt, ich stelle gerne meinen Webspace zur Verfügung, habe aber keinen SSH-Zugang, welches ich wohl dazu sagen sollte.
Aber noch genug Platz...

Dirk Deimeke am :

*Ich habe auch kein Problem mit dem Serendipity-Forum. Starte einfach eine Diskussion.

Seraphyn am :

*Kann einen Moment dauern, muss noch eine Appliance fertig bauen, das dauert ein wenig.
Stehe da nen bissi unter Druck

Seraphyn am :

*Doch Fix getippt:
http://board.s9y.org/viewtopic.php?f=4&t=17509&start=0
Gruss

onli am :

*Hi
Keine Sorge, dank des Papierkorbs geht bei mir so schnell nichts verloren. Habe die Grenzen vielleicht etwas zu niedrig gesetzt, mir ging eine Weile zu viel Spam durch. Sorry.

Zum Thema: Das wird wirklich immer wieder gefordert. Vielleicht sollte ich das wirklich einfach mal umsetzen. Nur wie genau? Ihr hattet ja schon Ideen.

Eine Möglichkeit: Wir nutzen tatsächlich einen zentralen Dienst (nennen wir ihn im folgenden erstmal Troja). Jedes Plugin bekommt eine Schnittstelle nach außen, über die ein authentifizierter Anfrager, also Troja, die CSV-Datei abfragen kann. Das können wir ja wirklich über eine Signatur absichern. Bei Troja muss man sich melden, sagen: "Ich will, dass Troja meine Daten nimmt". Nur dann, einmal wöchentlich oder so, geht Troja alle gemeldeten Blogs durch und baut die CSV-Datei neu (die wird schnell zu groß werden, da muss man sich was überlegen).

Von Troja kann jeder dann eine CSV mit den gesammelten Spamdatendatenbanken beziehen.

Troja könnte in einer beliebigen Sprache geschrieben werden. Und könnte sogar relativ simpel zu schreiben sein. Übersehe ich irgendwelche kritische Probleme, hat jemand Lust, den Dienst zu bauen? Seraphyn, reicht dein Webspacce dafür wirklich aus, oder geht sowas besser auf einen anderen (Dirks? den von s9y.org?) Server?

Seraphyn am :

*Im Moment habe ich wieder den kleinen genommen, weil mir 50GB immer zuviel waren, aber das könnte ich auch wieder ändern und zu All-Inkl wandern.
Wenn es in kürzerer Zeit geschehen sollte, frage ich gerade Jemanden an, welcher vielleicht etwas mehr geben könnte.
Was sagt denn die Hochrechnung?
Wenn ich mein File betrachte bin ich ja nun schon seit zwei Tagen bei 768kb inkl YellowLED und Dirks CSV.
Und doppelte kann man ja noch entfernen, in wie weit, dies geschieht würde dann von dem Code zum auslesen abhängen.
IMO könnte man es vielleicht so differenzieren, dass man die IPs gesondert beachtet und diese eher in einer zweiten CSV auslagert und nach einiger zeit einem purge unterzieht, da jene nicht dauerhaft sind.

Seraphyn am :

*PS:
Vielleicht sollte es so angelegt werden, dass nach einer Validierung auch andere diesen Service anstelle akismet etc nutzen könnten.
IMO eine OpenSource-Datenbank gegen SPAM

onli am :

*Glaube nicht, dass da viel Traffic zusammenkommt. Und eilen tut es auch nicht, muss ja erstmal gucken, ob ich das überhaupt hinkriege.

Dirk Deimeke am :

*Wir haben Platz genug. Leider habe ich aber zu wenig Zeit, das selber zu schreiben.

Kommentar schreiben

Gravatar, Favatar, Pavatar, Identica, Twitter, MyBlogLog Autoren-Bilder werden unterstützt.
BBCode-Formatierung erlaubt
Umschließende Sterne heben ein Wort hervor (*wort*), per _wort_ kann ein Wort unterstrichen werden.
Standard-Text Smilies wie :-) und ;-) werden zu Bildern konvertiert.
Die angegebene E-Mail-Adresse wird nicht dargestellt, sondern nur für eventuelle Benachrichtigungen verwendet.
:'(  :-)  :-|  :-O  :-(  8-)  :-D  :-P  ;-) 
Formular-Optionen