Wie man am ersten Eintrag dieses Blogs erkennen kann, besteht diese Webpräsenz mittlerweile seit dem 16.06.2006, umfasst 45 Artikel (diesen eingeschlossen) und 20 Kommentare. Sieht soweit alles nach einem durchschnittlich populärem Weblog aus…
Als ich mir ein paar Wochen nach dem Launch die ersten 3-4 Spamkommentare eingefangen habe, sah ich mich gezwungen, bei der Eingabe von Kommentaren sogenannte Captchas abzufragen (das sind diese in Bildform ausgegebenen zufälligen Codes, die man vorm Abschicken des Kommentars noch einmal ablesen und eintippen muss), da ich keine große Lust hatte, die Kommentare verdeckt anzunehmen und den Spam manuell auszusortieren.
Captchas sind zwar auch nicht der Weisheit letzter Schuß, da sie unter Betrachtung der Barrierefreiheit (optimale Nutzung der Webseite durch cognitiv eingeschränkte Menschen) eigentlich ein Unding sind, aber das ist eine andere Geschichte.
Die diversen Trackback-Bots, die wahllos die Links zu dubiosen Webseiten / Angeboten auf anderer Leute Blogs verteilen konnte ich so entschärfen, indem die verlinkte Seite daraufhin überprüft wird, ob sie einen Link zu mir zurück gesetzt hat (was bei einem richtigen Trackback eigentlich der Fall sein sollte).
Das funktioniert soweit beides so gut, sodass ich nach kurzter Zeit keine großen Gedanken mehr daran verwendet habe… bis ich neulich einmal in die Tabelle "spamblocklog" in meiner Datenbank geschaut habe. Diese ist mir nämlich durch die auffallende Größe ins Auge gestochen.
Dort befinden sich mittlerweile 4.296 Einträge drin was eine Größe von gut 1,6MB ausmacht, und das in 9 Monaten, was ich schon ziemlich bemerkenswert finde. Interessant ist außerdem, dass mir bei einer Durchsicht der access-logs vom Apache 2 aufgefallen ist, dass die Spambots, so gut wie nie über meine Startseite auf die Einträge "navigieren", sondern immer direkt die Deep-Links zu den Artikeln ansurfen, um dort mehr oder weniger gezielt ihren Schrott abzuladen.
Dies sehe ich mal als Kompliment für meine Suchmaschinenoptimierung Und in der Tat kommen mittlerweile die Bots der größten Suchmaschinen (darunter Google, Yahoo und MSN Live Search) mehrmals täglich vorbei, um aktuelle Inhalte zu indizieren.