Disallow.de – Ein erstes Konzept

Published 2005-10-21, 21:12

Perfekt, bull hat mir heute nachmittag gleich noch die pre-pre-alpha von seiner Botdatenbank zukommen lassen, die er sich mal gebastelt hatte. Und ich habe meine alten PMs wiedergefunden, die ich ihm geschrieben hatte. Daraus habe ich mal einen Konzeptentwurf gebastelt.

Continue reading Disallow.de – Ein erstes Konzept…

CommentsTrack light: Cookie & mod_rewrite

Published 2005-10-21, 15:26

Mein Betatest des neuen CommentsTrack light (CTl) läuft nun schon einige Zeit, und das auch recht erfolgreich. Es gibt immer noch kein Backend, aber das ist eigentlich recht schnell zusammengebastelt.

Mehr Sorgen machte mir der umständliche Einbau in eine Domain. Ist ein bestimmter Cookie gesetzt, werden alle Abfragen auf die Index-Datei über ein anderes Script geleitet. Dazu musste ich bisher jedoch Veränderungen an der Index-Datei vornehmen, im Falle von WordPress an der index.php.

Vorhin kam mir dann die Idee, das ganze schon eine Ebene zuvor ablaufen zu lassen und die .htaccess-Datei zu nutzen die auf den meisten Apache-Server ja nutzbar ist. Ich wusste nicht ob man per mod_rewrite Cookies auslesen kann, im Manual habe ich nun allerdings wirklich was passendes gefunden:

RewriteCond -> Server-Variables -> HTTP_COOKIE

Damit sollte es möglich werden die Anfragen ohne Änderungen an den eigentlichen Script-Dateien auf das CTl zu leiten – muss ich nachher gleich mal ausprobieren ob das so wirklich funktioniert.

[Update] Es scheint tatsächlich zu funktionieren. Nutzer die

[1] das Cookie haben (Cookie „owner“, Wert „1“),
[2] die Startseite aufrufen,
[3] nicht die Domain selbst als Referer
[4] oder gar keinen Referer haben
[5] werden auf die Datei commentstrack.php umgeleitet.

# BEGIN CommentsTrack light
RewriteCond %{HTTP_COOKIE} .*owner=1.*
RewriteCond %{REQUEST_URI} ^/$
RewriteCond %{HTTP_REFERER} !HTTP_HOST
RewriteCond %{HTTP_REFERER} !^$
RewriteRule ^(.*)$ /commentstrack.php [L]
# END CommentsTrack light

Jemand hier der mir sagen könnte ob das von der Syntax her alles passt?

[Update 2] Die dritte RewriteCondition war ziemlicher Müll, habe ich in einem extra Beitrag nun aber gefixt.

Disallow.de – Die Idee

Published 2005-10-21, 02:28

Heute bin ich wieder über eine Projektidee von mir und bull, meinem Moderatoren-Kollegen bei Abakus, gestolpert: Disallow.de

Bei Abakus gibt es seit jeher ein Forum nur für Themen über Suchmaschinenbots, Spider und andere Robots. Ein großer Anteil der Beiträge sind Beschwerden über penetrante oder übereifrige Bots, Bots die sich für etwas anderes ausgeben als was sie sind und so weiter. Oft bleibt den Nutzern gar nichts anderes übrig als bestimmte Useragents oder IP-Bereiche komplett auszusperren.

Bisher kümmern die meisten Webmaster sich nur darum, wenn es wirklich brennt und ein Bot auffällt, andere führen für sich selbst ihre Blacklisten – einen zentralen Punkt zum Sammeln gibt es bisher jedoch nicht. Die Idee war nun also eben eine solche Sammelstelle einzurichten. Die Domain Disallow.de gehört mir schon einige Zeit und würde hier perfekt passen.

Ziel des Projektes soll es also sein alle unangenehmen oder „bösen“ Bots mit IP, Useragent und Beschreibung in einer Datenbank abzuspeichern und zu klassifizieren. Über Schnittstellen und Tools werden diese Daten dann dem Webmaster zur Nutzung bereitgestellt.

Ich such mal alles zusammen was ich zu Disallow schon so zusammengeschreibselt habe, vielleicht lässt sich das ganze ja reaktivieren… Lust dazu hätte ich.

Betatest CommentsTrack light

Published 2005-09-23, 01:51

So wie in den Kommentaren zum Beitrag „Gedanken zu: Kommentare, CommentsTrack, Posted Elsewhere“ angekündigt habe ich mich mal hingesetzt und meine dort beschriebene Idee in einem Script umgesetzt.

Continue reading Betatest CommentsTrack light…

Gedanken zu: Kommentare, CommentsTrack, Posted Elsewhere

Published 2005-09-13, 17:14

Im August 2004 hatten Helge Fahrnberger und ich uns schon einmal Gedanken über folgendes Problem gemacht: Kommentiert man in einem fremden Weblog, so vergisst man oft sich die URL zu notieren oder später nochmal nach Antworten zu schauen. Das ist oft schade da man doch einiges an Gedanken in die Kommentare investiert hat und so oft gute Diskussionen schon im Ansatz versanden.

Wir hatten damals unter dem Namen CommentsTrack versucht die Spezifikation für ein Benachrichtigungssystem zu schaffen, eine Kombination aus Trackbacktechnik und Authentifizierungsarchitektur (ähnlich SORUA). Das ging schief, wir scheiterten an der Menge der Pings, die bei häufig kommentierten Einträgen bei jedem neuen Kommentar hätten versendet werden müssen – und unseren Ansprüchen auf Dezentralität und Universalität.

Das Problem wurmt mich aber noch immer, und gestern habe ich mir nochmal ein paar Gedanken gemacht.

Continue reading Gedanken zu: Kommentare, CommentsTrack, Posted Elsewhere…

WikkaWiki: Bindestriche in Seitennamen

Published 2005-09-11, 00:15

wikka.php, Zeile 640

elseif (preg_match("/[^[:alnum:],ÄÖÜ,ßäöü]/", $tag))

ersetzen durch

elseif (preg_match("/[^[:alnum:],ÄÖÜ,ßäöü\-]/", $tag))

und da ich auch Wikiseiten mit Punkten, Doppelpunkten und Unterstrichen im Suchmaschinenwiki habe sieht das ganze dann so aus:

elseif (preg_match("/[^[:alnum:],ÄÖÜ,ßäöü\-._]/", $tag))

Update: Damit auch neue Seiten mit diesen Zeichen angelegt werden können muss Zeile 19 der Datei „handlers/page/edit.php“ auch dementsprechend angepasst werden:

if(!defined('VALID_PAGENAME_PATTERN')) define ('VALID_PAGENAME_PATTERN',
'/^[A-Za-z0-9ÄÖÜßäöü\-\.\_]+[A-Za-z0-9ÄÖÜßäöü\-\.\_]*$/s');

From Wakka to Wikka

Published 2005-09-11, 00:03

Das SuchmaschinenWiki lief ja von Anfang auf Basis des großartigen WakkaWiki von Hendrik Mans. Dummerweise wurde das Script seit Ende 2003 schon nicht mehr weiterentwickelt und so war das ganze eher ne wackelige Sache.

Ich hab dann natürlich auch noch lustig dran rumgepfuscht und einige Änderungen vorgenommen, schlussendlich war das Ding aber doch nicht toll genug als dass ich es weiter nutzen wollte – Kategorien fehlten, Bilder wären auch nicht unpraktisch gewesen und generell gibt es mittlerweile einfach viel tollere Wiki-Scripte.

Eines davon ist WikkaWiki, das selbst auch auf WakkaWiki basiert. Ein paar nette Leuten rund um JsnX haben hier einfach die Arbeit von Henrik weitergeführt und ne Menge kleiner und großer Änderungen vorgenommen und ne Menge neuer Features eingebaut. Also hab ich das vorhin einfach mal genommen und auf suchmaschinenwiki.de installiert.

Dummerweise habe ich dabei das Design geschrottet, vorher nachdenken war noch nie meine Stärke, und so sieht das nun doch recht bescheiden aus. Wichtiger ist aber dass der Großteil der Seiten noch funktioniert – Wikka übernimmt die ganzen Daten von Wakka – und ich nun ganz viele tolle Features habe die ich noch nicht verstehe :)

Natürlich muss auch hier wieder im Code rumgepfuscht werden, ich mag URL mit Bindestrichen einfach zu sehr und die Leute von Wikka haben das einfach noch nicht vorgesehen. Sollte aber kein Problem sein.

Wie ich mit dem Design und der gesamten Struktur verfahre weiss ich noch nicht. Durch das neue Kategoriesystem sollte da einiges mehr möglich sein, mal drüber nachdenken. Wird man in den nächsten Tagen hier aber nachlesen können…

18 queries. 0,199 seconds.