Entschuldigung, wir haben versehentlich versucht, Ihre Adressdaten zu stehlen!

No Comments

Sonntag abend versuchte ein Preissuchmaschinen-Crawler namens TwengaBot-Discover, fast 1 1/2 Stunden lang, meine privaten Kontaktdaten zu indexieren. Aus gutem Grund sind diese nochmals gegen Botsysteme geschützt, da es in der Vergangenheit schon Hornochsen Programmierer gab, die ihrem Crawler NICHT mit Einhaltung der Regeln der robots.txt ausgestatten haben (u.a. irgendein amoklaufender Indexer der Uni Dortmund).

Der Mailkontakt mit den Twenga-Ablegern verlief wie erwartet: Automatisiert.
Dass es sich bei der betroffenen Website nicht um einen Online-Shop handeln könnte, ging dabei natürlich völlig unter (wenn denn überhaupt ein echter Mensch jemals einen Blick auf meine Mails geworfen hat).

Update / 15:39: Gerade eben kam wieder eine schöne Mail rein. Ebenfalls sehr automatisiert. Angeblich hält sich der Crawler an die robots.txt. Was mich verwundert, warum er dann meine Website besucht, obwohl in der robots.txt die gecrawlten Verzeichnisse explizit ausgeklammert sind? Und natürlich: WTF sucht eine Preissuchmaschine auf meiner Info-Site?

Was sind die Konsequenzen hieraus?

Erstmal die direkteste: IP-Bans und User Agent-Blockaden auf Teilen meiner Websites. Logischerweise werden diese auch für Kunden-Websites, soweit anwendbar, ebenfalls eingesetzt. Hilfreiche Tutorials und Listen gibt es ja zuhauf im magischen Internetz zu finden ;)

Die sekundären sind ggf. rechtliche Maßnahmen, die aber im Nichts verpuffen dürften, da Twenga.com wohl in irgendwo in Frankreich sitzt - wenn überhaupt, ist vermutlich eine Briefkastenfirma. Natürlich könnte man da jetzt versuchen, länderübergreifend zu (v)ermitteln, ein IP Ban sowie User Agent-Blockade kommt für mich derzeit jedoch bedeutend billiger.
Recht kann man haben, muss man aber auch entsprechend bezahlen! X-(

Tertiär: Twenga hat eine gut automatisierte Mailkorrespondenz. Leider wohl kein Interesse an seinen Benutzern.

Comments are closed for this post