Scrapern die Tour vermasseln
von Falk DĂĽbbert (falkd) | 06 Februar, 2009 02:23
Ein besonderes Ärgernis sind ja "Personensuchmaschinen". Bei allen anderen Suchmaschinen führt Löschen der Quelle nach ca. sechs Wochen zur Entfernung aus dem Index.Nicht so bei yasni, 123People und Co. Da es sich bei diesen Vögeln um "Scraper" handelt, bringt es nur wenig robots.txt und .htaccess mit entsprechenden Einträgen auszustatten, da sie nicht selber crawlen sondern nur die Suchergebnisse anderer Maschinen indexieren inkl. der Originalsnippets. Man kann aber surfer, die von solchen Maschinen kommen, umleiten und ihnen auf einer gesonderten Seite mitteilen, dass es nichts zu holen gibt. Alternativ kann man sie auch einfach wegleiten. Genau das tut meine Version.
Order deny,allow
Deny from .yasni.de
Deny from .pipl.com
Deny from .123people.de
Deny from .myonid.de
Deny from .personensuche.biz
RewriteEngine On
RewriteCond %{HTTP_REFERER} ^http://.*yasni.de.*$ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*123People.de.*$ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*MyOnID.de.*$ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*Pipl.de.*$ [NC]
RewriteRule ^(.*)$ http://info.seitezupersonensuc.he [R,L]
Mit dem Rewrite landen Surfer von yasni und Co auf http://info.seitezupersonensuc.he. Das Funktioniert leidlich gut.
Ich gehe etwas weiter und schicke die Surfer gleich auf eine 403-Fehlerseite. Klare Ansage: wer sowas benutzt, bekommt von mir nichts.
SetEnvIfNoCase Referer yasni scraper=yes
SetEnvIfNoCase Referer 123people scraper=yes
SetEnvIfNoCase Referer myonid scraper=yes
SetEnvIfNoCase Referer pipl scraper=yes
SetEnvIfNoCase Referer personensuche scraper=yes
deny from env=scraperÂ
Diese kleine Gemeinheit stört natürlich den Surffluss und damit das -Erlebnis. Die Surfer kommen (ohne Tastatureinsatz) nicht weiter. Idee dahinter ist, die Suchergebnisse dieser Profilanlegenden SuMas teilweise unbrauchbar zu machen.
Diese .htaccess habe ich auf allen Sites, auf die ich schreibend Zugriff habe, eingefĂĽhrt. Ich empfehle die Nahahmung auf allen privaten Webseiten.
Netzrelevantes ·
Kommentare: (0)·
Trackbacks:(0)·
Permalink·
Druckversion
Mobloggen mit ThingAmABlog
von Falk DĂĽbbert (falkd) | 02 Februar, 2009 10:22
Das OpenSource Projekt Thingamablog ist leider seit einem Jahr entschlafen. Von den Maintainern her existiert keine Aktivität mehr seit Dezember 2007. Leider paart sich dieses Manko mit einem unzureichendem Wiki, unnützer Hilfe und einem aus Deutschland kaum erreichbarem Forum.
Daher ist die Email-to-Blog-Funktion kaum dokumentiert. Zum GlĂĽck konnte ich mit Archive.org herausfinden, wie es geht.
Man braucht:
- ein Email-Konto, das per POP3 erreichbar sein muss.
Da ThingAmABlog keinerlei Verschlüsselung beherrscht und alle Header einmal durchliest, sollte das nicht die “Geschäftsadresse” sein. - einen (Windows-)PC, der wenn schon nicht ständig, immerhin regelmäßig läuft.
Nachdem man Thingamablog eingerichtet hat, trägt man bei den Autoren in den Optionen der jeweiligen Blogs auf jeden Fall die Emailadressen ein. Eine Email, die gepostet werden soll, muss folgendes enthalten:
- Sie muss von der Email-Adresse stammen, die in der Autoren-Liste eingestellt wurde.
- Der Betreff / Subject muss mit “POST: “ beginnen.
Soll der Artikel ABC in der Kategorie XYZ erscheinen, muss das Subject der Email
“POST in XYZ: ABC” lauten. Groß und Klein ist vor dem : egal. - Das war es schon. ThingAmABlog führt bei jedem Email-Import ein Update der geänderten Seiten und der RSS-Dateien (Feed trifft es ja nicht) durch.
Netzrelevantes ·
Kommentare: (0)·
Trackbacks:(0)·
Permalink·
Druckversion
Firefox Howto #1: Privatsphäre nach der Installation.
von Falk DĂĽbbert (falkd) | 01 Februar, 2009 16:04
Die erste und wichtigste Adresse nach dem Einrichten von Firefox ist
about:config
Hintergrund Firefox war mal alles, was der Internet-Explorer nicht war: Schnell unkompliziert und sicher.
Das hat sich geändert, weil die Mozilla Foundation ist jetzt eine Mozilla Corporation und es gibt viele, die sagen, im Wesentlichen ein verlängerter Arm von Google. Auf jeden Fall hat sich im FireFox seit der Version 1 einiges getan, leider vieles zum Schlechteren.
- Firefox unterstĂĽtzt das Super-Cookie, die Sitzungsdatenablage oder Session-Storage
Ich nenne es Monstercookie. Das Problem daran ist, man kann als Cookie-Anbieter Wildcards benutzen. Also anstelle Unterseite.der.boesenseite.de *.de und alle .de-Seiten können die Daten sehen. Somit kann man einen Surfer impfen. Da die Cookieverwaltung des Firefox doch eher einfach ist, kann man bezüglich des Monstercookies nur alle oder keine Cookies annehmen.
Abhilfe ist recht einfach. Auf der Konfigurationsseite tippt man dom.storage in die Suchzeile und sollte
dom.storage.enabled erhalten Darauf klickt man doppelt, bis es auf false steht. Schon ist das Monster-Cookie getötet. - Ein weiteres Ärgernis ist das Safebrowsing. Man verkauft es uns als Phishing-Schutz, also uns für blöd.
In Wahrheit sammelt Google jede neu angesurfte URL ein und die Abfragen sind unverschlüsselt. Wie genau kann man bei O’Reilly nachlesen. Wenn man zuvor mit der gleichen IP igoogle, gmail, oder einen der anderen anmeldepflichtigen Google-Dienste benutzt hat, kennt Google uns auch mit Namen. Google weiß dann, was wir wo gekauft haben und wo wir morgen hinfahren werden. Auch hier gilt: abschalten.
browser.safebrowsing.enabled und browser.safebrowsing.malware.enabled auf false setzen.
Wer sich ohne solchen Phishing-Filter um seine Sicherheit sorgt, kann sich an eine einfache Regel halten. In unverschlüsselte Seiten gibt man nur das ein, was man auch im Telefonbuch über sich finden möchte. - Das nächste Ärgernis ist nicht so gravierend geht aber auch in die Richtung, dass man den Surfer für blöd hält. extensions.blocklist.enabled hält eine Liste mit “bösen” Erweiterungen. Man kann jetzt dazu stehen wie man will. Die drei Male, bei denen ich Aktivitäten dieser Liste mitbekommen habe, weigerten sich die Autoren der Erweiterung, sich der Mozilla Corp zu unterwerfen. Das bekannteste Beispiel dürfte das PlugIn des FreeDownload-Managers gewesen sein. Und wer sich, wie ich darüber aufregt, dass selbst mit der Installation von Sub-Sub-Subversions-Upgrades die Hälfte der Extensions, wegen angeblicher Inkompatibilität deaktivieren, erstellt einen neuen Schlüssel extensions.checkCompatibility und setzt den auf false.
- Firefox 3 sendet auch unabhängig von Google Nutzungsstatistiken ans HQ. Wer das nicht will, stellt die Auto-Updates ab.
- Bei den Suchmaschinen sollte man auf jeden Fall die Suchvorschläge abstellen, da sonst auch, wenn man z.B. Exaleed benutzt, die Suchanfragen an Google gehen.
Netzrelevantes ·
Kommentare: (0)·
Trackbacks:(0)·
Permalink·
Druckversion
Tag Cloud
von Falk DĂĽbbert (falkd) | 26 Januar, 2009 00:27Der Zeitgleiter hat jetzt eine Tag-Cloud. Mir ist nur noch nicht ganz klar, wann und wie die generiert wird.
Update:
Nach einigem Gebastel habe ich die Optionen identifizieren können.- max_articles benennt die Anzahl der letzten Postings, die berücksichtigt werden sollen.
- max_keywords ist ziemlich sicher die Anzahl der ausgegebenen Stichwörter
min_size und max_size sind die Schriftgröße in em - min_weight und max_weight die Buchstabenbreite in em
Update2
Leider scheint die Suchfunktion nicht zu funktionieren, auf der die Tag Cloud aufbaut. Vermutlich ist da ein Problem mit den Zeichensätzen….
alles ·
Kommentare: (0)·
Trackbacks:(0)·
Permalink·
Druckversion
Impressum
von Falk DĂĽbbert (falkd) | 25 Januar, 2009 23:20
alles ·
Kommentare: (0)·
Trackbacks:(0)·
Permalink·
Druckversion




