Vor kurzem hat 1000ff.de die Frage behandelt, wie man einen Link so verändert, dass die Identifizierung der verlinkenden Seite — z.B. des eigenen Blogs — beinahe unmöglich wird.
Heute gehen wir einen Schritt weiter und erklären, wie sich die Anonymisierung von externen Links in WordPress-Blogs automatisieren lässt. Der Website-Referrer wird hierbei mittels eines Plugins automatisch über den Derefer-Dienst anonym.to versteckt.
Da es anscheinend noch kein fertiges Plugin zu diesem Zweck gibt, gerät unsere Lösung ein bißchen Quick & Dirty. Denn wir müssen uns ein bestehendes WP-Plugin krallen und geringfügig modifizieren. Das ist aber einfacher als es klingt.
-
Das Plugin “Identify External Links” von Tempus Fugit herunterladen und entpacken.
-
Die Datei identify-external-links.php in einem Texteditor öffnen.
-
Speichern, Plugin hochladen und im Backend aktivieren.
Fertig!
Nachteil dieser Lösung: Über Suchmaschinen ist es immer noch möglich die verlinkende Seite aufzuspüren, weil die ursprüngliche URL noch im Klartext vorhanden ist. Beispiel: Wenn Du den Link http://anonym.to/?https://1000ff.de/ in dein Blog setzt, tauchst Du trotzdem in der technorati-Statistik für 1000ff.de auf.
Für Blogs, die Suchmaschinen das Indizieren des Inhalts verbieten oder per Plugin nur für registrierte Benutzer lesbar sind, reicht das aber in der Regel. Ansonsten muss zusätzlich ein Kurz-URL-Dienst wie tinyurl.com verwendet werden, wie im Artikel “Links anonymisieren — Gewusst wie” beschrieben.
Tip: Natürlich kann man auch andere Dereferer als anonym.to verwenden. Dazu setzt man in der zu ersetzenden Zeile einfach das entsprechende URL-Präfix des Dienstes anstatt http://anonym.to/?
ein. Möglich sind z.B. auch http://www.dereferer.org/?
, http://noref.biz/?r=
oder http://www.hideurl.de/?
. Wer externen Diensten nicht vertraut, kann sich sogar einen eigenen Dereferer basteln, bei dem allerdings dessen Domain bekannt bleibt. Wie das geht, beschreibt Missi.
Und falls hier jemand abschließend klären kann, ob es nun “Referrer” oder “Referer” heißt, bitten wir denjenigen freundlichst um eine Wortmeldung.
Danke für die Ausführungen. Soweit ich das sehe, gibt es derzeit keine Möglichkeit, das Anonymisieren via “tinyurl”s zu automatisieren. Das wäre aber eigentlich “angesagt”.. Ich könnte mir vorstellen, dass tinyurl einen rpc-Dienst anbietet, der von einem wordpress-plugin beim publishen (oder auch speichern) eines Artikels angesprochen wird. Die erhaltenen kurzen URLs werden als “custom fields” zum Artikel gespeichert und bei der Anzeige werden sie in den Text eingearbeitet.
Ehrlich gesagt, habe ich meine Sorge, ob tinyurl auch für immer existieren wird.. Wenn nicht, sind die Links mit dieser Methode zumindest wieder herstellbar.
Was die “Verweisquelle” angeht, so schreibt sie sich korrekterweise (wenn überhaupt) mit doppel-R. Einen Beschwerdebrief an Tim Berners-Lee wegen der falschen Schreibweise des Headers gibt es auch schon..
Ich würde schon vermuten, dass tinyurl irgendeine Art API anbietet. Bin mir nicht ganz sicher, aber bei twitter gepostete Links werden meines Wissens immer in tinyurls umgewandelt, ebenso existiert ein WordPress-Plugin, das tinyurl-Permalinks erstellt.
Nee, ich denke die bleiben bestehen. Falls es finanziell mal hart auf hart kommt, können die immer noch Werbung zwischenschalten oder sich an twitter/Google/Yahoo verkaufen. Wäre aber schon interessant was passiert, wenn tinyurl auf einen Schlag nicht mehr funktionieren würde. :)
Danke für die Aufklärung hinsichtlich der “Referrr”.
Na ja – es gibt ja Alternativen zu TinyUrl, so isses ja nun nicht. (Nein, in dem Fall ist Kurl natürlich nicht zu empfehlen…)
Ad Astra
Wenn man unbedingt will, dass die Seiten nicht bei Suchmaschinen auftauchen kann man sich bestimmt auch nen Dereferrer basteln, der die links irgendwie kodiert annimmt (z.B. mit base64_encode()) und dann auf anonym.to?*url* weiterleitet.
Aber wem nutzt sowas? o.O
@ Niko:
Darum geht es gar nicht. Mit den oben beschriebenen Schritten möchte ich vielmehr erreichen, dass meine Seite nicht in der Server-Stats der Seiten auftaucht, die ich verlinke.
Verstehe nicht, was Du meinst. Der Link müsste nachher im Quelltext doch sowieso wieder “normal” stehen, damit Ottonormal-Browser damit klarkommt. In dem Moment ist er doch auch wieder von Google indexierbar. Will man erreichen, dass Spider sich eine Seite nicht “einverleiben”, gibt es einfachere Wege. Zum Beispiel per robots.txt und Meta-Tags nebst Spidertrap für “böse” Bots, die sich an die Angaben nicht halten.
//edit: Okay, jetzt hab’ ich deinen Vorschlag verstanden. Gute Idee. Dann müsste man aber noch eine Möglichkeit finden, dass WordPress automatisch alle Links dergestalt kodiert und automatisch über den Dereferer auswirft.
Mir. Ich plane eine “abgeschlossene” WordPress-Installation mit prologue, eine Art internes Forum. Und die soll möglichst wenig auf sich aufmerksam machen.
“Darum geht es gar nicht.[…]”
Ja, war mir auch klar, aber das noch dazu zu schreiben war zu anstrengend.
Und, dass der das codiert geht doch einfach mit dem Ansatz der im Artikel beschrieben wird. Dann macht man meinetwegen aus dem hier:
return ‘‘ . $matches[5] . ‘‘;
das hier:
return ‘‘ . $matches[5] . ‘‘;
Oder so ähnlich.
Toll, ich hab grad was geschrieben und auf abschicken geklickt, aber das wird nicht angezeigt :'(
[Dein Kommentar war im Spamordner gelandet. Hab ihn rausgeholt. — Frank]
Hm, so sollte das aber eigentlich gar nicht aussehen… Macht der aus dem a-tag einfach einen link… tzzt
Das funktioniert wunderbar… hab auch meinen eigenen Dereferrer erstellt…
Allerdings hätte ich noch die Frage wie man bestimmte File Extensions ausschließen kann? zB. möchte ich dass Links von Bildern keinen Dereferrer link vor dem eigentlichen link bekommt…