Joomla Blog - Die Insider Tipps


Blog über das beliebte Content Management System Joomla. Tipps und Tricks zu allen Joomla Themen, Hacks und Fixes, SEO, sowie allgemeinere Webmaster Themen.
Unser RSS FeedBleibe auf dem Laufenden mit dem Joomla Blog RSS Feed. Klicke auf das Symbol um den Feed zu abonnieren.

twitter-rss-abo.png Joomla Blog Twitter Feed abonnieren
  Joomla Blog per E-Mail abonnieren mail-axialis.png Joomla Blog - Twitter E-Mail Abo !
       
Aktuell gibt es  131 Artikel

Vorsprung durch Wissen

Website Boosting - Der E-Marketing Knaller
Das SEO Standardwerk, nicht nur für Anfänger, sondern auch für Fortgeschrittene. Meiner Meinung nach eine Pflichtlektüre für jeden Webworker. Schaut euch mal die Rezensionen an.

Fehler gefunden?

Einfach Wort markieren und Shift & Enter drücken. Vielen Dank!
Add to Technorati Favorites

Archive.org Risikofaktor Internet Archiv Drucken
Donnerstag, 17. April 2008

Unbewusstes Rechtsrisiko durch Archive.org mit seinem zentralen Feature, der Wayback Machine. Viele Webmaster kümmert es nicht. Fast jede Webseite im Internet wird von Archive.org gespeichert. Dies geschieht automatisiert. Alle Seiten, inklusive Unterseiten werden kopiert. Jede kleine Änderug wird protokolliert. Von jeder Version einer Webseite wird eine Kopie abgelegt. Ungefragt, versteht sich. Archive.org hat mittlerweile schon über 85 Milliarden Seiten im Portfolio. Ein beeindruckende Anzahl. Schön, aber wer braucht die Wayback Machine ? SEOs und Domainhändler einmal ausgenommen.


Archive.org - Das Internet vergisst nicht


Grundsätzlich ist bekannt, dass auch Google seine im Katalog befindlichen Seiten im sogenannten 'Cache' speichert. Der Unterschied zwischen dem Google Cache und Archive.org ist aber, dass Google immer nur eine Version der Seite speichert – zumeist eine relativ aktuelle Version. Archive.org dagegen vergisst dagegen nichts! Hier werden alle Änderungen protokolliert. Vom Tag 1 der jeweiligen Webseite.

The Wayback Machine - Rechtliches Risiko


Nun stelle man sich einmal vor, man hätte auf seinen Webseiten ein Bild illegal angeboten, einen rechtlich problematischen Text geschrieben oder sogar illegale Downloads angeboten. Dies kommt mit Sicherheit "hier und da" vor. Der Verantwortliche erkennt im Idealfall sein Vergehen gegen das geltende Recht und löscht die problematischen Inhalte von seinen Webseiten. Er wiegt sich in falscher Sicherheit.

Dabei hat Archive.org nichts vergessen! Somit ist dieses Angebot dafür geeignet brauchbares Beweismaterial gegen die entsprechende Webseite einzuholen. Nun kann man auch hier argumentieren, dass man "nichts zu verbergen" hat und sich keines Vergehens bewusst ist. Nur kommt es immer mal wieder vor, dass Ansprüche erhoben werden, welche in rechtlichen Grauzonen liegen, welche man also nicht unbedingt vorhersehen kann.

Zudem kann es prinzipiell passieren, dass man gegen geltendes Recht auf seiner Webseite verstößt und den Fehler erst ein paar Wochen später korrigiert. Unter diesen Umständen könnte man sich überlegen, ob es Sinn macht, dass die eigene Webseite von Archive.org ohne Einwilligung andauernd in Kopie abgespeichert wird.

Löschungspflichten für Webmaster & Video


Spätestens beim rechtlich sehr interessanten Thema Löschungspflichten sollte sich der Webmaster Gedanken über die Sinnhaftigkeit und eventuelle Nachteile durch die Listung bei archive.org Gedanken machen. Verstößt ein Webmaster gegen geltendes Recht und wird deswegen belangt, muss er zumeist die beanstandeten Inhalte löschen - und zwar im gesamten Netz. Nur was ist dann mit den Kopien auf achive.org? Diese sollte man unbedingt berücksichtigen und bedenken. 

Der Rechtsanwalt Dr. Bahr stellt auch zu diesem Thema einen sehenswerten Videobeitrag auf seiner Seite Law Vodcast zur Verfügung, den ich gerne hier verlinken möchte. Es wird unter anderem die Bedeutung von archive.org auf das Thema Löschungspflicht für Webmaster behandelt. Zum Verständnis: Dr. Bahr spricht statt von archive.org von der Wayback Machine - welche nichts anderes ist, als die Suchfunktion von archive.org

 

Archive.org bleibt draußen – Robots.txt


Es ist zum Glück ein leichtes Archive.org auszusperren und somit von seinem ungefragten Kopierlüsten abzuhalten. So muss der Webmaster nur folgenden Codeschnipsel in seine Robots.txt, welche im Root der Homepage liegt, einzufügen:

User-agent: ia_archiver
Disallow: /
User-agent: ia_archiver/1.6
Disallow: /



Schon bleibt der Bot von Archive.org draußen und es werden keine ungefragten Kopien mehr angefertigt. Das ist das gute Recht eines jeden Webmasters und natürlich nicht „illegal“. Dennoch sollte das in keinem Falle dazu einladen auf der eigenen Seite Urheberrechtsverletzungen zu begehen!
 

Was bringt Archive.org der Menschheit ?


Dennoch bleibt diese Frage offen. Auf kurze Statements per Kommentarfunktion bin ich gespannt! Wann macht es Sinn Archive.org nicht auszusperren? Sind die Risiken wirklich ausreichend hoch, um zu der Robots.txt Maßnahme zu greifen? Fördert Archive.org den Content Klau? Wem nützt das riesige Internet Archive wirklich?

 
Kommentare
Neuer Kommentar Suche RSS
Markus  - Tja     ID:217.186.167.xxx 17-04-2008 19:52:43
Also so richtig klar ist mir der Sinn dieser "Machine" noch nicht. Ich kannte sie auch schon eine Weile und habe mir mal ein paar Seiten aus den 90ern angeschaut; bei Google hat sich ja nicht viel getan ;-).
Aber bei jüngeren Speicherungen, weiß ich nicht, wen das interessiert, außer vielleicht gelangweilte Rechtsanwälte.
Ich werde den Robot gleich mal vor die Tür setzen...

Markus

P.S.: Warum merkt sich JomComment die Formulardaten nicht - da muss ich alles immer wieder neu eingeben.
Joomla Blog   ID:217.235.160.xxx 18-04-2008 02:08:20
Sinn und Unsinn der Archivierung des Internets wird mir wohl nie klar werden. Bekanntlich ist die Archivierung von "Content" aller Art (inkl. Blogs) nun auch in Deutschland Pflicht.

Allerdings weiß noch keiner wie das funktionieren soll. Aber hauptsache erst einmal ein neues Gesetz.

Genau, Robot lieber aussperren. The Wayback Machine wird gerne von SEOs zur Altersanalyse genutzt und mehr.

Für mich ist weniger mehr... Zudem bin ich nicht daran interessiert, dass mein Content 1:1 "überall" online verfügbar ist.

Dennoch bin ich daran interessiert zu verstehen, wieso die Welt TheWayback Machine und Co braucht! Helft mir bitte auf die Sprünge :)

P.S.: JoomlaComment beherrscht noch keine Cookies, so dass die Formular Daten jedes Mal neu eingegeben werden müssen. Dieses Feature ist aber in der Entwicklung.
Marvin     ID:87.185.73.xxx 30-04-2008 17:52:43
Ich hatte schon den einen oder anderen Aha-Effekt, besonders bei der Suche nach eigenen Seiten, aber tendenziell sollte man den Archive-Bot aussperren. Ich hatte schon Post vom Anwalt, ich möge doch den Google-Cache einer bestimmten Seite löschen. Und das ist weitaus einfacher als den Archive-Cache zu löschen.
Joomla Blog   ID:217.235.151.xxx 30-04-2008 18:02:35
Hi Marvin,

tnx für dein Feedback! In der Tat - der Google Cache kann leicht über die Google Webmaster Tools gelöscht werden. Dies geht relativ flott.

Aber auch ein "Löschen" von Inhalten aus der Wayback Machine sollte mittlerweile leicht möglich sein. Denn wenn man die den Archive.org Bot per Robots.txt ausperrt, sind die gespeicherten Archiv Seiten nicht mehr aufrufbar. Natürlich erst, wenn der Bot ein paar Mal an der robots.txt gescheitert ist :)

Viele Grüße,
Joomla Blog
Jochen  - noch besser   ID:91.65.115.xxx 30-07-2008 23:07:33
Noch schlimmer wird es wenn die domain schon vor längerem gelöscht wurde. Da kann man dann natürlich auch keine "robots.txt" mehr platzieren..

Hat da jemand Erfahrungen dazu??

VieleGrüße,
Jo
Joomla Blog   ID:217.235.160.xxx 30-07-2008 23:15:15
Hi Jo,

in der Tat ein ärgerliches Problem, wenn du keinen Zugriff mehr auf die Domain hast! Aber "The Wayback Machine" bietet neben der robots.txt auch das manuelle Löschen von Inhalten an: 

"(...) If you cannot put a robots.txt file up, read our exclusion policy. If you think it applies to you, send a request to us at info@archive.org."

Details zum Antrag findest du unter:
Domain aus Wayback Machine löschen ohne robots.txt

Es würde mich sehr interessieren wie und ob dein Antrag durchkommt. Ein kurzes Feedback wäre toll :)

Viele Grüße und viel Erfolg,
Joomla Blog
Jo  - Keine Reaktion     ID:91.65.115.xxx 14-08-2008 20:59:39
Zwei Wochen nach meiner Email doch bitte die entsprechenden Datensätze dauerhaft zu löschen hat sich absolut nichts getan. Könnten auch tot sein die Leute da..

Der "exclusion policy" zufolge ist man ja auf den guten Willen der Betreiber angewiesen. Den haben sie in meinem Fall wohl nicht.

Einzige Abhilfe scheint zu sein die Domain erneut zu mieten, um sie dann mit der entsprechenden "robots.txt" zu versehen. Da das in meinem Fall auch noch geht, weiss ich jetzt gar nicht mehr ob ich mich ärgern oder freuen soll..

VieleGrüße, Jo
Joomla Blog   ID:207.182.130.xxx 14-08-2008 23:19:46
Hi Jo,

vielen Dank für das ausführliche und interessante Feedback!

Da hast du ja richtig Glück gehabt! Ich denke du kannst dich absolut freuen :) Meines Wissens nehmen manche Webmaster auch gute finanzielle "Entschädigungen" für das Entfernen von Inhalten...

Falls man einen Webmaster nicht direkt erreicht, ist der Kontakt über den jeweiligen Provider sicherlich auch denkbar.

Viele Grüße und viel Erfolg,
Joomla Blog
Jo  - Die halbe Wahrheit   ID:91.65.115.xxx 16-08-2008 01:35:07
Ja, die halbe Wahrheit ist das ich mich freuen kann, dass die Domain zur Verfügung steht um archive.org daran zu hindern weiterhin alte Versionen dieser Seite anzuzeigen.
Die andere Hälfte besteht darin, dass natürlich - sobald die Domain oder auch nur die robots.txt gelöscht wird - diese Inhalte wieder auftauchen.
Es wird also nicht gelöscht, sondern nur zeitweise gesperrt.
Zugespitzt könnte man sagen sie klauen fortgesetzt Inhalte und löschen diese fremden Inhalte auch nicht wieder, wenn sie vom Eigentümer derselben dazu aufgefordert werden.
Stört das nur mich??

VieleGrüße, Jo
Joomla Blog   ID:217.235.143.xxx 17-08-2008 22:27:00
In der Tat ist das natürlich überhaupt nicht die Ideallösung. Aber wie so oft gewinnt der Mächtigere. Gegen die Wayback Machine und deren Betreiber hat man als Webmaster wohl kaum eine Chance.

Es stört mich ebenfalls und viele andere Webmaster mit Sicherheit auch. Aber das Thema Urheberrecht im Netz muss sich wohl erst noch entwickeln. Aktuell haben Videos oder Musik im Netz höheren Stellenwert. Leider, leider.

Viele Grüße,
Joomla Blog
Pam   ID:217.237.124.xxx 15-11-2008 12:54:28
1. Wie begründet Arcvhiv.org die Copyrightverletzung?
Wenn auf meinen Seiten expliziet darauf hingewiesen wird, dass die Texte nicht ohne Genehmigung kopiert werden dürfen, dann wird hier das Copyright ad absurdum geführt.
2. Wenn ich einen Text, der unter Copyright stand, gelöscht habe, denn kann ich doch nicht dafür haften, wenn ein Dritter weiterhin den Text veröffentlicht. Dass heißt, Archiv.org macht sich den Text zu eigen und stellt ihn bei sich zur Verfügung. Also müssen die nun löschen, denn es steht auf deren Seite, schließlich habe ich keinen Einfluß darauf.

Pam
Joomla Blog   ID:217.235.147.xxx 18-11-2008 21:29:39
Nun, darüber kann man nur mutmaßen. Es ist u.U. so wie mit Google. Niemand traut sich so eine große Unternehmung anzuklagen, da die Chancengleichheit wahrscheinlich nicht gegeben ist.

Und wo kein Richter, da kein....

Der zweite Punkt ist meiner Meinung nach der kritischere Punkt. Ich meine gelesen zu haben, dass genau deine Argumentation in der Praxis größere Probleme macht und die Probleme dann trotzdem in den Verantwortungsbereich des kleinen Webmasters fallen.

Viele Grüße,
Joomla Blog
Mike   ID:91.52.205.xxx 21-12-2008 13:44:07
Hi,
habe auch gerade mal die Aufgabe (wegen Freigabe meiner Domain) archiv.org davon zu überzeugen, die Inhalte meiner Site "dauerhaft" zu löschen, und nicht nur zu unterdrücken, solange der "Türwächter" aufpasst. Schließlich möchte ich ja nicht nur wegen des robots.txt die Domain be- und verwalten müssen.
Über weiterführend Infos und Erfahrungen würde ich mich schon sehr freuen.

Mike
Joomla Blog   ID:217.235.164.xxx 22-12-2008 22:19:05
Das hört sich nach einem echten Problem an, denn Archive.org macht einfach was es will - Rechtsgrundlage: keine?

Ich kann gut verstehen, dass du die Inhalte gerade wegen Abgabe der Domain komplett löschen willst. Eine Lösung / einen Tipp kann ich dir da aber leider nicht geben.

Allgemein gibt es einfach eine goldene Regel: Wenn man eine neue Domain registriert und online nimmt, sollte man sofort archive.org und Co. sperren, damit überhaupt keine Daten gesammelt werden können.

Ich wünsche dir aber, dass du eine gute Lösung findest und wäre an dieser sehr interessiert!

Joomla Blog
Blackberry Blog  - Hilfreicher Tip!     ID:84.146.222.xxx 30-03-2009 12:58:33
Herzlichen Dank für die Erklärung und den Code für die robots.txt
Genau nach so etwas hatte ich gesucht!

Schöne Grüße,
Sascha
Fg68at   ID:62.116.83.xxx 05-05-2009 21:16:36
Also ich habe es schon öfters brauchen können.

Manchmal schreibe notiere ich mir nur URLs. Wenn die Seite umgestell wird kommt das suchen. Oder ich finde es bei archive.org , kopier mir dort ein Zitat und finde über Google die neue URL.

In der Wikipedia verweise ich manchmal auf archive.org, wenn eine angegebene Quelle verschwindet. Sonst kann es passieren, dass möglicherweise einer die Information sonst löscht.

Ich habe bei einem Artikel zB Meyers Online als Quelle verwendet. Scheiße, die Seite hat zugemacht und ist auch nicht bei archive.org gespeichert. Ist meine Arbeit jetzt wertlos, weil quellenlos und habe ich die Information jetzt zu beseitigen?

Manchmal findet sich die gesuchte Seite auch später wo anders wieder. (zB ein Student mit Webspace auf der Universität, der dann auf eine eigene Domain umzieht.) Aber in der Zwischenzeit, bis die neue Seite von einer Suchmaschine erfasst wird, bleibt mir nur archive.org.

Zu manchen speziellen Themen ist das Internet oft die einzige zu findende Quelle. zB die Bedeutung und Rezeption von "Go West" in der schwulen Subkultur der USA.

Oder jetzt wurde ein Artikel über ein Traditionsunternehmen geschrieben, welche seit 1733 dieselbe Adresse hatte, ehemaliger k.k. Hoflieferant. 2006 sperrte er zu und seit 2007 ist die Webseite weg. Dank archive.org kam man zu historischen Daten, den Rest gab es in der Presse und so konnte der Artikel entstehen.

Welchen Wert archive.org für Domainhändler hat ist mir nicht klar. Ich sehe keinen.

Es wird bei archive.org auch nicht jede Änderung gespeichert, sondern nur Snapshoots alle zwei Monate.

Wa ist mit herausgebrachten Büchern, hinter dessen Information man nicht mehr steht? In irgendeiner Bibliothek finden sie sich. Soll man jetzt alle Bibliotheken anschreiben, damit sie die Bücher vernichten? Plus archive.org oder Google Books, plus andere Projekte?
Joomla Blog   ID:217.235.137.xxx 21-08-2009 00:43:42
Hallo Fg68at,

erst einmal vielen Dank für die sehr interessanten Ausführungen! Ich denke dein Anwendungsverhalten trifft genau den Grundgedanken von archive.org. Genau diesen Einsatzzweck soll das Internet Archiv erfüllen.

In dem Sinne sind deine Argumente auch vollkommen plausibel und berechtigt.

Ich denke die Aufregung rührt von der langsam wachsenden Erkenntnis her, dass manche Informationen im Netz eben besser nicht für die Ewigkeit gespeichert werden sollten. In solchen Fällen ist dann die Aufregung groß.

Für Domainhändler ist archive.org meines Wissens nach interessant, da sich hier feststellen lässt, wie alt eine Domain ist. Und das Alter einer Domain ist ganz klar eines von vielen Ranking Faktoren.

Viele Grüße,
Joomla Blog
Eurolappen  - Danke.     ID:109.90.92.xxx 18-01-2010 16:07:24
Danke für den Tipp. Habe den Code gerade eingebunden, obwohl meine Seite komischerweise nach über einem Jahr noch gar nicht von der WBM gelistet ist.
Kommentar schreiben
Name:
Email:
 
Website:
Titel:
UBBCode:
[b] [i] [u] [url] [quote] [code] [img] 
 
 
Bitte den Anti-Spam Code eingeben.

3.26 Copyright (C) 2008 Compojoom.com / Copyright (C) 2007 Alain Georgette / Copyright (C) 2006 Frantisek Hliva. All rights reserved."

Tags:  archive org archive internet robots txt