Blog über das beliebte Content Management SystemJoomla. Tipps und Tricks zu allen Joomla Themen, Hacks und Fixes, SEO, sowie allgemeinere Webmaster Themen.
Bleibe auf dem Laufenden mit dem Joomla Blog RSS Feed. Klicke auf das Symbol um den Feed zu abonnieren.
>> Starker Webserver für wenig Geld? >> Alternativen zu Google Analytics? >> Joomla PUArcade Performance
Nicht verpassen mit dem Joomla Blog RSS Feed
Vorsprung durch Wissen
Das SEO Standardwerk, nicht nur für Anfänger, sondern auch für Fortgeschrittene. Meiner Meinung nach eine Pflichtlektüre für jeden Webworker. Schaut euch mal die Rezensionen an.
Fehler gefunden?
Einfach Wort markieren und Shift & Enter drücken. Vielen Dank!
Unbewusstes Rechtsrisiko durch Archive.org mit seinem zentralen Feature, der Wayback Machine. Viele Webmaster kümmert es nicht. Fast jede Webseite im Internet wird von Archive.org
gespeichert. Dies geschieht automatisiert. Alle Seiten, inklusive Unterseiten werden kopiert. Jede kleine Änderug wird protokolliert. Von
jeder Version einer Webseite wird eine Kopie abgelegt. Ungefragt, versteht sich. Archive.org hat mittlerweile schon über 85 Milliarden Seiten im Portfolio. Ein beeindruckende Anzahl. Schön, aber wer
braucht die Wayback Machine ? SEOs und Domainhändler einmal
ausgenommen.
Archive.org - Das Internet vergisst nicht
Grundsätzlich
ist bekannt, dass auch Google seine im Katalog befindlichen Seiten im
sogenannten 'Cache' speichert. Der Unterschied zwischen dem Google Cache
und Archive.org ist aber, dass Google immer nur eine Version der Seite
speichert – zumeist eine relativ aktuelle Version. Archive.org dagegen vergisst dagegen nichts! Hier werden alle Änderungen protokolliert. Vom Tag 1 der jeweiligen Webseite.
The Wayback Machine - Rechtliches Risiko
Nun
stelle man sich einmal vor, man hätte auf seinen Webseiten ein Bild
illegal angeboten, einen rechtlich problematischen Text geschrieben
oder sogar illegale Downloads angeboten. Dies kommt mit Sicherheit "hier
und da" vor. Der Verantwortliche erkennt im Idealfall sein Vergehen
gegen das geltende Recht und löscht die problematischen Inhalte von seinen
Webseiten. Er wiegt sich in falscher Sicherheit.
Dabei hat Archive.org
nichts vergessen! Somit ist dieses Angebot dafür geeignet brauchbares
Beweismaterial gegen die entsprechende Webseite einzuholen. Nun kann
man auch hier argumentieren, dass man "nichts zu verbergen" hat und
sich keines Vergehens bewusst ist. Nur kommt es immer mal wieder vor,
dass Ansprüche erhoben werden, welche in rechtlichen Grauzonen liegen,
welche man also nicht unbedingt vorhersehen kann.
Zudem kann es
prinzipiell passieren, dass man gegen geltendes Recht auf seiner
Webseite verstößt und den Fehler erst ein paar Wochen später
korrigiert. Unter diesen Umständen könnte man sich überlegen, ob es
Sinn macht, dass die eigene Webseite von Archive.org ohne Einwilligung
andauernd in Kopie abgespeichert wird.
Löschungspflichten für Webmaster & Video
Spätestens beim rechtlich sehr interessanten Thema
Löschungspflichten sollte sich der Webmaster Gedanken über die
Sinnhaftigkeit und eventuelle Nachteile durch die Listung bei archive.org
Gedanken machen. Verstößt ein Webmaster gegen geltendes Recht und wird
deswegen belangt, muss er zumeist die beanstandeten Inhalte löschen -
und zwar im gesamten Netz. Nur was ist dann mit den Kopien auf
achive.org? Diese sollte man unbedingt berücksichtigen und bedenken.
Der Rechtsanwalt Dr. Bahr stellt auch zu diesem Thema einen sehenswerten Videobeitrag auf seiner Seite Law Vodcast zur Verfügung, den ich gerne hier verlinken möchte. Es wird unter anderem die Bedeutung von archive.org
auf das Thema Löschungspflicht für Webmaster behandelt. Zum
Verständnis: Dr. Bahr spricht statt von archive.org von der Wayback
Machine - welche nichts anderes ist, als die Suchfunktion von archive.org.
Archive.org bleibt draußen – Robots.txt
Es ist zum Glück ein leichtes Archive.org
auszusperren und somit von seinem ungefragten Kopierlüsten abzuhalten.
So muss der Webmaster nur folgenden Codeschnipsel in seine Robots.txt, welche im Root der Homepage liegt, einzufügen:
Schon bleibt der Bot von Archive.org
draußen und es werden keine ungefragten Kopien mehr angefertigt. Das
ist das gute Recht eines jeden Webmasters und natürlich nicht
„illegal“. Dennoch sollte das in keinem Falle dazu einladen auf der
eigenen Seite Urheberrechtsverletzungen zu begehen!
Was bringt Archive.org der Menschheit ?
Dennoch bleibt diese Frage offen. Auf kurze Statements per
Kommentarfunktion bin ich gespannt! Wann macht es Sinn Archive.org
nicht auszusperren? Sind die Risiken wirklich ausreichend hoch, um zu
der Robots.txt Maßnahme zu greifen? Fördert Archive.org den Content Klau? Wem nützt das riesige Internet Archive wirklich?
Also so richtig klar ist mir der Sinn dieser "Machine" noch nicht. Ich kannte sie auch schon eine Weile und habe mir mal ein paar Seiten aus den 90ern angeschaut; bei Google hat sich ja nicht viel getan ;-).
Aber bei jüngeren Speicherungen, weiß ich nicht, wen das interessiert, außer vielleicht gelangweilte Rechtsanwälte.
Ich werde den Robot gleich mal vor die Tür setzen...
Markus
P.S.: Warum merkt sich JomComment die Formulardaten nicht - da muss ich alles immer wieder neu eingeben.
Sinn und Unsinn der Archivierung des Internets wird mir wohl nie klar werden. Bekanntlich ist die Archivierung von "Content" aller Art (inkl. Blogs) nun auch in Deutschland Pflicht.
Allerdings weiß noch keiner wie das funktionieren soll. Aber hauptsache erst einmal ein neues Gesetz.
Genau, Robot lieber aussperren. The Wayback Machine wird gerne von SEOs zur Altersanalyse genutzt und mehr.
Für mich ist weniger mehr... Zudem bin ich nicht daran interessiert, dass mein Content 1:1 "überall" online verfügbar ist.
Dennoch bin ich daran interessiert zu verstehen, wieso die Welt TheWayback Machine und Co braucht! Helft mir bitte auf die Sprünge :)
P.S.: JoomlaComment beherrscht noch keine Cookies, so dass die Formular Daten jedes Mal neu eingegeben werden müssen. Dieses Feature ist aber in der Entwicklung.
Ich hatte schon den einen oder anderen Aha-Effekt, besonders bei der Suche nach eigenen Seiten, aber tendenziell sollte man den Archive-Bot aussperren. Ich hatte schon Post vom Anwalt, ich möge doch den Google-Cache einer bestimmten Seite löschen. Und das ist weitaus einfacher als den Archive-Cache zu löschen.
tnx für dein Feedback! In der Tat - der Google Cache kann leicht über die Google Webmaster Tools gelöscht werden. Dies geht relativ flott.
Aber auch ein "Löschen" von Inhalten aus der Wayback Machine sollte mittlerweile leicht möglich sein. Denn wenn man die den Archive.org Bot per Robots.txt ausperrt, sind die gespeicherten Archiv Seiten nicht mehr aufrufbar. Natürlich erst, wenn der Bot ein paar Mal an der robots.txt gescheitert ist :)
in der Tat ein ärgerliches Problem, wenn du keinen Zugriff mehr auf die Domain hast! Aber "The Wayback Machine" bietet neben der robots.txt auch das manuelle Löschen von Inhalten an:
"(...) If you cannot put a robots.txt file up, read our exclusion policy. If you think it applies to you, send a request to us at info@archive.org."
Zwei Wochen nach meiner Email doch bitte die entsprechenden Datensätze dauerhaft zu löschen hat sich absolut nichts getan. Könnten auch tot sein die Leute da..
Der "exclusion policy" zufolge ist man ja auf den guten Willen der Betreiber angewiesen. Den haben sie in meinem Fall wohl nicht.
Einzige Abhilfe scheint zu sein die Domain erneut zu mieten, um sie dann mit der entsprechenden "robots.txt" zu versehen. Da das in meinem Fall auch noch geht, weiss ich jetzt gar nicht mehr ob ich mich ärgern oder freuen soll..
vielen Dank für das ausführliche und interessante Feedback!
Da hast du ja richtig Glück gehabt! Ich denke du kannst dich absolut freuen :) Meines Wissens nehmen manche Webmaster auch gute finanzielle "Entschädigungen" für das Entfernen von Inhalten...
Falls man einen Webmaster nicht direkt erreicht, ist der Kontakt über den jeweiligen Provider sicherlich auch denkbar.
Ja, die halbe Wahrheit ist das ich mich freuen kann, dass die Domain zur Verfügung steht um archive.org daran zu hindern weiterhin alte Versionen dieser Seite anzuzeigen.
Die andere Hälfte besteht darin, dass natürlich - sobald die Domain oder auch nur die robots.txt gelöscht wird - diese Inhalte wieder auftauchen.
Es wird also nicht gelöscht, sondern nur zeitweise gesperrt.
Zugespitzt könnte man sagen sie klauen fortgesetzt Inhalte und löschen diese fremden Inhalte auch nicht wieder, wenn sie vom Eigentümer derselben dazu aufgefordert werden.
Stört das nur mich??
In der Tat ist das natürlich überhaupt nicht die Ideallösung. Aber wie so oft gewinnt der Mächtigere. Gegen die Wayback Machine und deren Betreiber hat man als Webmaster wohl kaum eine Chance.
Es stört mich ebenfalls und viele andere Webmaster mit Sicherheit auch. Aber das Thema Urheberrecht im Netz muss sich wohl erst noch entwickeln. Aktuell haben Videos oder Musik im Netz höheren Stellenwert. Leider, leider.
1. Wie begründet Arcvhiv.org die Copyrightverletzung?
Wenn auf meinen Seiten expliziet darauf hingewiesen wird, dass die Texte nicht ohne Genehmigung kopiert werden dürfen, dann wird hier das Copyright ad absurdum geführt.
2. Wenn ich einen Text, der unter Copyright stand, gelöscht habe, denn kann ich doch nicht dafür haften, wenn ein Dritter weiterhin den Text veröffentlicht. Dass heißt, Archiv.org macht sich den Text zu eigen und stellt ihn bei sich zur Verfügung. Also müssen die nun löschen, denn es steht auf deren Seite, schließlich habe ich keinen Einfluß darauf.
Nun, darüber kann man nur mutmaßen. Es ist u.U. so wie mit Google. Niemand traut sich so eine große Unternehmung anzuklagen, da die Chancengleichheit wahrscheinlich nicht gegeben ist.
Und wo kein Richter, da kein....
Der zweite Punkt ist meiner Meinung nach der kritischere Punkt. Ich meine gelesen zu haben, dass genau deine Argumentation in der Praxis größere Probleme macht und die Probleme dann trotzdem in den Verantwortungsbereich des kleinen Webmasters fallen.
Juhuu hat geklappt musst nur ein ...
DANKE! DANKE! DANKE! DANKE! D...
Hy, Hab das selbe prob und hab d...
du hast schon recht, aber man sol...
Hi Thomas, vielen Dank für dein&...
Danke erstmal für die Übersetzung...
Das glaub ich dir sofort :) Viel...
Speziell auf das Thema Virtuemart...
Hi Markus, das hört sich schon ...
Hi Marko und danke für die intere...
Leider nein. Vielleicht arbeitet ...
http://www.chdir.de/ da wird eine...