Joomla Blog - Die Insider Tipps


Blog über das beliebte Content Management System Joomla. Tipps und Tricks zu allen Joomla Themen, Hacks und Fixes, SEO, sowie allgemeinere Webmaster Themen.
Unser RSS FeedBleibe auf dem Laufenden mit dem Joomla Blog RSS Feed. Klicke auf das Symbol um den Feed zu abonnieren.

twitter-rss-abo.png Joomla Blog Twitter Feed abonnierenblog4mobile.de  Handyversion von Joomla Blog lesen
mail-axialis.png Joomla Blog per E-Mail abonnieren

 Nov   Dezember 2008   Jan

SMDMDFS
   1  2  3  4  5  6
  7  8  910111213
14151617181920
21222324252627
28293031 

Blog Roll


Kategorien

Aktuell gibt es  120 Artikel

Kommende Themen

>> Starker Webserver für wenig Geld?
>> Alternativen zu Google Analytics?
>> Joomla PUArcade Performance

Nicht verpassen mit dem
Joomla Blog RSS Feed

Vorsprung durch Wissen

Website Boosting - Der E-Marketing Knaller
Das SEO Standardwerk, nicht nur für Anfänger, sondern auch für Fortgeschrittene. Meiner Meinung nach eine Pflichtlektüre für jeden Webworker. Schaut euch mal die Rezensionen an.

Fehler gefunden?

Einfach Wort markieren und Shift & Enter drücken. Vielen Dank!
Add to Technorati Favorites

Advertisement
JoomlaWatch Stats 1.2.8b by Matej Koval




Archive.org Risikofaktor Internet Archiv Drucken
Donnerstag, 17. April 2008

Unbewusstes Rechtsrisiko durch Archive.org mit seinem zentralen Feature, der Wayback Machine. Viele Webmaster kümmert es nicht. Fast jede Webseite im Internet wird von Archive.org gespeichert. Dies geschieht automatisiert. Alle Seiten, inklusive Unterseiten werden kopiert. Jede kleine Änderug wird protokolliert. Von jeder Version einer Webseite wird eine Kopie abgelegt. Ungefragt, versteht sich. Archive.org hat mittlerweile schon über 85 Milliarden Seiten im Portfolio. Ein beeindruckende Anzahl. Schön, aber wer braucht die Wayback Machine ? SEOs und Domainhändler einmal ausgenommen.


Archive.org - Das Internet vergisst nicht


Grundsätzlich ist bekannt, dass auch Google seine im Katalog befindlichen Seiten im sogenannten 'Cache' speichert. Der Unterschied zwischen dem Google Cache und Archive.org ist aber, dass Google immer nur eine Version der Seite speichert – zumeist eine relativ aktuelle Version. Archive.org dagegen vergisst dagegen nichts! Hier werden alle Änderungen protokolliert. Vom Tag 1 der jeweiligen Webseite.

The Wayback Machine - Rechtliches Risiko


Nun stelle man sich einmal vor, man hätte auf seinen Webseiten ein Bild illegal angeboten, einen rechtlich problematischen Text geschrieben oder sogar illegale Downloads angeboten. Dies kommt mit Sicherheit "hier und da" vor. Der Verantwortliche erkennt im Idealfall sein Vergehen gegen das geltende Recht und löscht die problematischen Inhalte von seinen Webseiten. Er wiegt sich in falscher Sicherheit.

Dabei hat Archive.org nichts vergessen! Somit ist dieses Angebot dafür geeignet brauchbares Beweismaterial gegen die entsprechende Webseite einzuholen. Nun kann man auch hier argumentieren, dass man "nichts zu verbergen" hat und sich keines Vergehens bewusst ist. Nur kommt es immer mal wieder vor, dass Ansprüche erhoben werden, welche in rechtlichen Grauzonen liegen, welche man also nicht unbedingt vorhersehen kann.

Zudem kann es prinzipiell passieren, dass man gegen geltendes Recht auf seiner Webseite verstößt und den Fehler erst ein paar Wochen später korrigiert. Unter diesen Umständen könnte man sich überlegen, ob es Sinn macht, dass die eigene Webseite von Archive.org ohne Einwilligung andauernd in Kopie abgespeichert wird.

Löschungspflichten für Webmaster & Video


Spätestens beim rechtlich sehr interessanten Thema Löschungspflichten sollte sich der Webmaster Gedanken über die Sinnhaftigkeit und eventuelle Nachteile durch die Listung bei archive.org Gedanken machen. Verstößt ein Webmaster gegen geltendes Recht und wird deswegen belangt, muss er zumeist die beanstandeten Inhalte löschen - und zwar im gesamten Netz. Nur was ist dann mit den Kopien auf achive.org? Diese sollte man unbedingt berücksichtigen und bedenken. 

Der Rechtsanwalt Dr. Bahr stellt auch zu diesem Thema einen sehenswerten Videobeitrag auf seiner Seite Law Vodcast zur Verfügung, den ich gerne hier verlinken möchte. Es wird unter anderem die Bedeutung von archive.org auf das Thema Löschungspflicht für Webmaster behandelt. Zum Verständnis: Dr. Bahr spricht statt von archive.org von der Wayback Machine - welche nichts anderes ist, als die Suchfunktion von archive.org

 

Archive.org bleibt draußen – Robots.txt


Es ist zum Glück ein leichtes Archive.org auszusperren und somit von seinem ungefragten Kopierlüsten abzuhalten. So muss der Webmaster nur folgenden Codeschnipsel in seine Robots.txt, welche im Root der Homepage liegt, einzufügen:

User-agent: ia_archiver
Disallow: /
User-agent: ia_archiver/1.6
Disallow: /



Schon bleibt der Bot von Archive.org draußen und es werden keine ungefragten Kopien mehr angefertigt. Das ist das gute Recht eines jeden Webmasters und natürlich nicht „illegal“. Dennoch sollte das in keinem Falle dazu einladen auf der eigenen Seite Urheberrechtsverletzungen zu begehen!
 

Was bringt Archive.org der Menschheit ?


Dennoch bleibt diese Frage offen. Auf kurze Statements per Kommentarfunktion bin ich gespannt! Wann macht es Sinn Archive.org nicht auszusperren? Sind die Risiken wirklich ausreichend hoch, um zu der Robots.txt Maßnahme zu greifen? Fördert Archive.org den Content Klau? Wem nützt das riesige Internet Archive wirklich?

 
Kommentare
Neuer Kommentar Suche RSS
Markus  - Tja     ID:217.186.167.xxx 17-04-2008 20:52:43
Also so richtig klar ist mir der Sinn dieser "Machine" noch nicht. Ich kannte sie auch schon eine Weile und habe mir mal ein paar Seiten aus den 90ern angeschaut; bei Google hat sich ja nicht viel getan ;-).
Aber bei jüngeren Speicherungen, weiß ich nicht, wen das interessiert, außer vielleicht gelangweilte Rechtsanwälte.
Ich werde den Robot gleich mal vor die Tür setzen...

Markus

P.S.: Warum merkt sich JomComment die Formulardaten nicht - da muss ich alles immer wieder neu eingeben.
Joomla Blog   ID:217.235.160.xxx 18-04-2008 03:08:20
Sinn und Unsinn der Archivierung des Internets wird mir wohl nie klar werden. Bekanntlich ist die Archivierung von "Content" aller Art (inkl. Blogs) nun auch in Deutschland Pflicht.

Allerdings weiß noch keiner wie das funktionieren soll. Aber hauptsache erst einmal ein neues Gesetz.

Genau, Robot lieber aussperren. The Wayback Machine wird gerne von SEOs zur Altersanalyse genutzt und mehr.

Für mich ist weniger mehr... Zudem bin ich nicht daran interessiert, dass mein Content 1:1 "überall" online verfügbar ist.

Dennoch bin ich daran interessiert zu verstehen, wieso die Welt TheWayback Machine und Co braucht! Helft mir bitte auf die Sprünge :)

P.S.: JoomlaComment beherrscht noch keine Cookies, so dass die Formular Daten jedes Mal neu eingegeben werden müssen. Dieses Feature ist aber in der Entwicklung.
Marvin     ID:87.185.73.xxx 30-04-2008 18:52:43
Ich hatte schon den einen oder anderen Aha-Effekt, besonders bei der Suche nach eigenen Seiten, aber tendenziell sollte man den Archive-Bot aussperren. Ich hatte schon Post vom Anwalt, ich möge doch den Google-Cache einer bestimmten Seite löschen. Und das ist weitaus einfacher als den Archive-Cache zu löschen.
Joomla Blog   ID:217.235.151.xxx 30-04-2008 19:02:35
Hi Marvin,

tnx für dein Feedback! In der Tat - der Google Cache kann leicht über die Google Webmaster Tools gelöscht werden. Dies geht relativ flott.

Aber auch ein "Löschen" von Inhalten aus der Wayback Machine sollte mittlerweile leicht möglich sein. Denn wenn man die den Archive.org Bot per Robots.txt ausperrt, sind die gespeicherten Archiv Seiten nicht mehr aufrufbar. Natürlich erst, wenn der Bot ein paar Mal an der robots.txt gescheitert ist :)

Viele Grüße,
Joomla Blog
Jochen  - noch besser   ID:91.65.115.xxx 31-07-2008 00:07:33
Noch schlimmer wird es wenn die domain schon vor längerem gelöscht wurde. Da kann man dann natürlich auch keine "robots.txt" mehr platzieren..

Hat da jemand Erfahrungen dazu??

VieleGrüße,
Jo
Joomla Blog   ID:217.235.160.xxx 31-07-2008 00:15:15
Hi Jo,

in der Tat ein ärgerliches Problem, wenn du keinen Zugriff mehr auf die Domain hast! Aber "The Wayback Machine" bietet neben der robots.txt auch das manuelle Löschen von Inhalten an: 

"(...) If you cannot put a robots.txt file up, read our exclusion policy. If you think it applies to you, send a request to us at info@archive.org."

Details zum Antrag findest du unter:
Domain aus Wayback Machine löschen ohne robots.txt

Es würde mich sehr interessieren wie und ob dein Antrag durchkommt. Ein kurzes Feedback wäre toll :)

Viele Grüße und viel Erfolg,
Joomla Blog
Jo  - Keine Reaktion     ID:91.65.115.xxx 14-08-2008 21:59:39
Zwei Wochen nach meiner Email doch bitte die entsprechenden Datensätze dauerhaft zu löschen hat sich absolut nichts getan. Könnten auch tot sein die Leute da..

Der "exclusion policy" zufolge ist man ja auf den guten Willen der Betreiber angewiesen. Den haben sie in meinem Fall wohl nicht.

Einzige Abhilfe scheint zu sein die Domain erneut zu mieten, um sie dann mit der entsprechenden "robots.txt" zu versehen. Da das in meinem Fall auch noch geht, weiss ich jetzt gar nicht mehr ob ich mich ärgern oder freuen soll..

VieleGrüße, Jo
Joomla Blog   ID:207.182.130.xxx 15-08-2008 00:19:46
Hi Jo,

vielen Dank für das ausführliche und interessante Feedback!

Da hast du ja richtig Glück gehabt! Ich denke du kannst dich absolut freuen :) Meines Wissens nehmen manche Webmaster auch gute finanzielle "Entschädigungen" für das Entfernen von Inhalten...

Falls man einen Webmaster nicht direkt erreicht, ist der Kontakt über den jeweiligen Provider sicherlich auch denkbar.

Viele Grüße und viel Erfolg,
Joomla Blog
Jo  - Die halbe Wahrheit   ID:91.65.115.xxx 16-08-2008 02:35:07
Ja, die halbe Wahrheit ist das ich mich freuen kann, dass die Domain zur Verfügung steht um archive.org daran zu hindern weiterhin alte Versionen dieser Seite anzuzeigen.
Die andere Hälfte besteht darin, dass natürlich - sobald die Domain oder auch nur die robots.txt gelöscht wird - diese Inhalte wieder auftauchen.
Es wird also nicht gelöscht, sondern nur zeitweise gesperrt.
Zugespitzt könnte man sagen sie klauen fortgesetzt Inhalte und löschen diese fremden Inhalte auch nicht wieder, wenn sie vom Eigentümer derselben dazu aufgefordert werden.
Stört das nur mich??

VieleGrüße, Jo
Joomla Blog   ID:217.235.143.xxx 17-08-2008 23:27:00
In der Tat ist das natürlich überhaupt nicht die Ideallösung. Aber wie so oft gewinnt der Mächtigere. Gegen die Wayback Machine und deren Betreiber hat man als Webmaster wohl kaum eine Chance.

Es stört mich ebenfalls und viele andere Webmaster mit Sicherheit auch. Aber das Thema Urheberrecht im Netz muss sich wohl erst noch entwickeln. Aktuell haben Videos oder Musik im Netz höheren Stellenwert. Leider, leider.

Viele Grüße,
Joomla Blog
Pam   ID:217.237.124.xxx 15-11-2008 13:54:28
1. Wie begründet Arcvhiv.org die Copyrightverletzung?
Wenn auf meinen Seiten expliziet darauf hingewiesen wird, dass die Texte nicht ohne Genehmigung kopiert werden dürfen, dann wird hier das Copyright ad absurdum geführt.
2. Wenn ich einen Text, der unter Copyright stand, gelöscht habe, denn kann ich doch nicht dafür haften, wenn ein Dritter weiterhin den Text veröffentlicht. Dass heißt, Archiv.org macht sich den Text zu eigen und stellt ihn bei sich zur Verfügung. Also müssen die nun löschen, denn es steht auf deren Seite, schließlich habe ich keinen Einfluß darauf.

Pam
Joomla Blog   ID:217.235.147.xxx 18-11-2008 22:29:39
Nun, darüber kann man nur mutmaßen. Es ist u.U. so wie mit Google. Niemand traut sich so eine große Unternehmung anzuklagen, da die Chancengleichheit wahrscheinlich nicht gegeben ist.

Und wo kein Richter, da kein....

Der zweite Punkt ist meiner Meinung nach der kritischere Punkt. Ich meine gelesen zu haben, dass genau deine Argumentation in der Praxis größere Probleme macht und die Probleme dann trotzdem in den Verantwortungsbereich des kleinen Webmasters fallen.

Viele Grüße,
Joomla Blog
Kommentar schreiben
Name:
Email:
 
Website:
Titel:
UBBCode:
[b] [i] [u] [url] [quote] [code] [img] 
 
 
Bitte den Anti-Spam Code eingeben.

3.26 Copyright (C) 2008 Compojoom.com / Copyright (C) 2007 Alain Georgette / Copyright (C) 2006 Frantisek Hliva. All rights reserved."

Weitere Artikel, die dich interessieren könnten:
Deine StimmeRSS Feed
rss-beitrag.pngabonieren
Link hinzufügen zu: Infopirat Link hinzufügen zu: Webnews Link hinzufügen zu: Oneview Link hinzufügen zu: Readster Link hinzufügen zu: Favoriten.de Link hinzufügen zu: Mr. Wong Link hinzufügen zu: Seekxl Link hinzufügen zu: BoniTrust Link hinzufügen zu: Linkarena
Danke für Deinen Besuch
Amazon Anzeige
Tags:  archive org archive internet robots txt