[Wikide-l] ToDo: Algoritmus zur URV-identifizierung

Robert Michel news at RobertMichel.de
Do Feb 26 13:01:17 UTC 2004


Salve,

mir kam gestern [[Sandrine_Kiberlain]] sehr verdächtig vor, konnte aber nichts 
finden, Fab hat heute die Quelle gefunden: NDR. Suchmaschinen brauchen 1-14 
Tage um eine Webseite im Index aufzunehmen, also muß man verdächtige Texte, 
insbesondere von anonymen Usern nach 3,7,14,28 Tagen nochmals nach URV 
recherchieren.

Aber Google alleine kann uns bei URV nicht helfen, es gibt pay-per-view 
Content z.b. xipolis.net genios.de oder Archiv des gedrucken Spiegels, denn 
wir eigenlich für jedes Diff (Artikeländerung) auf Satzähnlichkeiten 
abarbeiten müssten, genauso wie wir selber populären Kontent z.B NDR, 
heise.... archiveren sollten um eine eigene DB mit urheberbehafteten Material 
zur Prüfung von Beiträgen anlegen können um dann nach 3,7,14,28 Tage
alle Beiträge mit dem anderen Material automatisch vergleichen lassen könnte.

Der Satuts Quo ist zu subjektiv und fehleranfällig. Gibt es hierzu bereits 
Entwicklungsideen?

Aktuell werde ich bei suspekten Beiträgen
[[Artikel_mit_noch_ungeklärten_Urheberrechten]]
nutzen und das Beispiel [[Sandrine_Kiberlain]] zeigt, das man einen Verdacht 
nicht vorschnell ausräumen kann und IMHO lieber zuviel löscht, als zuwenig.

Gruss
rob