[Wikide-l] Re: Urv-Bot

Robert Michel news at RobertMichel.de
Do Mär 4 21:35:15 UTC 2004


Salve,

Am Donnerstag, 4. März 2004 21:32 schrieb Thomas R. Koll:
> On Thu, Mar 04, 2004 at 09:28:55PM +0100, Nils Kehrein wrote:
> > Hm, ich weiß nicht wie ''gut'' die Suchergebnisse von Y! sind. IMHO ist
> > Google immer noch das Nonplusultra auf dem Gebiet der Suchmaschinen.
>
> Du könntest ja nicht nur direkte hits bei der suchmaschine sondern
> auch andere Faktoren wie fehlenden wiki-formatierung, eine URl ganz am
> Ende und anderes mit einfließen lassen in die Bewertung.

-Existierende Zeilenumbrüche
-Rechtschreibprüfung (Ispell)
-Verhältnis alter Text/neuer Text
-Ob neuer Text on block oder in den alten eingebaut wird (siehe IBM 
visualisierung)
-Hat der User schon mehrfach an diesem Text geschrieben?
-.....

Es wäre wohl gut ca. 100 Beispiele, 50 für URV freie Entwicklung und 50 für 
Textbarbeitungen mit URV für die Entwicklung zu bennen. Ein Neuer Artikel der 
100% URV ist dürfte der Einfachste Fall sein.

Auch könnte man Anstelle des PHP-Dump eine zeitnähere Lösung finden.

Andererseits haben Suchmaschinen eine Latenzzeit, d.h. ich hatte Letze Woche 
einen Text über eine franz. Filmschauspieleren als URV verdächtigt, die 
Suchmaschienen lieferte aber erst 24h später, das dieser Text bereits auf 
einem NDR Server lag.

Wir könnten uns auch eine kleine Eigene Suchmaschine + Textarchive für 
wichtige Quellen: Tageszeitungen, TV, Radio, Magazine bauen und hin und 
wieder per bot neue Seiten wgetten.
BTW, dann gäbe es noch kostenpflichtige Portale:
-spiegel.de
-faz.de
-genios.de
Wobei die nicht unbedingt von > 1000 Anfragen pro Tag begeistert wären, 
vielleicht muß man einfach mit jedem Gespräche führen und sagen, das eine 
vermeidung einer URV auch in ihrem Interresse wäre *g*

Gruss
rob