[Wikide-l] Re: Vorschlag für effizientere Kontrolle der neuen Beiträge

Marco Krohn marco.krohn at web.de
Sa Mär 13 12:15:36 UTC 2004


On Wednesday 10 March 2004 14:52, elwp at gmx.de wrote:

<snip>
> Zuerst ein paar Definitionen:
> A: Anzahl der pro Tag zu prüfenden Artikel
> B: Anzahl der Benutzer, die die Artikel prüfen
> P: Anzahl der Prüfungen pro Benutzer und Tag
>
> Dann gibt N=BP/A an, wie oft ein Artikel
> im Mittel geprüft wird.
>
> Annahme: Kein Benutzer prüft Artikel mehrfach und
> wählt unabhängig von den anderen Benutzern
> die Artikel, die er prüft, zufällig aus.
>
> Die Wahrscheinlichkeit w für einen Artikel, von
> keinem Benutzer geprüft zu werden ist:
>
> w = X^N
> mit X=(1-P/A)^(A/P)


w = X^N = (1 - P/A )^B

Für P/A << 1 

=>  w = 1 - P(B/A) + O((B/A)^2)

P wird i.a. ein Konstante sein, während B und A zeitabhängig sind. Nimmt man 
an, dass die Anzahl der neuen Artikel A ungefähr proportional zur Anzahl der 
Benutzer ist, dann ist B/A = const für alle Zeiten t und somit 

w = const    für alle t

was in etwa dem entspricht, was ich meinte. 

Das ganze ist natürlich nur ein Spielzeug-Modell, aber trotzdem sehr schön :-)

Man kann das Modell noch erweitern, indem man nicht nur die Artikel, die gar 
nicht kontrolliert wurden als Maß benutzt, sondern den Gesamtnutzen der 
deutschen Wikipedia berechnet. Das könnte in etwas so funktionieren:

Dazu müsste man eine Art Nutzenfunktion einführen, die den "Nutzen" eines 
Artikels in abh. von der Anzahl der Edits beschreibt. Den Begriff Nutzen 
verwende ich nur, da das Konzept gewisse Ähnlichkeiten mit dem Nutzen von 
Güterbündeln in der Mikroökonomie hat. Die Nutzenfkt. wird vermutlich anfangs 
konkav sein und für sehr große #Edits nahezu konstant bleiben,

z.B. u(e) = log( alpha * e )

wobei u=Nutzenfkt., e=Anz. edits, alpha=const. die experimentell zu bestimmen 
ist, aber für viele Aussagen auch unerheblich wäre.

Dann wäre noch zu berücksichtigen, dass Artikel eine unterschiedliche 
Wichtigkeit in der Wahrnehmung nach außen haben: ein Artikel über "Schröder" 
wird wahrscheinlich mehr Beachtung finden, als einer über "Faulturm". 
Unterstellt man eine gewisse Korrelation zwischen Wichtigkeit eines Artikels 
und der Anzahl der Edits und eine log Verteilung der Wichtigkeit an so ließe 
sich dann der Gesamtnutzen berechnen. FWIW.

Viele Grüße,
  Marco



-- 
Marco Krohn
Theoretical Physics 
University of Hannover