[Wikide-l] Bots und die Performance

Oliver Hankeln oliver at hankeln-online.de
Do Dez 2 13:49:22 UTC 2004


Stefan Kühn schrieb:

>Das wäre auch jetzt schon möglich, da die Bot ja als Benutzer der Wikipedia
>bekannt sind. Ihre Änderungen werden z.B. deshalb ja nicht mehr in der Liste
>der letzten Änderungen aufgenommen.

Das war mir nicht bekannt.

>Ist das nötig? Nehmen wir mal an 5 Bots arbeiten gleichzeitig an der
>Wikipedia. Jeder von ihnen arbeitet vielleicht fünfmal so schnell wie ein
>menschlicher User. Heiß also sie simulieren 25 Nutzer.

Ich habe keinen eigenen Bot am laufen, aber ein Programm sollte doch
maximal 200ms für ne Änderung brauchen (+ Wikipedia Wartezeit natürlich)
und das ist eher 50 mal schneller als 5 mal schneller.

>Meine Frage ist dann: Würden 25 Nutzer weniger irgendeinen Effekt
>hinsichtlich der Performance der Wikipedia an einem solchen Tag mit
>schlechter Erreichbarkeit bringen?

Die Frage kann ich nicht qualifiziert beantworten, aber ich würde es nicht
von vornherein ausschliessen.

>Zum Vergleich: Im Oktober waren täglich 126.000 User bei der deutschen
>Wikipedia, bei einer angenommenen Gleichverteilung sind das 5250 User pro
>Stunde (Tag-Nacht-Rhythmus außen vor gelassen). Ich bin der Meinung, dass
>da
>die paar Änderungen nicht so stark ins Gewicht fallen.

Naja, wenn Du dich meiner Auffassung mit 50 mal schneller anschliessen
kannst sind das  250 Benutzer. Änderungen brauchen auch wesentlich länger
als Lesen (Du Profitierst nicht von Chaches, Die Datenbank muß locken,
Indizes müssen korrigiert werden...) ich hab bei meinen Datenbanken oft
ca.
das 3 fache. Wenn es stimmt, daß nur ein vernachlässigbarer Teil der
Nutzer auch ändert, dann vernachlässige ich den mal und komme auf 750
Nutzerlasten durch 5 Bots. Das sind ca. 15% Zusatzlast und das fände ich
relevant (Besonders wenn man bedenkt, daß Performance sich schlechter als
linear mit steigender Last verhält).
Aber das sind alles Schätzungen, kann sein, daß ich ganz weit daneben
liege, aber mein Gefühl sagt mir eigentlich, daß das in etwa hinkommt.

Aber bezüglich Tag-Nacht-Rhytmus: Auf jeden Fall könnte man Bots ja auf
die Zeit 4:00 - 6:00 (oder so) beschränken um nicht in den Lastspitzen
zusätzliche Last zu produzieren. Da Bots nicht schlafen sollte das ja kein
Problem sein ;-)

Oliver Hankeln