[Wikide-l] WikiCharts

DaB. wp at daniel.baur4.info
Di Aug 1 13:22:45 UTC 2006


Hallo,
Am Dienstag, den 01.08.2006, 14:57 +0200 schrieb elwp at gmx.de:
> Olaf2:
> > Was WikiCharts leider nicht kann, ist die Beleuchtung des
> > Nutzungsverhaltens für die 200.000 wenigst gelesenen Artikel.
> 
> Das ist tatsächlich sehr schade. Es werden nicht genügend
> Zugriffe gezählt, momentan nur jeder 600te. Muss das so sein?
> 
> Die Hauptseite hat ca. 500.000 Zugriffe pro Tag und einen
> Anteil von ca. 10%. Das macht insgesamt 5.000.000 Seitenzugriffe
> pro Tag oder knapp 60 Zugriffe pro Sekunde. Wenn nur jeder
> 600te gezählt wird, ergibt das also durschnittlich einen
> Zugriff alle 10 Sekunden. In Spitzenzeiten vielleicht einen
> Zugriff pro Sekunde, vermutlich eher weniger.

Momentan wird circa alle 4 Sekunden ein Eintrag in die Accessdatei
geschrieben. Über kurz oder lang soll diese Datei in den RAM umziehen,
dann kann man die Wahrscheinlichkeit auch noch weiter senken (das
Problem bei dem Toolserver sind die Festplattenzugriffe). Um aber
realistisch zu sein: Wirklich jeden Zugriff werden wir nie loggen
können, vor allem, weil die Wikipedia ja auch ständig wägst (übrigends
haben andere Sprachen und Projekte auch schon interresse an dem Tool
angemeldet, die maximale Zugriffszahl muss also durch mehrere geteilt
werden).

> 
> Dass der Toolserver nicht mehr verkraftet ist wirklich
> armselig (und nebenbei gesagt keine gute Werbung für den
> Sponsor). Es liegt wohl daran, dass so viele Sachen gleichzeitig
> auf diesem Server gemacht werden, und sich die Prozesse dann in
> die Quere kommen (v.a. bei Plattenzugriffen).


Der Toolserver hat mom. über 50 User. Das ist jede Menge Holz, das
verwaltet werden will (und glaub mir, das IST Arbeit). Und jeder User
(und die Nutzer seiner Tools) hält seine Tools (das ist ganz normal) für
das Wichtigste, trotzdem muss man teilen. Oder möchtest du zum Beispiel
auf Duesentriebs Bildersuchtool (das ist heiß begehrt in commons)
verzichten?

> Wäre es dann nicht
> sinnvoller, für solche Aufgaben wie den Zugriffszähler einen
> eigenen kleinen Server zu verwenden, zumal für das Zählen
> eine Datenbankkopie überhaupt nicht notwendig ist?

Jo. Und du wirdst freudig überrascht sein: Diesen Server gibt es
bereits :). Zedler (das ist der Name des momentanen Toolservers) hat
nämlich schon vor einer Weile Gesellschaft von hemlock bekommen. Auf
diesem sollen die User untergebracht werden und zedler behält die
Datenbank.

Das Problem ist, dass unser Hauptadmin (river) seit einer Weile nicht
mehr aktiv ist und ich einfach noch eine Weile brauche (seit gestern
sehe ich z.B. den Bootbildschirm von hemlock).

> 

> So einen Server zu mieten halte ich für sinnvoller als zu kaufen.
> Erstens zieht sich das Kaufen, Installieren, Reklamieren usw.
> oft monatelang hin, und zweitens ist es wahrscheinlich sogar billiger.
> 300 bzw. 360 Euro pro Jahr könnte der Verein doch sicherlich aus der
> Portokasse bezahlen,

wie der Verein sein Geld ausgibt, ist natürlich seine Sache. Sollte ein
solcher Server angeschafft werden, würde ich mich natürlich für die
Betreuung zur Verfügung stellen).


>  v.a. wenn man das in Relation setzt zu dieser
> letztes Jahr für 11.000 Euro gekauften "zusätzlichen Hardware für
> den [...] Toolserver" [2]. (Was ist damit eigentlich gemeint? Wurde diese
> Hardware schon installiert und welchen Nutzen bringt sie?)

Das ist das Disk-Array für zedler. Dadurch wird das Problem mit den
Festplattenzugriffen bereinigt werden. Ja, es ist installiert, ist aber
wg. einer Hardwareinkompalität zur Zeit nicht in Betrieb. Ich habe schon
die Erlaubnis des Vorstandes hier im Notfall das billige Teil (die
SCSI-Karte) auszutauschen. Zieht sich aber noch bis mindestens nach der
Wikimania hin, unser Hardwaremensch ist nämlich dort.


Mit freundlichen Grüssen
DaB.
-- 
Blog: http://www.wp-blog.de | PGP: 2D3EE2D42B255885