[Wikide-l] Re: Unicode oder nicht?

Christian Thiele APPER at apper.de
Fr Jun 24 15:32:24 UTC 2005


Jakob Voss <jakob.voss at nichtich.de> schrieb am Thu, 23 Jun 2005 22:47:55  
+0200:

> Kannst du einbauen, dass man Spezialseite ausblenden kann? Es wäre  
> interessant, nur die am häufigsten bearbeiteten  
> Artikel/Diskussionsseiten zu bekommen, da kann man sofort sehen, wo  
> grade was los ist (z.B. heute bei [[Orte aus Star Wars]],  
> [[Diskussion:Jürgen Rüttgers]], [[Wolfgang Beinert]] und  
> [[Linksfaschismus]]).

So, will ich mich mal melden ;). Ich sammle (derzeit nichtöffentlich)  
Bearbeitungszahlen wie aka auch. Ich speichere die Daten aber  
stundenweise. Ich kann also für einzelne Artikel und natürlich auch alle  
zusammen für jede Stunde sagen, wieviele Edits es gab. Leider weiß ich  
noch nicht ansatzweise, wie ich diese Datenflut langfristig halten kann,  
daher habe ich noch kaum Tools für die Auswertung gebastelt. Das ist  
sicher auch der Grund, wieso aka nur die letzten 24 Stunden speichert ;).

Möglich ist aber z.B. eine grafische Anzeige, wie unter  
http://www.apper.de/wikipedia/wpstats.png.

Auch die Byte-Änderungen werden entsprechend gespeichert/aufaddiert.  
Ansatzweise ist das interessant, beispielsweise kamen gestern (23. Juni)  
4.102.761 Bytes zu Wikipedia-Seiten hinzu, davon 1.944.947 Bytes zu  
Artikeln. Über die Hälfte von allem, was geschrieben wurde, war also auf  
Diskussions/Benutzer/Wikipedia-Seiten. Dazu muss noch ergänzt werden, dass  
gelöschte Artikel nicht berechnet werden, die Zahl also nochmals kleiner  
ausfällt.

Für einzelne Artikel ist es natürlich nicht sooo gut geeignet, da man in  
diesem Fall lieber direkt die Daten aus der Wikipedia holen sollte, aber  
für "Hitlisten" ist das schon brauchbar.

Für gestern (23. Juni) ergibt sich ein ähnliches Bild, wie es sich in akas  
Tool für die letzten 24h auch ergibt.

  1. Wikipedia:Löschkandidaten/23. Juni 2005 (480 Edits)
  2. Wikipedia:Spielwiese (147 Edits)
  3. Wikipedia:Löschkandidaten/22. Juni 2005 (146 Edits)
  4. Diskussion:Jürgen Rüttgers (97 Edits)
  5. Wikipedia:Löschkandidaten/21. Juni 2005 (77 Edits)
  6. Wikipedia:Fragen zur Wikipedia (76 Edits)
  7. Orte aus Star Wars (61 Edits)
  8. Wikipedia:Kandidaten für exzellente Artikel (51 Edits)
  9. Wikipedia:Vandalensperrung (46 Edits)
10. Benutzer:Factumquintus/Asyl (36 Edits)

Interessant ist aber auch, dass es bei den Größenänderungen ein wenig  
anders aussieht. Beispielsweise ist die Größenänderung des Artikels "Orte  
aus Star Wars" (61 Edits) runde 0 Byte, da die 61 Edits rückgängig gemacht  
wurden und im Übrigen inzwischen auch gelöscht sind.

Leider sieht man da auch, was solche Statistiken kurzfristig unnutzbar  
macht: Von den 4 MB Zuwachs insgesamt entfällt ein halbes MB auf einen  
Vandalismus auf einer Diskussionsseite, der erst am 24. rückgängig gemacht  
wurde ([[Diskussion:Hans-Hermann Hoppe]]). Ansonsten finden sich die  
ähnlichen Diskussionsseiten wieder und als Artikel bspw. [[Antike]] (1  
Edit; 37.644 Byte) und [[U-Bahnlinie 1 (Berlin)]] (1 Edit; 22.335 Byte).

Soviel zur Statistik von mir ;)

MfG
Christian Thiele