[Wikide-l] Statistik, Qualität, Vandalismus

Dirk Ingo Franke dirk at png-online.de
Mi Dez 15 11:20:37 UTC 2004


Ulis Vandalismus-Experiment hat mich auf eine Idee gebracht, die zugegebenermaßen noch recht unausgereift ist. Aber wäre es nicht möglich, Artikelqualität und ihre Veränderung statistisch zu erfassen? Gerade wenn wir das über einen längeren Zeitlauf versuchen, könnten wir sowohl rauskriegen wie sich die Qualität über die Zeit verändert und auch wo besondere Schwachpunkte liegen.

Ein wichtiges Problem dabei dürfte sein, wie man eine halbwegs repräsentative Aussage mit vertretbarem Aufwand generiert, aber ich denke es gibt ein paar Möglichkeiten.

Als Gedankenanregungen:

Semi-Formale-Kriterien:
*Wikilinks - Wie viele Links einer Zufallsstichprobe erreichen tatsächlich ihr Ziel und landen nicht auf einer Begriffsklärungsseite oder einer Seite, die gar nichts mit dem gewünschten Thema zu tun hat?
*Bildrechte - Wieviele Bilder einer Zufallsstichprobe sind tatsächlich urheberrechtlich vollkommen einwandfrei?
*Text - Wieviel Prozent einer Artikel-Zufallsstichprobe haben signifikant mehr Text (vielleicht das zwei oder dreifach an Zeichen) als Gestaltungselemente aller Art?

Inhaltliche Kriterien:
*Fakten überprüfen: In wieviel Prozent einer Artikel-Zufallsstichprobe ist der zweite Satz im dritten Absatz faktisch korrekt?
*Das Vandalen-Experiment. Halte ich prinzipiell ethisch für vertretbar aber mit Vorsicht. Weder sollten 20 Wikipedianer auf einmal damit loslegen, noch sollte ein Präzedenzfall für Außenstehende geschaffen werden.

Bewertung:
Das ist der Bereich indem es sehr subjektiv werden kann, die einzige Möglichkeit hier eine verwertbare Aussage zu generieren?

*Neutralität: wieviel Prozent einer Artikel-Zufallsstichprobe sind tatsächlich neutral?
*Definition: wieviel Prozent einer Artikel-Zufallsstichprobe bieten eine Definition, die sowohl vorhanden als auch richtig und auch noch umfassend ist?
*Bewertung: nach Schulnoten/Punkten/etc.

Bei allen Punkten könnte man natürlich auch noch einen Abgleich mit einer älteren Version desselben Artikels durchführen. Neben einer Zufallsstichprobe könnte man auch noch eine Liste "besonders wichtiger" Artikel definieren, bei denen solche Stichproben regelmäßig gemacht werden - sei es, dass es einfach die Artikel sind, die besonders oft angesehen werden, sei es dass ein wie auch immer geartetes "Expertengremium" die 100 grundlegenden Begriffe des Allgemeinwissens definiert.

Dirk/southpark