AW: AW: [Wikide-l] Kategorisierungsorgie

Stefan Kühn kuehns at uni-trier.de
Mi Dez 1 09:23:49 UTC 2004


> Stefan Kühn <kuehns at uni-trier.de> schrieb am Tue, 30 Nov 2004 15:11:45
> +0100:
> 
> > Wie sieht es den in der gesamten Wikipedia aus? Haben wir schon 60%
> > kategorisiert oder sind wir noch nicht so weit?
> 
> Beim Datenbankdump vom 26.11. kommen wir auf eine Quote von 71%.
> 
> > Wäre interessant, wie die Verteilung der Artikel in den Kategorien +
> > Unterkategorien aussieht. Also sind 25% der Artikel in der Oberkategorie
> > Informatik einsortiert?
> 
> Das versteh ich nicht... was genau meinst du?
> 
> MfG
> Christian Thiele
> (Benutzer:APPER)

Bei heute 171794 Artikeln wären 71% schon 121973 kategorisierte Artikel!
Nicht schlecht. Warten also noch 49820 auf ihre Kategorisierung. Ich freue
mich schon auf den Tag, an dem nur noch neue Artikel bei der Spezialseite
der nicht kategorisierten Artikel auftauchen. 

Mit der Verteilung meine ich folgendes. 25181 kategorisierte Personenartikel
von allen 121973 kategorisierten Artikeln bedeutet einen Anteil von 20%. Man
kann also vermuten, dass zu 20 Prozent die gesamte Wikipedia mit
Personenbiografien gefüllt ist. Jetzt würde mich interessieren wie hoch der
Anteil der Informatikartikel oder der Juraartikel oder der Ortsartikel an
der gesamten Wikipedia ist. Dazu müsste man z.B. die Kategorie:Informatik
und alle ihre Unterkategorien mal auszählen und könnte so eine auf den
Gesamtanteil schließen.

Stefan