[Wikipl-l] Jeszcze o kategoriach

Tomasz Wegrzanowski taw w users.sf.net
Sob, 24 Lip 2004, 16:29:55 UTC


On Fri, Jul 16, 2004 at 10:02:54PM +0000, Andrzejgo wrote:
> Dyskusja swiadczy o kryzysie w poslugiwaniu sie kategoriami, co mozna bylo
> przewiedziec - w prawie kazdym projekcie nastepuje taki moment, ze kategorie sa
> tak liczne, iz zwolna zaczynaja zastepowac hasla. Tym bardziej sprawa staje sie
> dokuczliwa, im gorszy mechanizm wyszukiwania pelnotekstowego, bo to sklania
> ludzi do mnozenia kategorii. (Wybaczcie ten z lekka mentorski ton, takie juz mam
> belferskie nawyki :( )

Kategorii jest na razie za malo, nie za duzo.
Spora czesc Wikipedii jest niepokategoryzowana, lub pokategoryzowana zbyt
ogolnymi kategoriami.

Szacujac nastepujace wspolczynniki:
Ilosc artykulow				35 tysiecy
Sredni rozmiar "porzadnej" kategorii	50 (wiekszosc sensownych kategorii oscyluje wokol tej liczby)
Srednia ilosc kategorii na artykul	1.2 (sporo artykulow powinno byc w wiecej niz jednej)

Otrzymujemy:
Optymalna ilosc kategorii		840 (35k * 1.2 / 50)

Do tego jeszcze pewna ilosc kategorii organizacyjnych, ktore nie zawieraja
artykulow a jedynie podkategorie, i kategorii robionych "na wyrost", zawierajacych
na razie ilosc artykulow w okolicach 10, ale ktorych nie wypada usunac bo
maja dobre prognozy rozwoju, i otrzymamy liczbe rzedu 1000-1200.



Więcej informacji o liście dyskusyjnej WikiPL-l