[Wikide-l] Re: Wikipedia als HTML-Version?

Jakob Voss jakob.voss at nichtich.de
Do Okt 6 20:04:34 UTC 2005


Marco S. schrieb:

> Kann man mithilfe von Perl/PHP/VB.NET/VC sich einen solchen Konverter
> basteln? Sowas juckt mich auch schon seit langem...
> 
> PS: Wenn die WM-Sources nicht so unstrukturiert wären, könnte ich die Parser
> rausholen(mithilfe meines Apache/XAMPP)

Ohne MediaWiki wird es dank der vielen Extras und Besonderheiten des 
Wikitext-Codes wohl schwierig werden. Das Aufsplitten des XML-dumps in 
einzelne Dateien (Tip: als Dateiname wegen Sonderzeichen die interne ID 
und nicht den Titel verwenden, siehe auch [1]) ist noch trivial aber 
schon das Ersetzen aller Vorlagen ist ein Akt. Ist aber möglich und 
würde mich auch sehr interessieren. Es gibt übrigens schon mehrere 
Versuche eines Parsers für Wikitext. Die Dateinamen der Bilder lassen 
sich übrigens aus ihrem Namen berechnen.

Gruß,
Jakob

[1] 
http://meta.wikimedia.org/wiki/User:Nichtich/Process_MediaWiki_XML_export