Re: [Wikide-l] Wie verarbeitet man die neue XML-Datei?

elwp at gmx.de elwp at gmx.de
Fr Aug 5 17:21:02 UTC 2005


Daniel Herding:
> elwp at gmx.de wrote:
> > Werden denn da auch & , < und > in den Textblöcken ersetzt?
> 
> Das fehlte noch, habe ich aber vor ein paar Stunden nachgetragen. " 
> hast du noch vergessen, dann ist es hoffentlich vollständig.

Aha, " habe ich vergessen, & hast du vergessen und '
ist im Prinzip auch möglich [1], allerdings kommt das im Dump z.Z.
nicht vor.

Was ich zur angeblich schnelleren C-Funktion für die Ersetzungen
geschrieben habe, bitte wieder vergessen. Ich hatte mit Perl eine
suboptimale Alles-in-einem-Rutsch-Ersetzung verwendet. Wenn man
es nacheinander macht, ist es mit Perl genauso schnell wie mit C:

$text =~ s/&lt;/</sg;
$text =~ s/&gt;/>/sg;
$text =~ s/&apos;/'/sg;
$text =~ s/&quot;/"/sg;
$text =~ s/&amp;/&/sg;

So kann Perl offenbar besser optimieren.

[1] http://www.w3schools.com/xml/xml_cdata.asp

-- 
5 GB Mailbox, 50 FreeSMS http://www.gmx.net/de/go/promail
+++ GMX - die erste Adresse für Mail, Message, More +++