[Wikide-l] Re: Konvertierung auf Unicode

Tilman Berger tilman_berger at web.de
Sa Apr 24 14:10:32 UTC 2004


Karl Eichwalder wrote:

 >> Ich meine, dass man hier einen Unterschied zwischen Sprachen machen
 >> sollte, die sich der Lateinschrift bedienen, und solchen, für die das
 >> nicht gilt. Klar, statt oder neben Чехов kann ruhig die übliche deutsche
 >> Umschrift "Tschechow" stehen, und auf die sog. wissenschaftliche
 >> Transliteration "Čechov" kann man vielleicht ganz verzichten,
 >
 >
 >
 > "Čehov" müßte es heißen, wenn ich das system richtig verstanden habe.
 > ich würde nicht darauf verzichten, weil früher oder später jemand diese
 > variante sowieso einfügen wird und weil selbstverständlich auch
 > wissenschaftler den artikel finden sollten.


Nach dem in der deutschen Slavistik und den meisten deutschen 
Bibliotheken üblichen System heißt er "Čechov", es gibt aber auch 
Systeme, wo er "Čehov" geschrieben wird. In die deutsche Wikipedia 
gehört daher eher "Čechov".

 >
 >
 >> wenn man die kyrillische Originalschreibung anführt. Aber wenn man aus
 >> "Lech Wałęsa" "Lech Walesa" macht oder aus "České Budějovice" "Ceske
 >> Budejovice",
 >
 >
 >
 > es war ja meinerseits auch nicht die rede davon, einfach der 8. bit
 > wegzuwerfen (leider wird das in der WP wohl des öfteren so gehandhabt
 > ).  es gibt bestimmt auch für polnisch und tschechisch diese
 > regeln, die eine möglichst genaue abbildung mit ASCII (oder ISO-8859-1)
 > erlauben.  meinen namen schreiben die amerikaner zwar "richtig", aber
 > die aussprache ist ihnen nicht so ohne weiteres klar.  ich würde es
 > durchaus akzeptieren, wenn sie meinen namen anders schrieben.


Solche Regeln gibt es nicht, höchstens als Privatkonvention von 
irgendwelchen Leuten.

 >> Im Übrigen braucht man für die Zusatzzeichen zur Lateinschrift nicht
 >> einmal Unicode.
 >
 >
 >
 > wie meinen?  "Wałęsa" ist mit iso-8859-1 nicht angedeckt.  es bleibt
 > also nur, ein dateiformat wie HTML zunehmen und entities zu verwenden
 > oder eine dateikodierung, bei der man mehrere encodings mischen kann
 > (emacs-mule, iso 2022: http://en.wikipedia.org/wiki/ISO_2022 ).  ich
 > glaube aber kaum, daß wir encodings mischen wollen und wir wollen
 > bestimmt auch nicht ein paar artikel in iso-8859-2 und den rest in
 > iso-8859-1 haben wollen.  also brauchen wir Unicode und als kodierung
 > UTF-8.


Mit "iso-8859-1" ist es nicht abgedeckt, da braucht man schon 
"iso-8859-2" (was bei Mozilla übrigens als Central European beeichnet 
wird). Aber wenn die ganze Enzyklopädie in "iso-8859-1" wäre, fände ich 
das eh nicht toll. Gegen die Unicode-Version habe ich im Übrigen auch 
nichts, da ginge ja alles das, was ich für sinnvoll halte (und noch 
einiges mehr...).

Gruß

Tilman


-- 
Tilman Berger
Slavisches Seminar
Universitaet Tuebingen
Wilhelmstr. 50
D-72074 Tuebingen

Tel. +7071/2976733 - +160/99129805
Fax: +7071/295924
e-mail: tberger at uni-tuebingen.de
Homepage: http://homepages.uni-tuebingen.de/tilman.berger