[Wikide-l] Re: Büchmanns Geflügelte Worte
Karl Eichwalder
ke at gnu.franken.de
Sa Okt 9 04:55:28 UTC 2004
Lars Aronsson <lars at aronsson.se> writes:
> Unter ./text/ liegen OCR-Text in 0001.txt bis 0798.txt kodiert in ISO
> 8859-1 (Latin-1). Diese Dateien haben keine Repräsentation für Kursiv
> oder Fettstil und auch nicht für grieschische Buchstaben.
Schade, aber es ist nicht so schlimm. Die PG-DP-Leute empfehlen, die
OCR-Ergebnisse als RTF zu speichern und dann mit einem Perl-Script
(gutprep.pl) für http://www.pgdp.net/ geeignete Umsetzungen vornehmen zu
lassen.
> Vielleicht kann jemand bessere OCR-Dateien herstellen?
Ich leider nicht.
> Auch korrekturlesen ist nötig. Vielleicht durch pgdp.net?
Im Laufe des Tages werde ich es unter der ID projectID4167509cc30d2
hochladen; es wird allerdings bestimmt noch 2-3 Monate dauern, bis es an
der Reihe ist. Ich werde auch einmal die Menschen der
Arno-Schmidt-Refbib ansprechen: http://www.gasl.org/refbib - Arno besaß
lt. Bibl.-Verz. wohl keinen Büchmann, aber für den AS-Forscher sollte
ein Büchmann durchaus hilfreich sein:
http://www.arno-schmidt-stiftung.de/zettel/archiv/BVZ_2003_09.zip
--
| ,__o
| _-\_<,
http://www.gnu.franken.de/ke/ | (*)/'(*)