[Wikide-l] URV und Buchfotografieren

Lars Aronsson lars at aronsson.se
Sa Feb 19 19:14:56 UTC 2005


David Daester schrieb:

> Hergestellt heisst hier wohl vermutlich: Engescannt, OCR, und ein
> "bischen" Formatiert. Obwohl das "bischen" sehr schnell viel wird.
> 
> Aufwand für die Digitaliserung war sicher vorhanden, aber dürfte
> man den Text daraus selber Abschreiben? (Nene, nicht Copy+Paste)

Bei der ADB (Allgemeine Deutsche Biographie) und der BSB (Bayerische
Staatsbibliothek) gab es noch kein Aufwand für OCR.  Genau das ist
das Problem.  Ich möchte gern einen OCR-Text erzeugen, aber dann
brauche ich die hoch aufgelöste Bilder die BSB eingescannt hat.  An
diese kann ich aber nicht zugreiffen.  BSB veröffentlicht nur Bilder
in niedriger Auflösung, die für OCR unbrauchbar sind.  Und selbst
stellt BSB kein OCR-Text dar.  Nur gucken, nicht suchen!

Die Lösung ist vermutlich das ganze Werk noch einmal einzuscannen...


--
  Lars Aronsson (lars at aronsson.se)
  Projekt Runeberg - freie nordische Literatur - http://runeberg.org/