[EasyLinux-Ubuntu] xsane und OCR [erledigt]

Heinz-Stefan Neumeyer hsn.debian_user at gmx.net
Fr Okt 7 12:01:01 CEST 2011


Am Freitag, den 07.10.2011, 00:55 +0200 schrieb Alfred Zahlten:

Mahlzeit Alfred

eigentlich wollte ich mich zu diesem Thema nicht noch mal äußern, mache
es aber trotzdem:

> Dann hast du noch nicht viel probiert, hier eine kleine Auswahl.
> http://wiki.ubuntuusers.de/Texterkennung_%28OCR%29
> 
Hast Du das wirklich richtige gelesen? Eher wohl nicht!

Von den dort genannten 12 OCR-Anwendungen sind allein 6 lediglich
graphische Backends (Aufsätze) für/auf andere Programme - teilweise
solche, die im Konzept nur auf der Shell funktionieren.

Es bleibt an "echten" OCR-Anwendnungen eigentlich nur drei (vier) übrig:

tesseract
Wird offenbar seit Jahren nicht mehr von den Entwicklern angefaßt. Die
letzte offiziell veröffentlichte Version nennt wohl *buntu 6.06/6.10 als
Basis.
Ich habe es nicht probiert, aber eine Installation auf einem
einigermaßen aktuellen System wird vermutlich schon daran scheitern, daß
die erforderlichen (alten) Bibliotheken nicht mehr da sind?

cuneiform
Ist IMHO proprietär und die Installation/Einrichtung kann nur über eine
Installation an der Paketverwaltung vorbei gemacht werden - also
per ./configure/make/make install. Dazu müssen vorher ein ganzer Packen
Abhängigkeiten aufgelöst und die einzelnen Programmkomponenten in der
richtigen Reihenfolge compiliert und installiert werden.
Alleine das (und sicher auch die Sprachprobleme) werden Dich wohl davon
abhalten. Ich habe das vor 2 oder 3 Jahren (nach einer ziemlich
euphorischen Besprechung in einer Linux-Publikation) mal versucht und es
aufgegeben, weil mir das einfach zu viel Fummelkram war.

orcad/gocr
und ihre graphischen Benutzeroberflächen sind Bestandteil jeder
Distribution, aber ich würde das allenfalls als ein Zeitvertreib
betrachten. Denn der Aufwand der mit der Einrichtung und vor allem dem
"Training" betrieben werden muß, übersteigt für meinen Geschmack
eindeutig den Nutzen.


Alles andere, was dort aufgeführt wird, finde ich weder in den
Repositories der gängigen Distributionen noch macht mir ein Blick auf
die jeweilige Projektseite Mut - was soll ich z.B. mit "vietnamesisch"?
Ich spreche nur meine Sprache und damit habe ich mitunter schon
Probleme! ;-)


Komme also bitte wieder auf den Boden der Realität - und der ist, daß es
unter Linux mit in der täglichen Praxis wirklich brauchbarer
OCR-Software nach wie vor schlecht bestellt und eine wirkliche Besserung
eher nicht absehbar ist.


Und jetzt ist für mich endgültig EOT

-- 
Gruß Stefan

Der Begriff "Handy" stammt offensichtlich aus dem Süddeutschen:
Als ein Schwabe zum ersten mal dieses Telefon sah, fragte er: "...hen
die kei Schnur??..."
Irgend jemand hat das da wohl aufgeschnappt und verdenglischt...
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : nicht verfügbar
Dateityp    : application/pgp-signature
Dateigröße  : 836 bytes
Beschreibung: This is a digitally signed message part
URL         : <http://www.easylinux.de/pipermail/ubuntu/attachments/20111007/e4c64076/attachment.pgp>


Mehr Informationen über die Mailingliste Ubuntu