gui für tesseract (OCR)

Dieses Forum ist für Fragen zu Paketbau und Übersetzung vorgesehen :

Diese Bereiche sind für die Erstellung der Mageia Distribution essentiell.

Poste hier alle Fragen und Informationen zu den bereichen Paketbau und Übersetzungen: Feedbacks, Diskussionen über Regeln, Paketbaupraktiken, usw.

gui für tesseract (OCR)

Beitragvon diroan » Jan 17th, '12, 21:19

Hallo

Im LinuxUser 05/2011 wird (neben anderen gui's) das OCR Programm tesseract-gui vorgestellt.

Damit konnte man (anders als per Kommandozeile) auch Teilbereiche eines Textes markieren. Außerdem kann man recht einfach die gewünschte Sprache wählen und es gibt die Möglichkeit, die Vorlage zu drehen oder den Kontrast zu ändern.

Allerdings scheint es nur den Sourcecode bzw. ein deb-Paket zu geben.
http://sourceforge.net/projects/tesseract-gui/

Erik Bärwaldt geht in seinen LU-Artikel folgendermaßen vor:
- Umwandeln des Debian-Pakets in ein rpm mittels alien
- läßt sich dann problemlos installieren
- da die Sprachmodule noch am falschen Platz sind, extra kopieren bzw. Link setzen

Das ist recht umständlich. Bei Mandriva 2010 hat es geklappt, bei Mageia habe ich es nicht hinbekommen.

Kann jemand von den Paketpackern mal probieren, ein "richtiges" Mageia rpm zu erstellen ?
diroan
 
Beiträge: 17
Registriert: Okt 9th, '11, 19:51

Re: gui für tesseract (OCR)

Beitragvon doktor5000 » Jan 17th, '12, 21:46

Bin gerade beim Tesseract-Update für Cauldron, schaue es mir definitv an, danke für den Hinweis :)
Tarballs sind übrigens ganz normal vorhanden: http://sourceforge.net/projects/tessera ... act-gui-2/
Ich bin nicht böse, sondern nur ehrlich. Und wer lesen kann, ist klar im Vorteil.
----
Mageia - the magic continues
Benutzeravatar
doktor5000
 
Beiträge: 6062
Registriert: Jun 2nd, '11, 09:39

Re: gui für tesseract (OCR)

Beitragvon jkowalzik » Jan 18th, '12, 22:40

Hallo!
Geht es denn wenigstens hier mit der Entwicklung voran, nachdem cuneiform ja wieder "eingefangen" wurde :?
Gruß
J.

PS: sollte das nicht
YAGF - graphical front-end for cuneiform and tesseract
leisten :?
...Luxus ist alles was sich reparieren läßt
Benutzeravatar
jkowalzik
 
Beiträge: 3342
Registriert: Okt 2nd, '11, 12:34
Wohnort: Plettenberg

Re: gui für tesseract (OCR)

Beitragvon doktor5000 » Jan 18th, '12, 23:04

Stimmt, yagf kann auch tesseract. Werde ich mir auch anschauen. Kann mir jemand mal auf die Schnelle paar Schwarzweißscans hier als Anhang hochladen, zum Testen?

EDIT: Nebenbei bemerkt:
http://sourceforge.net/projects/tesseract-gui/ hat geschrieben:Tessract-GUI is not a front-end for tesseract-ocr. It is just a graphical way to use it with simple image manipulation thru ImageMagick.
Ich bin nicht böse, sondern nur ehrlich. Und wer lesen kann, ist klar im Vorteil.
----
Mageia - the magic continues
Benutzeravatar
doktor5000
 
Beiträge: 6062
Registriert: Jun 2nd, '11, 09:39

Re: gui für tesseract (OCR)

Beitragvon jkowalzik » Jan 19th, '12, 15:31

doktor5000 hat geschrieben:Kann mir jemand mal auf die Schnelle paar Schwarzweißscans hier als Anhang hochladen, zum Testen?


Hallo!
Kommt!
Broschuere.png

Fotokopie.png

Zeitschrift.png

Gruß
J.
...Luxus ist alles was sich reparieren läßt
Benutzeravatar
jkowalzik
 
Beiträge: 3342
Registriert: Okt 2nd, '11, 12:34
Wohnort: Plettenberg

Re: gui für tesseract (OCR)

Beitragvon jkowalzik » Jan 19th, '12, 15:33

doktor5000 hat geschrieben:Schnelle paar Schwarzweißscans


....und noch eines:
Zeitung.png


Hoffe geholfen zu haben
J.
...Luxus ist alles was sich reparieren läßt
Benutzeravatar
jkowalzik
 
Beiträge: 3342
Registriert: Okt 2nd, '11, 12:34
Wohnort: Plettenberg

Re: gui für tesseract (OCR)

Beitragvon doktor5000 » Jan 19th, '12, 15:39

Jo, danke reicht erstmal, wanne hat mir auch schon welche zugesandt.
Da hab ich Futter fürs Wochenende, zwei OCR-Lösungen (cuneiform und tesseract)
sowie 4 GUIs zum Testen (yagf, tesseract-gui, kbookocr und gimagereader)
Ich bin nicht böse, sondern nur ehrlich. Und wer lesen kann, ist klar im Vorteil.
----
Mageia - the magic continues
Benutzeravatar
doktor5000
 
Beiträge: 6062
Registriert: Jun 2nd, '11, 09:39

Re: gui für tesseract (OCR)

Beitragvon wanne » Jan 19th, '12, 21:03

Im übrigen hatte ich mal gorc über meine Scans laufen lassen. Das Ergebnis war mit den Graustufen-Scans erheblich besser als mit den sw-Scans. Allerdings war bei allem die Erkennungsrate grauenhaft (90% gegen 10% oder so) Da Tippe ich erheblich schneller ab.
a1d0c6e83f027327d8461063f4ac58a6
wanne
 
Beiträge: 985
Registriert: Jun 1st, '11, 16:54
Wohnort: Südwest-Deutschland

Re: gui für tesseract (OCR)

Beitragvon doktor5000 » Jan 24th, '12, 12:34

jkowalzik hat geschrieben:
doktor5000 hat geschrieben:Kann mir jemand mal auf die Schnelle paar Schwarzweißscans hier als Anhang hochladen, zum Testen?

Broschuere.png



Kurzer Zwischenstand, bin am Wochenende wegen eines Unfalls in der Familie nicht dazu gekommen.
Hier mal ein kurzer Test mit kbookocr 2.1, welches cuneiform 1.1 nutzt:
Deutsches
Rotes

Kreuz

DRK-Kreisverband Olpe e. V.

Helfer vor Ort sind zu empfehlen, wenn der zuständige Rettungswagen von der Wache bis zu der Einsatzstelle regelmäßige Fahrzeiten hat, die 5 Minuten überschreiten und in dem örtlichen Bereich eine ausreichende Anzahl von qualifizierten Rettungskräften zur Verfügung stehen. Die Helfer vor Ort werden alarmiert, wenn in ihrem Einzugsbereich ein Notarzteinsatz erforderlich ist und zum Zeitpunkt des Notrufs kein Arzt bei dem Patienten ist.

Im DRK Kreisverband Olpe e. V. haben die Bereitschaften Attendorn, Drolshagen, Finnentrop, Kirchhundem, Lennestadt, Olpe und Wenden seit dem Jahr 2005 Helfer vor Ort im Einsatz. Im Durchschnitt werden die Helferinnen und Helfer zu 80 Einsätzen pro Monat durch die Leitstelle des Kreises gerufen. Davon werden ca. 60 Einsätze durch das Deutsche Rote Kreuz im Kreisverband wahrgenommen.

Die Leistungen der „Helfer vor Ort" sind für die Bürgerinnen und Bürger sowie die Krankenkassen kostenlos. Wir werden in den kommenden Monaten versuchen das Helfer vor Ort-System weiter auszubauen und zu verfeinern, sodass wir in allen Ortschaften und Dörfern des Kreises als Unterstützung des Rettungsdienstes tätig werden können.

Seit Mai 2004 unterstützen die ehrenamtlichen Kräfte des DRK den Rettungsdienst. Die Aufgabe der „Helfer vor Ort" ist es, qualifizierte Erste Hilfe zu leisten, um das therapiefreie Intervall bis zum Eintreffen des regulären Rettungsdienstes zu verkürzen. Jeder Helfer vor Ort ist mit einem DRK-Rettungsrucksack mit verschiedenen medizinischen Geräten ausgestattet, sodass Basismaßnahmen der Hilfeleistung vorgenommen werden können. Außerdem geben die Helfer vor Ort nach dem Eintreffen am Einsatzort umgehend eine Lagemeldung an die integrierte Leitstelle Olpe. Bei Bedarf weisen sie Rettungswagen, Rettungshubschrauber oder Notarzt zur Einsatzstelle ein. Durch die kurzen Entfernungen zu den Einsatzstellen und gute Ortskenntnisse sind die Helfer vor Ort schnell am Ort des Geschehens.


Die Datei wurde ohne Nachbearbeitug in kbookocr geladen, und dann als HTML-Datei gespeichert. Layout wurde nicht übernommen.
Aber von der Erkennung ist es schonmal sehr gut, finde ich.
Ich bin nicht böse, sondern nur ehrlich. Und wer lesen kann, ist klar im Vorteil.
----
Mageia - the magic continues
Benutzeravatar
doktor5000
 
Beiträge: 6062
Registriert: Jun 2nd, '11, 09:39

Re: gui für tesseract (OCR)

Beitragvon jkowalzik » Jan 24th, '12, 14:15

Hallo!
Das Ergebnis ist überzeugend, vor allem für mein "Tagesgeschäft", da lohnt es sich nicht was anderes (BS) zu starten um eine Seite Brief, Mitteilung usw.per OCR zu behandeln. Andererseits ist es einfach zu nervig eine Schreibmaschinenseite einfach abzutippen um sie dann weiter zu verarbeiten.
Gruß
J.
...Luxus ist alles was sich reparieren läßt
Benutzeravatar
jkowalzik
 
Beiträge: 3342
Registriert: Okt 2nd, '11, 12:34
Wohnort: Plettenberg

Re: gui für tesseract (OCR)

Beitragvon doktor5000 » Jan 24th, '12, 15:15

Also wie gesagt, teste gerade mehrere Lösungen durch (tesseract-gui / yagf / gimagereader / kbookocr / gocr / ocrad / rubuquetp)
wobei yagf und kbookocr bisher am besten abschneiden, was die Bedienung und die Funktionen angeht. yagf punktet mit intgegrierter
Rechtschreibkontrolle, kbookocr mit einfacherer/intuitiver Bedienung. tesseract-gui ist auf den ersten Blick recht gruselig, ermöglicht
aber integrierte Bild-Nachbearbeitung mittels ImageMagick.

Bei Bedarf kann ich ich zu Testzwecken meine Pakete für Mageia 1 hier anhängen.
Ich bin nicht böse, sondern nur ehrlich. Und wer lesen kann, ist klar im Vorteil.
----
Mageia - the magic continues
Benutzeravatar
doktor5000
 
Beiträge: 6062
Registriert: Jun 2nd, '11, 09:39

Re: gui für tesseract (OCR)

Beitragvon diroan » Jan 25th, '12, 21:32

Also wie gesagt, teste gerade mehrere Lösungen durch


Vielen Dank schon mal für deine Mühe !
diroan
 
Beiträge: 17
Registriert: Okt 9th, '11, 19:51

Re: gui für tesseract (OCR)

Beitragvon carlo » Jun 28th, '13, 16:08

Hallo zusammen,

gibts was neues aus der OCR Welt? Ich hab die Kombi OCRFeeder / Tesseract ausprobiert.
Es scheint gut zu funktionieren...bis jetzt
Gruss, Carlo
______________________________________________
>> Words that do not match deeds are unimportant. (Ernesto Guevara)
Benutzeravatar
carlo
 
Beiträge: 152
Registriert: Sep 2nd, '11, 17:20
Wohnort: Osnabrück

Re: gui für tesseract (OCR)

Beitragvon doktor5000 » Jun 28th, '13, 20:52

Bestimmt hat sich was getan - schau mal auf das Datum der letzten Posts ...
Ich bin nicht böse, sondern nur ehrlich. Und wer lesen kann, ist klar im Vorteil.
----
Mageia - the magic continues
Benutzeravatar
doktor5000
 
Beiträge: 6062
Registriert: Jun 2nd, '11, 09:39

Re: gui für tesseract (OCR)

Beitragvon jkowalzik » Sep 16th, '13, 19:59

Hallo zusammen,

carlo hat geschrieben:gibts was neues aus der OCR Welt? Ich hab die Kombi OCRFeeder / Tesseract ausprobiert.
Es scheint gut zu funktionieren...bis jetzt


Ich habe es jetzt auch probiert, auf der Kommandozeile
Code: Alles auswählen
bash-4.2$ tesseract OV_130819_Protokoll.tif Protokoll -l deu
Tesseract Open Source OCR Engine with LibTiff
hervorragend.
Protokoll Vorstandssitzung vom 19. August 2013
DRK - Ortsverein in Attendorn e.V. Deutsches R0teS Kreuz
Vorstandssitzung
am Montag 19. August 2013
im DRK-Haus Attendorn;
Anwesenheit:
mal abgesehen von "ROteS"
aber OCRFeeder liefert nur leere Rahmen :? entsprechend dem Layout des Originals?
http://wiki.ubuntuusers.de/OCRFeeder ist eine schöne Beschreibung (Handbuch), aber...
Unterhalb ("Texteigenschaften") wird dann mit der "OCR"-Schaltfläche die Texterkennung gestartet;........... Der daraufhin erkannte Text wird unten angezeigt.

Da tut sich bei mir nix :twisted:
Gruß
J.
...Luxus ist alles was sich reparieren läßt
Benutzeravatar
jkowalzik
 
Beiträge: 3342
Registriert: Okt 2nd, '11, 12:34
Wohnort: Plettenberg


Zurück zu Paketbau und Übersetzung

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron