|
|
|
|
| Zitat von legendary_hacki
| Zitat von Tobit
Wenn du im Dokument was suchen möchtest …
| |
Das kann ich bei Adobe doch eh schon so?
| |
Ja, weil der Text tatsächlich als Text vorliegt. Ohne OCR ist ein gescanntes Dokument nichts weiter als ein Bild, was in eine PDF gepackt wurde. Schon mal versucht, in Paint einen Text im Bild zu suchen?
|
|
|
|
|
|
|
Nun spinnt mir bei mayan-edms plötzlich der OCR-Mist rum. Unpaper wirft mir fürchterliche Fehler.
Hab ich Lust, mich darum jetzt zu kümmern, ey
|
|
|
|
|
|
|
So, wieder mal zwei Ordner eingescannt. Ging fix und macht Laune. Das einzige, was mich nervt, ist, daß der Aktenschredder nicht hinterherkommt. Ich überlege gerade, ob ich mir einen zweiten anschaffe, damit die mit dem Scanner wenigstens halbwegs mithalten können.
|
|
|
|
|
|
|
Mit welchen Eigenschaften scannt ihr die Dokumente? DPI? S/W, Farbe? PDF/A? Qualitätsstufe?
|
|
|
|
|
|
|
| Zitat von [GHF]Cop
So, wieder mal zwei Ordner eingescannt. Ging fix und macht Laune. Das einzige, was mich nervt, ist, daß der Aktenschredder nicht hinterherkommt. Ich überlege gerade, ob ich mir einen zweiten anschaffe, damit die mit dem Scanner wenigstens halbwegs mithalten können.
| |
Wen ich das so lese, will ich jetzt auch einen ix500 kaufen. Allerdings hadere ich noch mit mir, da eigentlich im Moment keine Zeit habe, um Bürokram zu machen und außerdem finanziell erstmal wichtigere Dinge anstehen.
Aber ich probier jetzt mal Paperport aus. Welche Version hast du doch gleich?
|
|
|
|
|
|
|
14 standard, also die für 79 Ocken.
|
|
|
|
|
|
|
| Zitat von Dobre
Mit welchen Eigenschaften scannt ihr die Dokumente? DPI? S/W, Farbe? PDF/A? Qualitätsstufe?
| |
Dies ist nur die zweitbeste Qualität, es geht noch mal doppelt so hoch aufgelöst:
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von [GHF]Cop am 04.10.2015 18:58]
|
|
|
|
|
|
Muss im zweiten Bild bei Texterkennungsoptionen nicht der Radiobutton bei "Alle Seiten" markiert werden?
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von Der Raven am 05.10.2015 9:19]
|
|
|
|
|
|
Wenn ich das menu richtig verstehe, nutzt er nur die erste Seite, um die Sprache zu erkennen und für das Dokument festzulegen. Da ich nie Dokumente einscanne, die auf verschiedenen Blättern verschiedene Sprachen haben, habe ich die Einstellung so gelassen.
Scheint so auch richtig zu sein, jedenfalls rennt OCR über alle Seiten.
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von [GHF]Cop am 05.10.2015 9:21]
|
|
|
|
|
|
Die ScanSnap Software ist übrigens Krieg srsly, selten so ein verhurtes, unintuitives Stück Software gesehen.
|
|
|
|
|
|
|
| Zitat von [GHF]Cop
Wenn ich das menu richtig verstehe, nutzt er nur die erste Seite, um die Sprache zu erkennen und für das Dokument festzulegen. Da ich nie Dokumente einscanne, die auf verschiedenen Blättern verschiedene Sprachen haben, habe ich die Einstellung so gelassen.
Scheint so auch richtig zu sein, jedenfalls rennt OCR über alle Seiten.
| |
Bei mir lief die Texterkennung dann nur auf der ersten Seite...
|
|
|
|
|
|
|
Hm, gerade noch mal gecheckt, bei mir findet er den Text auf allen Seiten. Mag aber daran liegen, daß das OCR letzten Endes sowieso von Paperport durchgeführt wird.
|
|
|
|
|
|
|
Ist PaperPort auch so ein Hurensohnprogramm wie Dragon?
|
|
|
|
|
|
|
Wenn du darauf anspielst das Paperport gelegentlich meint nicht ordnungsgemäß lizenziert zu sein dann ja
|
|
|
|
|
|
|
| Zitat von dino the pizzaman
Die ScanSnap Software ist übrigens Krieg srsly, selten so ein verhurtes, unintuitives Stück Software gesehen.
| |
dazu gleich noch eine Frage: wenn ich scanne entscheidet er automatisch ob sw oder Farbe. Problem ist, dass die sw-Scans mieserable Qualität haben. Und dass er bei mehrseitigen Dokumenten auch gerne zwishcen den Seiten wechselt. Bspw. hat die erste Seite ein farbiges Logo --> gute Qualität. Die nächste Seite ist nur Text ohne Farbe --> mieser sw-Scan.
Wie stelle ich das korrekt ein? Ist mir recht, dass er auch mal sw scannt. Aber dann bitte mit der gleichen Qualität wie der Farbscan.
|
|
|
|
|
|
|
Du kannst doch einstellen, daß er alles in Farbe und mit drölfzig dpi scannen soll. Problem solved.
|
|
|
|
|
|
|
| Zitat von [GHF]Cop
Du kannst doch einstellen, daß er alles in Farbe und mit drölfzig dpi scannen soll. Problem solved.
| |
nein, weil dann hab ich unnötig grosse Files bei reinen s-w-Texten. Und so kack wie gelbliches Papier etc... das bringt mir nichts. Da ist ein schöner sw-Scan die bessere Option
|
|
|
|
|
|
|
Uuund wieder ein Ordner weniger, diesmal Versicherungskram aus den Jahren 2001-2011.
|
|
|
|
|
|
|
Man muß es einfach lieben, Tochter kommt heute:
"Ich brauch Kopien der Praktikumsbescheinigung vom letzten Jahr und das Schulzeugnis auch. Ach ja, wann läuft der Vertrag für das Fitnesstudio aus?"
2 Minuten später hatte sie ihre Kopien und ihre Info, ohne das ich meienn Arsch aus dem Sessel bewegen mußte.
So langsam sehen meine Frauen ein, warum ich 400 Euro für einen Scanner ausgegeben habe und nicht für Schuhe.
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von [GHF]Cop am 23.10.2015 21:01]
|
|
|
|
|
|
Naja, so eine Box kostet auch nicht viel im Vergleichund es passt ne Menge rein.
|
|
|
|
|
|
|
Das stimmt so nicht, in speziell diese Box bekommst Du noch ca. 20 Seiten reingequetscht, weil der Rest voll mit Reitern ist!
Meine Datenbank umfasst inzwischen mehr als 1.400 Dokumente. Nicht Seiten. Dokumente.
|
[Dieser Beitrag wurde 2 mal editiert; zum letzten Mal von [GHF]Cop am 23.10.2015 21:13]
|
|
|
|
|
|
Ja ok. Ein normaler Haushalt macht sich ein paar Reiter (Wohnung/Haus, Bank, KFZ, Versicherung, Arbeit, Steuer, Amt xy, etc.) und packt da Unterordner mit insgesamt jeweils 10-30 Blättern rein.
Sowas hätte ich besser organisiert und schneller griffbereit als den Rechner hochzufahren. Die wichtigsten Sachen kann man ja immer noch scannen, was dann aber eher für Unterwegs oder im Notfall wichtig wäre. Schlimmstenfalls bei einem Brand müsste man halt die Kosten für sichere Cloud/Feuerschutztresor mal ausrechnen
Aber was rede ich, meine Papiere stapeln sich in allen möglichen Regalen und Schränken
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von Feuerlöscher am 23.10.2015 22:08]
|
|
|
|
|
|
wir haben hier bei der Arbeit einen Kopierer, der auch Stapelweise Scannen kann.
meine Freundin sollte einige Ordner mit Texten (aus dem Studium ) immer wieder mal griffbereit haben. ist es möglich, über die eingescante Datei das OCR laufen zu lassen? und wenn ja: welches Programm könnte das?
a
|
|
|
|
|
|
|
Ich benutze den Adobe Acrobat 11, der beim Scanner dabei war. Der kann das.
|
|
|
|
|
|
|
| Zitat von Feuerlöscher
Ja ok. Ein normaler Haushalt macht sich ein paar Reiter (Wohnung/Haus, Bank, KFZ, Versicherung, Arbeit, Steuer, Amt xy, etc.) und packt da Unterordner mit insgesamt jeweils 10-30 Blättern rein.
Sowas hätte ich besser organisiert und schneller griffbereit als den Rechner hochzufahren. Die wichtigsten Sachen kann man ja immer noch scannen, was dann aber eher für Unterwegs oder im Notfall wichtig wäre. Schlimmstenfalls bei einem Brand müsste man halt die Kosten für sichere Cloud/Feuerschutztresor mal ausrechnen
Aber was rede ich, meine Papiere stapeln sich in allen möglichen Regalen und Schränken
| |
Ich hab den Kram auf einen Banana Pi samt USB Stick gebunkert. Den kann man bei den 2W Stromverbrauch dauerhaft mitlaufen lassen und den benötigeten Kram mit dem Gerät der Wahl anzeigen lassen und nach Bedarf den Drucker damit belästigen.
|
|
|
|
|
|
|
|
|
|
|
Ich cross poste das mal hier hin, nachdem ich es aus versehen in den IBWN geschrieben hatte.
Für die Entwickler hier vielleicht interessant: Abbyy fährt gerade eine Promo-Aktion. Wenn man ein wenig Werbung für die Macht, bekommt man "lebenslang" 100 Seiten im Monat in der Abbyy OCR Cloud für lau.
Und Abbyy ist mit großen Abstand das beste OCR-System. Wir haben in der Firma einige ausprobiert, ich hab privat mit vielen rumgespielt, Abbyy ist immernoch am besten.
man kann in der Abbyy OCR Cloud relativ viele Formate hochladen (jpg, pdf, tif, etc) und dann in beliebigem Format runterladen. Zum Beispiel searchable PDF (wo dann der Text als unsichtbarer Layer über das gescannte gelegt ist), oder den reinen Volltext, oder mit Layout-Informationen etc.
Abgerechnet wird seitenweise.
Es gibt ne reihe von Beispielen, wie man das ganze in diversen Sprachen angeht. Unter anderem auch ein einfaches Bash-Beispiel, welches ich in meinem Scan-Prozess nutze.
|
|
|
|
|
|
|
|
|
|
|
Hab gerade auf die schnelle nur die E-Mail von abbyy zur Hand:
|
Holiday miracles can happen! Help us celebrate the New Year by spreading the word about our Cloud OCR SDK, and we will give you scanning volume.
Follow these steps:
Get 100 pages/mo for life when you share your experience about Cloud OCR SDK usage via Facebook, Twitter, or LinkedIn. Or get 1,000 pages when you share to your Blog!
Tag ABBYY (if you can) & include a link to www.OCRSDK.com
Hurry-up! Offer ends January 31st, 2016. Please contact us at cloudocrsdk@abbyy.com if you have any questions or concerns.
Click on the Get Free section of your ABBYY Cloud OCR SDK account Console, or visit www.OCRSDK.com to register.
Happy Holidays and Happy New Year's!
The ABBYY Team
| |
/e: hier Link
http://blog.ocrsdk.com/get-the-best-ocr-technology-for-free-in-new-year/
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von Teh Ortus am 03.01.2016 0:28]
|
|
|
|
|
|
Danke, hab das jetzt gemacht und es scheint auch funktioniert zu haben:
Available: 150 pages / 750 fields Add pages
Expiration: 02 Apr 2016
Allerdings irritiert mich das Ablaufdatum?
|
|
|
|
|
|
Thema: Fuck you Registratur ( Unterlagen ordnen für Dummies... ) |