|
|
|
|
| Zitat von Teh Ortus
Oha, du machst das mit der Windows CMD? Na viel Spaß
| |
Muss am PC meines Arbeitsstandortes laufen, der von der Schulbehörde gestellt wird, da ist leider nichts mit installieren/powershell.
.bat und alle Programme, die ohne Installation lauffähig sind, sind mein besten Freunde.
| Zitat von [KDO2412]Mr.Jones
Du kannst doch den Dateinamen per Variable rein geben, oder gleich mit "forfiles" arbeiten.
| |
ja zweite Idee war quasi Dateiname per Variable. Mir fehlte nur der Ansatz forfiles dürfte das wahrscheinlich erledigen. Danke
|
|
|
|
|
|
|
| Zitat von statixx
Lexmark 2442adwe. Scannt und druckt Duplex, Kost nicht mehr als ein reiner Dokumentenscanner. Bin mit dem Ding recht zufrieden. Ocr mach ich mit ocrmypdf.
| |
Wie funktioniert der Scanner? Sind da zwei Belichtungseinheiten verbaut oder wendet er das Blatt selbstständig?
Nach der Steuererklärung bin ich auch drauf und dran mal alles zu digitalisieren, das letzte Stück Motivation fehlt aktuell noch
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Äh, das mein ich. Der Gerät wendet selbstständig. Und wird nie müde.
|
|
|
|
|
|
|
Es gibt auch noch RADF wo der Gerät selbständig wendet, aber zweimal durchzieht und scannt.
DADF dagegen scannt beide Seiten in einem Durchzug.
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von MCignaz am 18.05.2020 15:11]
|
|
|
|
|
|
Und das spart ordentlich Zeit. Ja, für 10 Seiten paar Sekunden, halb so wild. Aber meist kauft man ja sowas, weil man deutlich mehr scannen will.
|
|
|
|
|
|
|
Guter Thread.
Muss ich beizeiten mal durchlesen, sind bestimmt unglaublich gute p0tsche Tipps enthalten.
Ich habe übrigens beides, einmal digital nach Themen sortierte Ordner und da finde ich dank macOS‘ perfekte Suche alles. Allerdings habe ich nicht alles gescannt und daher auch jede Menge an Papierkram. Zuletzt habe ich wieder einige Ordner angelegt. Dabei arbeite ich aehr gerne mit Trennblättern, die ich beschrifte. Natürlich beschrifte ich auch die Ordnerrücken und finde so eher das gesuchte.
|
|
|
|
|
|
|
wenn du eh scannst gibt es da noch den Ansatz, dass man jedes gescannte Blatt fortlaufend nummeriert (gibt so Stempel dafür, die automatisch zählen) und dann einfach in einen Ordner schmeisst. So muss man den Papierkram nicht mühsam einsortieren, findet ihn aber via digitalem Scan (und der darauf sichtbaren Nummer) im Original relativ schnell.
|
|
|
|
|
|
|
| Zitat von dino the pizzaman
wenn du eh scannst gibt es da noch den Ansatz, dass man jedes gescannte Blatt fortlaufend nummeriert (gibt so Stempel dafür, die automatisch zählen) und dann einfach in einen Ordner schmeisst. So muss man den Papierkram nicht mühsam einsortieren, findet ihn aber via digitalem Scan (und der darauf sichtbaren Nummer) im Original relativ schnell.
| |
sehr gute Idee! Danke
|
|
|
|
|
|
|
Smarte Nummer mit dem Paginierstempel. Habe daraufhin mal bei YouTube danach gesucht und ein Video gefunden, in dem ein Typ das Dokument paginierstempelt, scannt und abheftet. Der Scan landet dann in seinem Evernote Cloudspeicher, der es ihm dank OCR ermoeglicht den Speicher einfach nach der Seitenummer oder eben anderen Inhalten der Dokumente zu durchsuchen.
Krieg ich das auch mit Google One Speicher hin? Ich hab in Sachen OCR nur einen sehr kleinen IQ und mal lokal Tesseract benutzt. Aber das gab mir nur eine Textdatei mit dem Inhalt aus - fuer mich nutzlos. Ich will ein PDF, das aussieht wie das Original und durchsuchbar ist, automatisch erstellen und in die Cloud schieben.
Ich hab mich momentan auf den HP LaserJet Pro MFP M428fdw eingeschossen, der kann auch direkt nach Google Drive scannen. Jetzt wuerde mir nur der OCR-Part fehlen. Krieg ich das hin?
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von MCignaz am 31.05.2020 18:55]
|
|
|
|
|
|
Google Drive macht auch automatisch OCR auf PDF Dokumenten, meine ich.
Versuch macht kluch. Lade doch mal ein nicht-OCR Dokument hoch und dann such darin nach etwas...
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von [KDO2412]Mr.Jones am 31.05.2020 19:34]
|
|
|
|
|
|
Ach das wär ja geil. Probier ich aus.
/Cool, das scheint zu funktionieren. Bei aelteren Dokumenten besser, bei frisch hochgeladenen geht er anscheinend iterativ drueber, die Trefferquote geht langsam nach oben.
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von MCignaz am 31.05.2020 21:48]
|
|
|
|
|
Cross-Post
|
| Zitat von chuck.sports
Hallo,
ich suche einen Duplex-Dokumentenscanner, der die durchsuchbaren PDF-Dokumente direkt per Knopfdruck in der Cloud (SharePoint) ablegt. Die Konfiguration kann gerne über einen PC erfolgen, aber der PC soll nicht immer laufen müssen, wenn ich scanne, da auch mal andere Leute den Scanner benutzen wollen. Einen Server im Netzwerk gibt es nicht.
Die Scan-Geschwindigkeit sollte hoch sein. Ich habe hier einen Epson DS-870N stehen. Der sollte angeblich genau das können, aber tatsächlich funktioniert es nur, wenn der PC an ist und die Software gestartet...
| |
tldr
- OCR
- ADF
- Duplex
- Direkt zu SharePoint/E-Mail
- >60 Seiten/Minute (Duplex 120)
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von chuck.sports am 19.06.2020 11:51]
|
|
|
|
|
|
Kann ich mir fast nicht vorstellen das es das überhaupt gibt, allein schon wegen OCR. Wenn du 120 Seiten die Minute durch OCR durchschieben willst, braucht das schon ganz ordentlich Leistung.
120 Seiten die Minute scannen, irgendwo hochladen und dann DA asynchron OCR nachlagern, das kann ich mir vorstellen. Aber aufm Gerät? Hab ich noch nicht gesehen.
|
|
|
|
|
|
|
Gibts denn Geräte, die zumindest die PDFs direkt auf dem SharePoint bereitstellen können?
|
|
|
|
|
|
|
| Zitat von chuck.sports
Gibts denn Geräte, die zumindest die PDFs direkt auf dem SharePoint bereitstellen können?
| |
Ich glaube, mein alter Brother ADS-2400N kann Dinge auf nem Sharepoint ablegen. Zumindest gibt es das in den Einstellungen.
|
|
|
|
|
|
|
Leider hat sich herausgestellt, dass die Google Drive Funktion meines neuen HP Multifunktionsmoppeds total verbuggt und langsam ist. Mit dem Rest des Drucker/Scanners bin ich aber sehr zufrieden.
Daher hab ich mir noch nen Raspberry Pi gekauft auf dem Ubuntu Server 20.04 laeuft. Ich scanne dann mit dem Drucker in einen Netzwerkordner des Raspis. Dort wiederum laeuft ein Bash Script als Service, dass auf neue Dateien lauscht. Wenn eine neue Datei im Ordner landet, wird sie automatisch mittels rclone in einen Ordner meines Google Drives verschoben. Das funktioniert jetzt schon sehr gut.
Naechste Stufe des Projekts wird das PDF automatisch schneiden zu lassen. Der Scanner macht aus einem Stapel eingelegter Dokumente naemlich nur ein einzelnes PDF. Idee (das hier auch schon mit farbigen Seiten) kommt hier aus dem Thread. Ich werd mir Seiten mit nem QR Code zwischen die verschiedenen Dokumente legen. Landet ein neues PDF im Netzwerkordner, soll ein Script nach dem QR Code durchsuchen und das PDF entsprechend zurechtschnippeln und abspeichern, danach werden die fertigen PDFs wieder in die Cloud geladen.
Zu guter Letzt fehlt mir noch ein Paginierstempel, dann waer ich wohl erstmal sehr zufrieden mit dem Setup.
Bisher ist es eine spassige Bastelei mit schnellen Erfolgserlebnissen, mal sehen ob das mit dem QR-Code Feature so bleibt.
|
|
|
|
|
|
|
| Zitat von chuck.sports
Gibts denn Geräte, die zumindest die PDFs direkt auf dem SharePoint bereitstellen können?
| |
Mein HP LaserJet Pro MFP M428fdw kann das. Ausprobiert hab ich's aber noch nicht, wie im Post ueber diesem beschrieben, ist die Google Drive Funktion ziemlich lausig.
|
|
|
|
|
|
|
Ich hab das damals so gemacht, dass mein Script nur Dateien verarbeitet, die älter als eine Minute sind.
Wenn mehrere Seiten innerhalb einer Minute zueinander sind, wird davon ausgegangen, dass die zum gleichen Stapel gehören und ggfs. gewartet, bis der Stapel komplett gescanned ist.
Um dann unterschiedliche Dokumente in einem Stapel zu scannen habe ich nicht mit einem Barcode gearbeitet, sondern mit Bastelpapier welches ich noch rumliegen hatte. Das ist einfach komplett rotes Papier. Das ist auch leicht zu erkennen.
Falls du Inspiration brauchst:
- Mein Script:
https://pastebin.com/QjjnHntX
Damals in Groovy geschrieben. In Bash ist sowas schnell nervig. Aber das wichtige sind ja eher die Aufrufe von imagemagick etc.
- abbyy_ocr.sh:
https://pastebin.com/y3z3bCCV
Kommt so direkt von Abbyy. Abbyy ist meiner Erfahrung nach den Opensource-Alternativen immernoch weit voraus. Wenn man aber eh auf gdrive hochlädt, kann man sich das auch schenken und Google das OCR machen lassen.
|
|
|
|
|
|
|
Cool, danke fuer die Scripts! Weisst du, ob Google Drive den OCR Layer in die PDFs schreibt, oder das nur so fuer sich speichert und indexiert und lediglich mit dem dauzgehoerigen PDF verknuepft? Sprich: Wenn ich die PDFs runterlade, ist der OCR Layer dann noch drin? Wie pruefe ich das am besten, reicht da das betriebssystemeigene "Find in Files"?
|
|
|
|
|
|
|
Nein, Google packt deine PDFs nicht an. Darin suchen kannst du nur online. Wenn du wirklich searchable PDFs haben willst, empfehle ich die manuell durch OCR zu schieben, z.B. übers OCRSDK von Abbyy
|
|
|
|
|
|
|
Hat Abbyy OCR jetzt den Gratisplan mit 100 Seiten/Monat entfernt? Das waere echt traurig, war mit den Ergebnissen sehr zufrieden und die anderen Plaene machen als Privatperson preislich keinen Sinn.
Ich hab an meinen Scripten gebastelt, mittlerweile kann mein Raspi vor dem Hochladen ein ankommendes PDF auf eine Seite mit nem QR Code durchsuchen und dort schnibbeln. Benutze das als Dokumententrenner wenn ich den automatischen Einzug benutze. Das hatte ja jemand hier schon mit farbigen Seiten.
|
|
|
|
|
|
|
Hat's irgendwer von euch schon wieder aufgegeben und will seinen Scanner abtreten, bzw. plant anzufangen und will den IX100 aus der SnapScan-Cashbackaktion loswerden?
Will der Sache mal eine Chance geben, bin mir aber noch unsicher, ob ich konsequent genug bin, um das Problem guten Gewissens mit 500€ zu bewerfen.
Es seidenn, jemand hat Empfehlungen für ein MuFu-Gerät mit WLAN und direktem Scan zu Evernote parat. Druck sehr wenig, vielleicht 5-10 Seiten in der Woche, aber Duplexscan und eben direkt in die Wolke wäre mir wichtig.
/edit: OK, hab gerade bei eBay Kleinanzeigen einen Canon Maxify MB5150 für 9 (neun!) Euro geschossen, weil "bin mir nicht sicher, ob er druckt, hab ihn nur als Scanner benutzt". Duplex-ADF, Scan-to-Cloud... bin mal gespannt, ob er auch wirklich funktioniert.
|
[Dieser Beitrag wurde 3 mal editiert; zum letzten Mal von nobody am 27.01.2021 14:52]
|
|
|
|
|
|
Hat jemand Erfahrungen mit den ScanSnap S1500? Ist schon sehr alt, aber wohl auch noch sehr gut? 600 DPI sollten ja reichen, oder?
|
|
|
|
|
|
|
| Zitat von nobody
/edit: OK, hab gerade bei eBay Kleinanzeigen einen Canon Maxify MB5150 für 9 (neun!) Euro geschossen, weil "bin mir nicht sicher, ob er druckt, hab ihn nur als Scanner benutzt". Duplex-ADF, Scan-to-Cloud... bin mal gespannt, ob er auch wirklich funktioniert.
| |
Läuft. Und druckt nach geschätzten 57x Druckkopf Reinigen sogar OK-ish. Selten so einen nicen Deal gemacht.
Ich bin dann mal mein Leben in den Griff kriegen. <3
/e: Paginierstempel habe ich mir natürlich auch besorgt, danke für den Tipp hier.
Hab bisher nur ein paar Testseiten gescannt, aber bisher bin ich ganz angetan. Kann Duplex, Geschwindigkeit ist für meine Zwecke dicke ausreichend, Qualität passt. Wat willse mehr.
|
[Dieser Beitrag wurde 3 mal editiert; zum letzten Mal von nobody am 29.01.2021 17:31]
|
|
|
|
|
|
| Zitat von tbd
Hat jemand Erfahrungen mit den ScanSnap S1500? Ist schon sehr alt, aber wohl auch noch sehr gut? 600 DPI sollten ja reichen, oder?
| |
600 dpi reichen für Dokumente locker.
Ich scanne mit meinem Epson DS 410 meist bei 200 dpi schwarz/weiß und bei 400 dpi Farbe.
Alles einwandfrei lesbar.
|
|
|
|
|
|
|
Super, danke.
@nobody: diese Canon-Dinger gibt es ja zu Hauf defekt bei eBay Kleinanzeigen
Was für ein Scheißprodukt (also vong Drucker her)
|
|
|
|
|
|
|
Ich glaube fast, das liegt an den Folgekosten. Muss mein "druckt ok" zurücknehmen, jetzt hat er nachdem ich ihn zur Encoderreinigung offen hatte den Dienst quittiert wegen Drittanbietertinte. Hoffe, ich kriege ihn zumindest noch irgendwie zum Scannen überredet.
Ich lasse es mal auf einen Satz neue Tinte (80€ ) ankommen... Wenn er dann nicht gescheit druckt habe ich natürlich doch böse Geld in den Sand gesetzt.
|
[Dieser Beitrag wurde 2 mal editiert; zum letzten Mal von nobody am 30.01.2021 0:13]
|
|
|
|
|
|
Ich hab mir mal nen ollen Scansnap S1300 zugelegt weil ich auch noch nicht so sicher bin ob ich dafür wirklich viel Geld ausgeben will. Läuft auch ganz gut bisher, aber die Verschlagwortung automatisiert zu machen kriegt man damit nicht hin, oder? Geht das überhaupt bei den Scansnaps? Die Tipps, die ich bisher finden konnte, gehen von manueller Markierung der Schlagworte auf dem Dokument per Textmarker aus. Etwas schneller als tippen, aber dennoch....
Geht das automatisiert irgendwie?
|
|
|
|
|
|
Thema: Fuck you Registratur ( Unterlagen ordnen für Dummies... ) |