|
|
|
|
| Zitat von seastorm
Geht das automatisiert irgendwie?
| |
Ich benutze dafür Paperless, das ist ein simples server basiertes DMS, das nimmt die eingescannten Dokumente entgegen, lässt ein OCR drüberlaufen und versieht die Dokumente entsprechend meinen Regeln mit Tags.
Vor Paperless habe ich Openpaper benutzt, das macht das gleiche aber Desktop basiert.
|
|
|
|
|
|
|
| This project has been around since 2015, and there's lots of people using it. For some reason, it's really popular in Germany -- maybe someone over there can clue me in as to why? | |
Ich speicher mein Zeug in Evernote. OCR + Suche sind gut genug, dass ich den Tag/Notebook/Stack-Hierarchieshit, den ich mir ursprünglich überlegt hatte, über Bord geworfen hab. Völlig überflüssig.
|
|
|
|
|
|
|
Geil, gerade zufällig den Thread entdeckt. Mein Vater hat einen Scansnap IX500, den ich mir mal zum Digitalisieren meiner Dokumentensammlung leihen will. Anschließend mal gucken, wie ich weiter mache.
Ein paar Fragen dazu:
- Ich würde die Dokumente beim Scannen gerne direkt durch eine OCR Software (ocrmypdf?) schicken und auf ein NAS legen
- Am liebsten hätte ich gerne getrennte Ablagen für mich und meine Freundin... Ist aber vermutlich mit dem Scanner selbst nicht möglich? Also quasi ein Button "Profil A", "Profil B" oder so.
- Gibt es ein Web basiertes, gescheites Dokumentenmanagementsystem zum Indizieren und Durchsuchen der Dokumente? Index brauche ich vielleicht nichtmal, so viele habe ich nicht. Aber jedes mal auf der Shell irgendein grep zu schreiben würde mich nerven. Gescheite Volltextsuche für Dokumente also.
- Kategorisieren oder tagging wäre in dem DMS vielleicht auch nett. Ich fände es gut, wenn die Tags irgendwie im Dokument gespeichert würden, um nicht von externen Datenbanken abhängig zu sein.
Freue mich über Input!
/e: Und was auch cool wäre, wenn ich eingehende Mails einfach an eine bestimmte Adresse weiter leite, und die Mails / Anhänge auch ins DMS wandern könnten. (Mail Endpunkt und so könnte ich mir selbst basteln, aber die Ablage/DMS müsste sowas auch können.)
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von Oli am 06.02.2021 20:50]
|
|
|
|
|
|
|
|
|
|
zumindest Paperless arbeitet über vordefinierte Tags mit regexp, außerdem werden die Meta Informationen in einer DB abgelegt und nicht wie bei ocrmypdf im Dokument. mir reicht OCR vom Text und nachträgliche Suche.
/e: paperless-ng hat immerhin Volltextsuche und inbox-tags.
| Paperless now uses OCRmyPDF to perform OCR on documents. It still uses tesseract under the hood, but the PDF parser of Paperless has changed considerably and will behave different for some douments.
OCRmyPDF creates archived PDF/A documents with embedded text that can be selected in the front end. | |
gyle
|
[Dieser Beitrag wurde 3 mal editiert; zum letzten Mal von Oli am 06.02.2021 20:57]
|
|
|
|
|
|
Ja, Evernote kann das alles.
Kost halt Geld und die Poweruser sind irgendwie alle gerade butthurt über die neueste Version, aber ich kann nicht behaupten, dass ich irgendwelche Probleme hätte.
Zumal es auch eine Legacy-Version gibt, wenn man denn will.
/e: Achso, du willst auf ein lokales NAS. Sorry, überlesen.
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von nobody am 06.02.2021 21:15]
|
|
|
|
|
|
Hat jemand von euch „Paperless“ bzw. Paperless-NG im Einsatz? Läuft das auf einem Raspberry Pi (z.B. PI 4 mit 4GB), wenn der PI nur für Paperless im Betrieb ist?
Nach dem was ich gelesen habe scheint es mir eine optimale Lösung zu sein: Der Dokumentenscanner speichert es auf einem Netzlaufwerk des PI. Dort läuft das Paperless-OCR drüber und das Dokument wird erfasst.
|
|
|
|
|
|
|
Also auf nem Pi 3 war paperless-ng unbenutzbar in dem Sinne, dass die Verarbeitung einer einzelnen gescannten Seite mehrere Minuten gedauert hat. Die Weboberfläche war aber gut benutzbar
|
|
|
|
|
|
|
| Zitat von webLOAD
Hat jemand von euch „Paperless“ bzw. Paperless-NG im Einsatz? Läuft das auf einem Raspberry Pi (z.B. PI 4 mit 4GB), wenn der PI nur für Paperless im Betrieb ist?
Nach dem was ich gelesen habe scheint es mir eine optimale Lösung zu sein: Der Dokumentenscanner speichert es auf einem Netzlaufwerk des PI. Dort läuft das Paperless-OCR drüber und das Dokument wird erfasst.
| |
Wo wir schon dabei sind, wie schlägt sich papermerge? Die benutzen doch eh alle tesseract-ocr als Basis, oder bin ich da schief gewickelt?!
|
|
|
|
|
|
|
| Zitat von webLOAD
Hat jemand von euch „Paperless“ bzw. Paperless-NG im Einsatz? Läuft das auf einem Raspberry Pi (z.B. PI 4 mit 4GB), wenn der PI nur für Paperless im Betrieb ist?
Nach dem was ich gelesen habe scheint es mir eine optimale Lösung zu sein: Der Dokumentenscanner speichert es auf einem Netzlaufwerk des PI. Dort läuft das Paperless-OCR drüber und das Dokument wird erfasst.
| |
Und, hat jemand Erfahrungen mit dem 4er und OCR?
Will mir jetzt was mit ocrmypdf basteln und überlege noch welches Hardwaresetup ich aufbaue.
|
|
|
|
|
|
|
Was soll’s, Hardware ist bestellt. Ich werde berichten!
|
|
|
|
|
|
|
Hm, das ist sehr interessant für meine Interessen. Auf dem Pi laufen schon PiHole und deConz, das stört vielleicht.
Und ich frage mich, ob es gute Idee wäre, die Daten in die externe Nextcloud zu stopfen...
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von Armag3ddon am 30.04.2021 15:39]
|
|
|
|
|
|
|
|
|
|
Ja, ich will aber ungern hier noch ein Gerät im Dauereinsatz daheim betreiben und mich noch mit RAID-Gedöns befassen.
Und warum sind Dokumentenscanner alle so teuer?
|
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von Armag3ddon am 30.04.2021 16:12]
|
|
|
|
|
|
| Zitat von [KDO2412]Mr.Jones
SYNOLOGY DISKSTATION
| |
Habe ich hier auch noch laufen, aber die ist alt & lahm, das könnte man total vergessen.
@arma: ich hoffe der Kram ist nächste Woche da. Zu deinem Setup: pihole sollte kein Problem sein, das braucht praktische keine Ressourcen.
|
|
|
|
|
|
|
| Zitat von Armag3ddon
Und warum sind Dokumentenscanner alle so teuer?
| |
Homeoffice dürfte hauptsächlich der Grund sein.
Ich habe hier einen Epson Workforce DS-410, da gab es mal einen mydealz im Feb. 2020 für um die 220 ¤. Aktuell so um die 280-300 ¤.
Taugt absolut. Die Glasplatte oder den Einzug am Multifunktionsgerät nutze ich praktisch gar nicht mehr.
|
|
|
|
|
|
|
Ach die waren doch auch vorher schon teuer. Vermutlich halt eher ein Nischenprodukt.
|
|
|
|
|
|
|
Wer einen regulären Scanner hat, kann auch einfach NAPS2 nutzen und mit OCR direkt in Dropbox/Cloud/Wasauchimmer speichern lassen.
|
|
|
|
|
|
|
| Zitat von smoo
Wer einen regulären Scanner hat, kann auch einfach NAPS2 nutzen und mit OCR direkt in Dropbox/Cloud/Wasauchimmer speichern lassen.
| |
Regulärer Scanner wäre da, aber wen knechte ich, der mir die ganzen Blätter einzeln drauflegt und scannt?
Wenn ich nichts mit automatischem Einzug und beidseitigem Scan habe, hole ich lieber die Fotobox für 10¤ von Amazon. Das Smartphone braucht wenigstens nicht ewig lange für das Foto...
|
|
|
|
|
|
|
Puh, weiß nicht. Ich lege einfach eingehende Post auf den Einzug(scanner) von meinem Druckerkombi-HP-Dings, mache Naps an, drücke auf das Profil "OCR+Dropbox".
Dabei schau ich Youtube videos und wenn er durch ist, kommt der nächste Brief drauf. Fertig.
|
|
|
|
|
|
|
| Zitat von smoo
Puh, weiß nicht. Ich lege einfach eingehende Post auf den Einzug(scanner) von meinem Druckerkombi-HP-Dings, mache Naps an, drücke auf das Profil "OCR+Dropbox".
Dabei schau ich Youtube videos und wenn er durch ist, kommt der nächste Brief drauf. Fertig.
| |
Ja, in der Zukunft kann ich das sicher so machen. Es geht mir um die 1.000 Seiten oder so, die ich jetzt initial von den Aktenordnern her transferieren müsste.
|
|
|
|
|
|
|
Die Arbeit hab ich mir auch einmalig gemacht.
Wobei du von den 1000 Seiten doch sicherlich auch schonmal einiges aussortieren, im Sinne von "Das muss ich nicht unbedingt scannen" kannst?
|
|
|
|
|
|
|
Kannst Du auf der Arbeit vielleicht mal einen Ordner nebenbei scannen?
|
|
|
|
|
|
|
| Zitat von smoo
mache Naps an, drücke auf das Profil "OCR+Dropbox".
| |
nach welchem System benennt er die Dateien?
|
|
|
|
|
|
|
| Zitat von Icefeldt
Die Arbeit hab ich mir auch einmalig gemacht.
Wobei du von den 1000 Seiten doch sicherlich auch schonmal einiges aussortieren, im Sinne von "Das muss ich nicht unbedingt scannen" kannst?
| |
genau dafür fand ich den Einzugsscanner eben praktisch: man muss nicht sortieren. Man scannt einfach und hats. Fertig. Das spart am meisten Zeit. Das wäre mir sogar das Geld wert gewesen einen zu kaufen und dann wieder zu verkaufen. Von was für einem Verlust sprechen wir da? 100€? Das ist die gesparte Zeit allemal wert. Zumal man den Dokumentenscanner dann sowieso behält, weil er so geil ist
|
|
|
|
|
|
|
Mein Brother scannt zwar gut und braucht keinen PC, der läuft (direkt auf die DiskStation war mir wichtig), aber die Software ist noch aus dem letzten Jahrtausend...
Die Dateinamen kann man kaum beeinflussen, er zählt halt eine Nummer hoch.
|
|
|
|
|
|
|
| Zitat von Icefeldt
Die Arbeit hab ich mir auch einmalig gemacht.
Wobei du von den 1000 Seiten doch sicherlich auch schonmal einiges aussortieren, im Sinne von "Das muss ich nicht unbedingt scannen" kannst?
| |
Ich denke nicht. Also nicht, wenn die Dokumente ein vollständiges Bild abgeben sollen. Ausortiert habe ich vor kurzem schon und rigoros entsorgt, was nicht mehr wichtig ist. Aber gerade 2020 ist sehr viel Papierkram angefallen.
| Zitat von [KDO2412]Mr.Jones
Kannst Du auf der Arbeit vielleicht mal einen Ordner nebenbei scannen?
| |
Meine Arbeit findet auf unbestimmte Zeit zu 100% im Home Office statt.
|
|
|
|
|
|
|
Wenn Du mir ein neues Gummirollen-Kit kaufst, leih ich Dir meinen...
|
|
|
|
|
|
|
Ein was Kit?
|
|
|
|
|
|
|
Die Einzugsrollen für Papier. Nach so vielen Seiten sind die verstaubt und ziehen nicht mehr gerade ein... Ist ein Verschleißteil.
|
|
|
|
|
|
Thema: Fuck you Registratur ( Unterlagen ordnen für Dummies... ) |