Du bist nicht eingeloggt! Möglicherweise kannst du deswegen nicht alles sehen.
  (Noch kein mods.de-Account? / Passwort vergessen?)
Zur Übersichtsseite
Hallo anonymer User.
Bitte logge dich ein
oder registriere dich!
 Moderiert von: Irdorath, statixx, Teh Wizard of Aiz


 Thema: Fuck you Registratur ( Unterlagen ordnen für Dummies... )
« vorherige 1 2 3 4 5 6 7 8 9 [10] 11 12 13 14 15 16 nächste »
erste ungelesene Seite | letzter Beitrag 
Armag3ddon

AUP Armag3ddon 04.01.2011
Sag mal Modell an, damit ich kalkulieren kann. Breites Grinsen
Nach meiner Recherche könnte ich wohl für ~140¤ was gebrauchtes bekommen, was nicht scheiße ist. peinlich/erstaunt
01.05.2021 11:16:56  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
[KDO2412]Mr.Jones

[KDO2412]Mr.Jones
brother ads-2600we, ich hab Dir ne pm geschrieben (in Potdroid merkt man das ja nicht)
01.05.2021 12:19:36  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Icefeldt

AUP Icefeldt 09.04.2020
 
Zitat von [KDO2412]Mr.Jones

Die Dateinamen kann man kaum beeinflussen, er zählt halt eine Nummer hoch.



Das passt mit meinem Ordnungszwang nicht zusammen Breites Grinsen

Dateien sind zwar alle OCR'ed, aber trotzdem müssen die einen eindutigen Dateinamen mit Datum haben und noch in passender Ordnerstruktur abgespeichert werden traurig
01.05.2021 12:23:28  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Armag3ddon

AUP Armag3ddon 04.01.2011
 
Zitat von [KDO2412]Mr.Jones

brother ads-2600we, ich hab Dir ne pm geschrieben (in Potdroid merkt man das ja nicht)


Nice. Breites Grinsen hast ebenfalls PM!
01.05.2021 12:29:03  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
dino the pizzaman

dino the pizzaman
 
Zitat von Icefeldt

 
Zitat von [KDO2412]Mr.Jones

Die Dateinamen kann man kaum beeinflussen, er zählt halt eine Nummer hoch.



Das passt mit meinem Ordnungszwang nicht zusammen Breites Grinsen

Dateien sind zwar alle OCR'ed, aber trotzdem müssen die einen eindutigen Dateinamen mit Datum haben und noch in passender Ordnerstruktur abgespeichert werden traurig


finde ich btw bisher auch das zeitaufwändigste: alles benamens und dann einordnen. Letzteres geht dank everything zwar schneller, aber ist und bleibt halt Arbeit. Bin nicht der "alles in einen Ordner schmeissen"-Typ.
01.05.2021 13:28:03  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
[KDO2412]Mr.Jones

[KDO2412]Mr.Jones
Ja, das nervt etwas. Auch, dass es keine "Trennkarten" für Brother gibt, mit denen man den Stapel Dokumente in verschiedene Dateien trennen kann.

Also jeder Scanvorgang = eine Datei. Vor allem bei vielen einzelnen Blättern doof, ich hab dann einfach alles in eine Datei gescannt und danach per Kommandozeile die in einzelne Seiten zerlegt.

OCR macht der Scanner auch nicht selber, aber das macht sonst ja auch der Computer nach dem Scan.

Am besten per Paperless NG den ganzen Ordner OCR'n.
01.05.2021 13:57:49  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
dino the pizzaman

dino the pizzaman
Ich machs aktuell nach wie vor mit der Scansnap-Software. Hab ein Profil für alle Seiten in eine Datei, und eins für jedes Blatt in ein eigenes File. OCR ist gut. Nur mit der maschinenlesbaren Zeile der schweizer Einzahlungsscheine kommt das OCR nicht klar mit den Augen rollend
01.05.2021 14:43:02  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
webLOAD

webload
 
Zitat von smoo

Puh, weiß nicht. Ich lege einfach eingehende Post auf den Einzug(scanner) von meinem Druckerkombi-HP-Dings, mache Naps an, drücke auf das Profil "OCR+Dropbox".

Dabei schau ich Youtube videos und wenn er durch ist, kommt der nächste Brief drauf. Fertig.


Das will ich gerade nicht. Den Einzugsscanner füttern ist ok, aber ich will nur auf dem Drucker anklicken, wohin es geht, jedoch keinen PC / Programm starten.
01.05.2021 15:01:30  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
smoo

AUP smoo 02.03.2009
 
Zitat von Icefeldt

 
Zitat von smoo

mache Naps an, drücke auf das Profil "OCR+Dropbox".



nach welchem System benennt er die Dateien?


Datum. Da ich aber den gesamten Ordner in der Windowssuche habe indexieren lassen, brauche ich auch nicht mehr. Will ich zB Briefe der "kantholz GmbH" gebe ich halt kantholz in die Suche ein
 
Zitat von webLOAD

 
Zitat von smoo

Puh, weiß nicht. Ich lege einfach eingehende Post auf den Einzug(scanner) von meinem Druckerkombi-HP-Dings, mache Naps an, drücke auf das Profil "OCR+Dropbox".

Dabei schau ich Youtube videos und wenn er durch ist, kommt der nächste Brief drauf. Fertig.


Das will ich gerade nicht. Den Einzugsscanner füttern ist ok, aber ich will nur auf dem Drucker anklicken, wohin es geht, jedoch keinen PC / Programm starten.


Ich glaub sowas geht nur, wenn man Geld in die Hand nimmt... Augenzwinkern
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von smoo am 02.05.2021 13:26]
02.05.2021 13:25:25  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
webLOAD

webload
Mein HP-Multigerät kann Scans automatisch auf Netzlaufwerken speichern. Und wenn ich Paperless richtig verstehe, konvertiert das PDFs aus einem Netzlaufwerk. Dann müsste man „nur“ einen Pi kaufen.
02.05.2021 19:14:25  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Feelgood Managerin

xmas female arctic
Oder eine SYNOLOGY DISKSTATION mit docker Funktionen
03.05.2021 7:51:31  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Armag3ddon

AUP Armag3ddon 04.01.2011
Alles klar. Paperless-ng habe ich dem Bare Metal setup folgend nun auf dem Pi installiert. Es läuft und hat erfolgreich ein zweiseitiges, reines Bild-PDF verarbeitet (ich musste leider kurz afk, aber maximal 2 Minuten Verarbeitungszeit).

Falls jemand ocrmypdf und einen Raspberry Pi zusammenbringen möchte: https://github.com/jonaswinkler/paperless-ng/discussions/978

Jetzt muss ich mir als nächstes also Gedanken machen, wo ich die Daten einlagere.
03.05.2021 16:03:48  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
smoo

AUP smoo 02.03.2009
Ah cool, dass das geht. Aber ich hab bisher 0 Ahnung vom Pi und für mich ist es Ok, wenn ich den PC anmache.
04.05.2021 13:15:58  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Armag3ddon

AUP Armag3ddon 04.01.2011
Ahnung vom Pi brauchst du eigentlich nicht, aber Ahnung von Linux/Debian. Augenzwinkern
04.05.2021 16:15:28  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
tbd

Arctic
 
Zitat von tbd

Was soll's, Hardware ist bestellt. Ich werde berichten!



Heute ist endlich alles angenommen, ich habe jetzt nen Raspberry Pi 4 mit 8 GB in nem Argon One Case mit M.2 SSD hier laufen.
Erstes Quick & Dirty Setup mit Raspberry Pi OS Lite und paperless-ng via docker.
Ergebniss: ca. 4m30s für ein 16-seitiges PDF (Scan einer Klausur mit gedruckter Aufgabenstellung und handschriftlicher Lösungen).
Die Web-Anwendung ist sehr fix und die Suche (ok, aktuell noch ein winziger Index...) ist exzellent was Geschwindigkeit und Ergebnisse angeht.
Für ausführlichere Tests habe ich jetzt keine Zeit mehr traurig
05.05.2021 21:04:46  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Armag3ddon

AUP Armag3ddon 04.01.2011
Mein Dank schon mal an Mr.Jones für die erfolgreiche Übergabe eines Scanners. Der Großangriff Digitalisierung kann starten. Breites Grinsen

Gerade kam auch die Lieferung einer WD MyCloud EX2 mit 8 TB (bzw. 4 im RAID) als Datenspeicher. Ich bin nicht glücklich darüber, ein weiteres Gerät in den Dauereinsatz zu stellen, aber eine viel bessere Lösung, auch für einen sonstigen Backupplan, fiel mir nicht ein. Immerhin sind die halbwegs stromsparend.

Wenn ich einen Überblick habe, wie groß die Datenmenge so ist, überlege ich, ob ich dazu noch in die selbstbetriebene Nextcloud sichere. Aber das ist eine schwierigere Überlegung. Die liegt bei netcup in einem Datencenter und theoretisch könnten irgendwelche Leute lokal drauf zugreifen und meine Daten abziehen. Mit Verschlüsselung brauch ich da nicht zu arbeiten, wenn jemand physischen Zugriff hat. Außer, ich finde einen guten Weg, die Daten nur verschlüsselt in die Cloud zu schieben, ohne dass die darauf zugreifen kann.
07.05.2021 12:10:19  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
[KDO2412]Mr.Jones

[KDO2412]Mr.Jones
SYNOLOGY DISKSTATION

(Jaja, ich wiederhole mich - aber statt Raspberry Pi, WD Netzwerkplatte und noch eine Backup Lösung kann man auch gleich eine docker fähige DiskStation hinstellen.)
07.05.2021 12:49:35  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Armag3ddon

AUP Armag3ddon 04.01.2011
Wär halt teurer gewesen und der Pi ist sowieso schon im Einsatz. Die zusätzliche Backup-Lösung fiele dadurch auch nicht weg. Die Synology Disk Station ist eben auch nur eine Disk Station im Haus.
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von Armag3ddon am 07.05.2021 13:10]
07.05.2021 13:05:13  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
webLOAD

webload
 
Zitat von Armag3ddon

Alles klar. Paperless-ng habe ich dem Bare Metal setup folgend nun auf dem Pi installiert. Es läuft und hat erfolgreich ein zweiseitiges, reines Bild-PDF verarbeitet (ich musste leider kurz afk, aber maximal 2 Minuten Verarbeitungszeit).

Falls jemand ocrmypdf und einen Raspberry Pi zusammenbringen möchte: https://github.com/jonaswinkler/paperless-ng/discussions/978

Jetzt muss ich mir als nächstes also Gedanken machen, wo ich die Daten einlagere.


Bei mir funktoniert es nicht. Ich bleibe bei „sudo pip3 -Hu paperless …“ hängen.
1. Müsste es nicht sudo -Hu paperless pip3 … sein?
2. Bei mir klappt auch das nicht, da offenbar kein zugriff darauf. Wie hast du den User paperless angelegt? Bei mir läuft er als System-user.
07.05.2021 21:52:36  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Armag3ddon

AUP Armag3ddon 04.01.2011
 
Zitat von webLOAD

 
Zitat von Armag3ddon

Alles klar. Paperless-ng habe ich dem Bare Metal setup folgend nun auf dem Pi installiert. Es läuft und hat erfolgreich ein zweiseitiges, reines Bild-PDF verarbeitet (ich musste leider kurz afk, aber maximal 2 Minuten Verarbeitungszeit).

Falls jemand ocrmypdf und einen Raspberry Pi zusammenbringen möchte: https://github.com/jonaswinkler/paperless-ng/discussions/978

Jetzt muss ich mir als nächstes also Gedanken machen, wo ich die Daten einlagere.


Bei mir funktoniert es nicht. Ich bleibe bei „sudo pip3 -Hu paperless …“ hängen.
1. Müsste es nicht sudo -Hu paperless pip3 … sein?
2. Bei mir klappt auch das nicht, da offenbar kein zugriff darauf. Wie hast du den User paperless angelegt? Bei mir läuft er als System-user.


Eh, ja, müsste es sein. Hab’s mal korrigiert. Breites Grinsen

Den User habe ich entsprechend des Setups angelegt, also auch —system. Wenn sudo -Hu paperless nicht läuft, scheint irgendwas mit dem user nicht zu stimmen. Hast du auf alles geachtet, Home Verzeichnis und so?

/e aka poste mal Fehlermeldung
[Dieser Beitrag wurde 2 mal editiert; zum letzten Mal von Armag3ddon am 07.05.2021 22:14]
07.05.2021 22:10:39  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
webLOAD

webload
Ich habe es jetzt installiert. Mit dem User Paperless - der hatte vorher keine Lese- Schreibrechte für /opt/paperless.

Jetzt bin ich aber nicht weiter: ich habe Dateien in den Consumer-Ordner kopiert. Im Webinterface erhalte ich „Error Weile Leasing Documents: Object ProgressEvent“

Ich brauche eine Anleitung für doofe, die ich 1:1 befolgen kann. Auf einem neu installierten Raspberry Pi (zum Glück habe ich einen zweiten dafür angeschafft, der erste läuft mit allen anderen Sachen).

/Es läuft! Es war in /opt/paperless in einem unterordnen paperless-ng gespeichert. Alles eine Ebene höher und es läuft wunderbar.
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von webLOAD am 08.05.2021 23:28]
08.05.2021 21:48:18  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Armag3ddon

AUP Armag3ddon 04.01.2011
Wenn du im Webinterface auf Protokoll gehst, steht da auch nicht mehr? Da sollte optimalerweise etwas mehr drinstehen, wenn du nicht am Loglevel geschraubt hast.
Laufen die drei Services alle korrekt? Mit
systemctl status paperless-consumer.service
systemctl status paperless-scheduler.service
systemctl status paperless-webserver.service
solltest du jeweils den Status sehen (möglichst auf Active) und kriegt die letzten paar Logzeilen rausgezeigt.
08.05.2021 23:33:00  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Armag3ddon

AUP Armag3ddon 04.01.2011
Ach ja. Ja, das Archiv enthält noch einen Ordner.
08.05.2021 23:33:27  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Armag3ddon

AUP Armag3ddon 04.01.2011
...
MyCloud eingerichtet und als nfs an media/ und consume/ eingehängt. Heute wurde ein Ordner gescannt und jetzt arbeitet sich der Pi am OCR für alle Gehaltsabrechnungen meines Lebens ab. Breites Grinsen

Läuft bisher gut!
[Dieser Beitrag wurde 1 mal editiert; zum letzten Mal von Armag3ddon am 09.05.2021 18:45]
09.05.2021 18:44:03  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
[KDO2412]Mr.Jones

[KDO2412]Mr.Jones
Tschakka!
09.05.2021 20:00:05  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Armag3ddon

AUP Armag3ddon 04.01.2011
Falls noch von Interesse:
Ich habe jetzt auch die externe Backuplösung geregelt. Durch ein POST_CONSUME_SCRIPT werden die Dateien jetzt noch via gpg verschlüsselt und dann in meine Nextcloud verschoben.

feuerversicherung.sh:
 
Code:
#!/usr/bin/env bash

DOCUMENT_ID=${1}
DOCUMENT_FILE_NAME=${2}
DOCUMENT_SOURCE_PATH=${3}

gpg --encrypt -r meine@mail.de "$DOCUMENT_SOURCE_PATH"
curl -u User:Password -T "$DOCUMENT_SOURCE_PATH.gpg" "https://nextcloud/remote.php/dav/files/.../$DOCUMENT_FILE_NAME.gpg"
rm "$DOCUMENT_SOURCE_PATH.gpg"


Überlegungen dazu:

Hochgeladen werden hierdurch nur die Ausgangs-PDFs, d.h. ohne OCR. Hintergrund ist schlicht, dass paperless das Zieldokument nicht an das Script weitergibt. Das sollte sich allerdings recht einfach hacken lassen, wenn man möchte. Vermutlich, indem man hier statt document.source_path document.archive_path weiterreicht. Ich wollte jetzt allerdings keine Änderungen einbauen, die ich dann bei Updates wieder manuell erhalten muss.

gpg läuft recht fix und schrumpft überdies die Dateigröße deutlich zusammen. Als Alternative habe ich auch age getestet (bei Bedarf kann ich kurz zusammensammeln, wie man das auf dem Pi installiert). Dauert etwas länger und die Größe wird etwas mehr. Sicherlich eine Geschmacksfrage, bzw. Zitat meines IT-Kumpels: "gpg ist veraltete Kacksoftware, die nur darauf wartet, dass wieder irgendwas kritisches passiert". Da das Script die Dokumentenverarbeitung blockiert, entscheide ich mich für den schnelleren Weg.

Hochgeladen wird es über die WebDAV-Schnittstelle in die Cloud. Das wird nicht immer empfohlen, vor allem, weil es langsam ist. Vorteil ist eindeutig, dass die Datei damit aber schon durch die Nextcloud erfasst ist und man keine extra Scans in cronjobs werfen muss. Der Zeitverlust pro Dokument dürfte auch überschaubar sein. Die größte Datei bisher hat ~17MB bei mir (27 Seiten). gpg braucht wenige Sekunden, danach sind es 11MB und diese sind wiederum in wenigen Sekunden hochgeladen. Nachdem man 20 Minuten oder so auf OCR wartet, ist das zu vernachlässigen.

Die Ordnerstruktur von paperless wird in der Cloud nicht erhalten. Ich werfe alle Dokumente in einen Ordner. Ich benenne die Dateien allerdings noch sinnvoll, wenn die vom Scanner kommen (da paperless nicht immer sofort sinnvolle Zuordnungen machen kann). Sicherlich könnte man noch die Dateipfade im Script herausfummeln, wenn das wichtig ist.

Mir hat es jetzt echt zwei Tage Kopfzerbrechen bereitet, dass ich die Dateien unter Windows nicht entschlüsselt bekommen. Gleicher Key, nur geringe Unterschiede in der gpg-Version, bzw. dieselbe age-Version und das PDF war trotzdem kaputt. Bis mir aufgefallen ist, dass das Problem PowerShell ist. Über CMD.exe kein Problem, aber PowerShell scheint irgendeinen Encoding-Scheiß zu fabrizieren, der das Dokument killt...
[Dieser Beitrag wurde 2 mal editiert; zum letzten Mal von Armag3ddon am 12.05.2021 10:18]
12.05.2021 10:13:41  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
tbd

Arctic
Ja geil, sowas ist natürlich von Interesse! (Auch wenn ich noch nicht so weit bin mir um Backups Gedanken zu machen Breites Grinsen)

Wie läuft es sonst mit den Gehaltsabrechnungen? Du hast gerade was von 20 Minuten für OCR geschrieben?! Haare zu Berge stehen
12.05.2021 10:25:38  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
[KDO2412]Mr.Jones

[KDO2412]Mr.Jones
...und ich hab immer noch nicht meine alte DiskStation bei meinen Eltern angeschlossen, um damit ein offsite-Backup zu fahren...

traurig
12.05.2021 10:26:15  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
Armag3ddon

AUP Armag3ddon 04.01.2011
Das wäre das Dokument mit 27 Seiten. Das sind alle meine Abrechnungen aus 2020, da wurden ein paar mehr Seiten fabriziert, weil es mehrere nachträgliche Anpassungen gab. Breites Grinsen
Die 20 Minuten sind geschätzt, da ich nicht daneben saß und zugeschaut habe. An dem Scantag habe ich 150 Seiten oder so durchgejagt und die Dokumente dann einfach in den Consume-Ordner von paperless verschoben. Ich müsste so gegen 18:30 Uhr alle PDFs verschoben haben und um 22 Uhr rum war die Verarbeitung auf jeden Fall fertig.

Ein- oder zweiseitige Dokumente sind allerdings in 1-2 Minuten verarbeitet, wenn ich die mal über das Webinterface reinlade.
12.05.2021 10:40:47  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
tbd

Arctic
Das klingt doch insgesamt sehr ordentlich, nice!
Da fällt mir ein ganz praktisches Problem ein: wenn ich einen Stapel Dokumente einscanne bekommen ich hinterher nur ein pdf (wie wohl auch bei deinen Gehaltsabrechnungen). Gibt es da bei paperless eine Möglichkeit Dokumente zu trennen?
12.05.2021 10:49:34  Zum letzten Beitrag
[ zitieren ] [ pm ] [ diesen post melden ]
 Thema: Fuck you Registratur ( Unterlagen ordnen für Dummies... )
« vorherige 1 2 3 4 5 6 7 8 9 [10] 11 12 13 14 15 16 nächste »

mods.de - Forum » Public Offtopic » 

Hop to:  

| tech | impressum