improved file naming

Signed-off-by: Stephan Richter <s.richter@srsoftware.de>
This commit is contained in:
2023-03-04 18:48:01 +01:00
parent 6b40ae023b
commit 19dd5e183a
6 changed files with 280 additions and 97 deletions

95
doc/rework.md Normal file
View File

@@ -0,0 +1,95 @@
# Ideen
Verbesserung des Pfad-Handlings
## Stand
Aktuell werden Dokumente nach folgendem Muster erzeugt:
Wenn der gesetzte Pfad
`$HOME/Dokumente/$YEAR/$MONTH/$BETREFF`
ist, würde am 5.2.2023 ein von `srichter` ausgelöster PDF-Auftrag mit Betreff „Demo“ zunächst eine Datei
`/home/srichter/2023/02/Demo/<timestamp.jpg>` ergeben.
Falls das Ziel ein PDF ist, würde sofort danach die Datei zu
`/home/srichter/2023/02/Demo/<timestamp.page.pdf>` konvertiert.
Falls OCR aktiviert ist, würde danach
`/home/srichter/2023/02/Demo/<timestamp.page.ocr.pdf>` erzeugt.
Beim Zusammenfügen ergäbe sich dann
`/home/srichter/2023/02/Demo/Demo.pdf`.
## Gewünschtes Verfahren
Sinnvoll wäre es, wenn bei gesetzem Pfad
`$HOME/Dokumente/$YEAR/$MONTH/$BETREFF`
die Dateien wie folgt erzeugt würden:
### Ziel JPG
Die Datei wird direkt nach
`/home/srichter/2023/02/Demo.jpg` gescannt.
### Ziel PDF
Die Datei wird nach
`/home/srichter/2023/02/Demo.jpg` gescannt und dann nach
`/home/srichter/2023/02/Demo.pdf` konvertiert.
### Ziel PDF+OCR
Die Datei wird nach
`/home/srichter/2023/02/Demo.jpg` gescannt,
dann nach
`/home/srichter/2023/02/Demo.tmp.pdf` konvertiert.
Nach Texterkennung wird
`/home/srichter/2023/02/Demo.pdf` erzeugt.
## Mehrseitige Dokumente
Für mehrseitige Dokument kann die Variable $PAGE eingebaut werden:
Ist diese im Pfad vorhanden, so wird ein Eingabefeld für den aktuellen Stand eingeblendet.
Dieses soll ggf. schon vorhandene Dokumente berücksichtigen.
Es sei der Pfad also
`$HOME/Dokumente/$YEAR/$MONTH/$BETREFF/Dok {$PAGE. Seite}`.
Das Page-Eingabefeld wird mit 1 initialisiert.
### Ziel JPG
Die Datei wird direkt nach
`/home/srichter/2023/02/Demo/Dok 1. Seite.jpg` gescannt.
Danach wird der Zähler erhöht, die nachfolgende Seite wird als
`/home/srichter/2023/02/Demo/Dok 2. Seite.jpg` gescannt.
### Ziel PDF
Die erste Datei wird als
`/home/srichter/2023/02/Demo/Dok 1. Seite.jpg`
gescannt und dann zu
`/home/srichter/2023/02/Demo/Dok 1. Seite.pdf` konvertiert.
Die nächste Seite wäre dann entsprechend
`/home/srichter/2023/02/Demo/Dok 2. Seite.jpg`
`/home/srichter/2023/02/Demo/Dok 2. Seite.pdf`
### Ziel PDF-OCR
Die erste Datei wird als
`/home/srichter/2023/02/Demo/Dok 1. Seite.jpg`
gescannt und dann zu
`/home/srichter/2023/02/Demo/Dok 1. Seite.tmp.png` konvertiert.
Nach der Texterkennung ist die Ausgabe-Datei
`/home/srichter/2023/02/Demo/Dok 1. Seite.pdf`.
Für die nächste Seite wäre dann entsprechend
`/home/srichter/2023/02/Demo/Dok 12. Seite.jpg`
`/home/srichter/2023/02/Demo/Dok 2. Seite.tmp.pdf`
`/home/srichter/2023/02/Demo/Dok 1. Seite.pdf` die Ausgabe.
### Zusammenfügen
In den letzten Beiden fällen ergäbe das Zusammenfügen dann `/home/srichter/2023/02/Demo/Dok.pdf`