Date: prev next · Thread: first prev next last
2020 Archives by date, by thread · List index


Hallo,

vorweg: Ich habe (aus Zeitgründen) die bisherige Diskussion nur sporadisch verfolgt, ich erinnere, Du nutzt LINUX?
Folgender Abschnitt ist mir aufgefallen:
Am 10.01.20 um 09:48 schrieb Rainer:
Abgesehen davon scheint mir die Sache aussichtslos: Auf meinem System
befinden sich dermaßen viele pdf-Dokumente, die so verstreut sind, dass
ich mir nicht vorstellen kann, wie sie alle ins PDF/A-Format zu bringen
sein könnten. Hinzu kommt, dass sie aus verschiedensten Quellen stammen
(LO, Scanner, Download, etc.) und verschiedene Format-Angaben
enthalten. Und auf das Format neuer Dokumente, die mittels Druckfunktion
von Websites generiert werden, habe ich keinen Einfluss (müssten also -
sofern möglich - vom abgespeicherten Format wieder ins PDF/A
konvertiert werden). Meine Einschätzung: Praktisch nicht umsetzbar,
weil der Aufwand viel zu groß.
Ich denke, Du kannst mit einem BASH / find eine Liste aller PDF-Dateien erzeugen, egal wo sie auf Deiner Platte gespeichert sind. So weit ich in Erinnerung hatte, prüft OCRmyPDF, ob bereits durchsuchbarer Text vorhanden ist und fügt ihn hinzu, falls dies noch nicht vorhanden ist; siehe hierzu diese Diskussion. <https://github.com/jbarlow83/OCRmyPDF/issues/72> Ich habe es nicht getestet, aber wenn das so funktioniert, könntest Du wieder per BASH Deine Liste durch OCRmyPDF schicken und die neue erzeugten Files speichern lassen. Schließlich  - wenn gewünscht - die alten Dateien nach Listeneinträgen löschen und die neuen nach den Listeneinträgen umbenennen.

Gruß
Michael


--
Liste abmelden mit E-Mail an: users+unsubscribe@de.libreoffice.org
Probleme? https://de.libreoffice.org/hilfe-kontakt/mailing-listen/abmeldung-liste/
Tipps zu Listenmails: https://wiki.documentfoundation.org/Netiquette/de
Listenarchiv: https://listarchives.libreoffice.org/de/users/
Datenschutzerklärung: https://www.documentfoundation.org/privacy

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.