Date: prev next · Thread: first prev next last
2020 Archives by date, by thread · List index


Hallo Matthias,

Am Mon, 06 Jan 2020 12:18:49 +0100
schrieb Matthias Müller Posteo.de <matth_mueller_hbg@posteo.de>:
 
Das ist der Punkt. Die Textdaten müssen extrahiert werden, 

Nach Allem, was ich gelesen habe und auch hier diskutiert wurde, läuft
es (bis auf eine Ausnahme) wohl darauf hinaus - und das ufert leicht
aus. 

was einigermaßen komfortabel nur für ODT-Daten funktioniert und auch
nur hier automatisiert werden kann. 

Wobei mir nicht klar ist, wie dieser Schritt zzgl. die
Rückkonvertierung ins odt-Format für viele Dateien in einem Rutsch
möglich wäre (ich vermute: gar nicht).

Das ist vermutlich der einfachere Teil des Workflows. Word-Daten sind
komplett binär, das ist nix mit automatisch den Textteil extrahieren.
Erst nach dem Extrahieren ist es möglich mit einem Tool wie recode oä
zu konvertieren.

Ab hier wird es beliebig komplex.....

Eben. Ich aber kann mir solch einen Aufwand nicht ans Bein binden.

Diese Ausführlichkeit, hat einen einfachen Grund: Ich habe schon mit
solch einem Problem gekämpft und dann frustriert aufgegeben. Und das
waren bereits Textdaten, die allerdings von Windows nach Linux
transferiert wurden.

Au weia...

Falls du es doch versuchen willst, läuft das ganze auf Scripten raus. 
Werkzeuge mit denen du dann arbeiten müsstest wären
"gzip" / "gunzip" um die SO-/LO-Daten zu entpacken
"find" um sie zu finden und sie dann mit 
"mv" oder "cp" zu verschieben oder kopieren
Für das Ersetzen der seltsamen (eigentlich regulären Unicode-)
Zeichen kommen diverse Werkzeuge in Frage: "tr", "sed", "recode" und
wahrscheinlich noch ein paar.

s.o.: Scheitert am Aufwand. Der muss in Grenzen bleiben.

Aus meiner Sicht die einfachste Methode, allerdings auch die mit dem
meisten Stumpsinn (und deshalb durchaus fehleranfäälig):
Mit LO öffnen und über Suchen/ersetzen (eventl mit RegEx-Hilfe) die
Dateien einzeln zu bearbeiten. 

Ja, ist wohl die (handwerklich) einfachste, aber eben auch sehr
aufwändig, weil jede einzelne Datei bearbeitet werden muss. Insofern
scheint sich mit der hier vorgeschlagenem (und von mir als bereits
angewandt entdeckten) Makro-Variante das Ganze noch etwas komfortabler
zu gestalten. Offenbar gibt es kein Mittel, solch ein Makro über viele
Dateien auf einmal zu jagen.

Hilfreich wäre nun für mich ein Tipp, wie ich das vorhandene Makro um
weitere Zeichen aufstocke. Gibt es in der entsprechenden Maske dafür
Schalter, Buttons, o.ä.?

Danach sofort als PDF/A exportieren. PDF/A deshalb, weil es ein
ISO-genormtes Archivformat ist, siehe
https://de.wikipedia.org/wiki/PDF/A

Exportiert LO denn nicht in PDF/A?

Viele Grüße

Rainer

-- 
Liste abmelden mit E-Mail an: users+unsubscribe@de.libreoffice.org
Probleme? https://de.libreoffice.org/hilfe-kontakt/mailing-listen/abmeldung-liste/
Tipps zu Listenmails: https://wiki.documentfoundation.org/Netiquette/de
Listenarchiv: https://listarchives.libreoffice.org/de/users/
Datenschutzerklärung: https://www.documentfoundation.org/privacy

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.