Date: prev next · Thread: first prev next last
2018 Archives by date, by thread · List index


Am 29.06.2018 um 19:47 schrieb Robert Großkopf:
Hallo Martin,

ich digitalisiere Bücher mithilfe von Tesseract-OCR; nach Erstellung der
Texte öffne ich diese mit Writer. Dabei werden die Umlaute und das ß
-bedingt durch die Dateierstellung in der Windows-Cmd- falsch dargestellt.

Die Dateien werden vermutlich nicht mit einem UTF-8-Zeichensatz erstellt
worden sein.

Kann sein, kann nicht sein; immerhin läuft Tesseract auf diversen
Betreibssystemen, wenn ich das richtig sehen. Ohne einen genaueren Blick
auf entweder das Programm oder das Produkt desselben sind wir auf dem
Gebiet der Spekulation.

Datei > Öffnen > Filter > Text | Textkodierung wählen

Jetzt werden nur die *.txt-Dateien angezeigt. Versuche einmal die
Kodierung "Westeuropäisch - Euro"

Falls das nicht zum gewünschten Ergebnis führen sollte, müsstest du mal
so ein Dokument im Original zur Verfügung stellen[1], damit wir genau
nachschauen können, wie die Kodierung tatsächlich ausschaut.

[1] bei dem Filesharing-Dienst deines geringsten Misstrauens hochladen,
und den Link dann hier posten

Wolfgang
-- 
Dank Donald Trump ist mir endgültig klar geworden: Es ist
nicht der Turm von Pisa, der schief steht, es ist die Welt!


-- 
Liste abmelden mit E-Mail an: users+unsubscribe@de.libreoffice.org
Probleme? https://de.libreoffice.org/hilfe-kontakt/mailing-listen/abmeldung-liste/
Tipps zu Listenmails: https://wiki.documentfoundation.org/Netiquette/de
Listenarchiv: https://listarchives.libreoffice.org/de/users/
Datenschutzerklärung: https://www.documentfoundation.org/privacy

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.