Date: prev next · Thread: first prev next last
2019 Archives by date, by thread · List index


Hallo Ulrich,

die Quelle ist ein altes Buch, in dem erzwungener Blocksatz gesetzt worden ist.

da kann das OCR-Programm nicht erkennen, ob das Leezeichen vor dem Wort oder in dem Wort ist.

mit freundlichem Gruss

Martin

Am 03.07.2019 um 11:02 schrieb Ulrich Moser:
Hallo Martin,

das sehe ich auch so, es sei denn du wärest in der Lage die Korrektur
mit einer Rechtschreibprüfung zu koppeln. Das führt aber meines
Erachtens für eine reine Makroprogrammierung zu weit.. Die Frage ist ja
auch, wo kommen die fehlerhaften Texte her. Kann man da nicht an der
Quelle bereits ansetzen.

Viel Erfolg!

Ulrich

Am 03.07.19 um 10:48 schrieb Fritz Szekät:
Hallo Martin,

Am 03.07.2019 um 07:36 schrieb Martin Jenniges:

Nun habe ich einen Buchtext, der einen erzwungenen Blocksaatz
aufweist. Beim OCR kommen daher viele Wörter mit Leerzeichen drin
vor; diese Leerzeichen muss ich jetzt händisch entfernen.
ich befürchte - da die Leerzeichen in Worten vorkommen - dass da ohne
händisch gar nichts geht, weil:
Das Makro nicht wissen kann, ob es sich um einen reellen Leerraum oder
ein falschen Leerzeichen in einem Wort handelt.



--
Liste abmelden mit E-Mail an: users+unsubscribe@de.libreoffice.org
Probleme? https://de.libreoffice.org/hilfe-kontakt/mailing-listen/abmeldung-liste/
Tipps zu Listenmails: https://wiki.documentfoundation.org/Netiquette/de
Listenarchiv: https://listarchives.libreoffice.org/de/users/
Datenschutzerklärung: https://www.documentfoundation.org/privacy

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.