Date: prev next · Thread: first prev next last
2012 Archives by date, by thread · List index


Vanuit Libre Office rechtstreeks scannen werkt: (via invoegen-afbeelding) kun je
een scan in een (al of niet blanco) document opnemen.

Maar er moet wel een scanner-driver geïnstalleerd zijn.

Via OCR zul van de tekst ìn die afbeelding niet zo eenvoudig een goed bewerkbare
tekst kunnen maken.

De meest eenvoudige manier is:

A) Elk document kan (vanuit de scannersoftware, annex gebundeld OCR-pakket) of via een
afzonderlijk OCR-pakket, omgezet worden in platte tekst (.txt).

B) Dat bestand kun je in elke tekstverwerker inlezen en volledig naar wens bewerken.

Bijkomend voordeel (vind ik): het originele OCR-bestand (die .txt-file) heb je altijd
als back-up bewaard, mocht er bij het bewerken iets mis gaan.

Jan

Op 18-5-2012 11:29, Paul van der Vlis schreef:
Op 18-05-12 09:34, Aleidus Aalderink schreef:
Beste Libre-users,

Tot nu toe heb ik geprobeerd om documenten die in wil bewerken in te
scannen en dan na OCR bewerken. Zelfs het scannen van documenten in
Libre-office blijkt niet te werken. De scanner wordt wel herkend.
Mijn vermoeden is dat er nog software bij moet voor het verwerken van
tekst zoals OCR software.
Ik gebruik Libre-office in Ubuntu.
Wie heeft hier ervaringen mee en kan mij hierover tips geven.
Ik heb er geen ervaring mee, maar je hebt inderdaad OCR software nodig,
als je wat zoekt op "Linux OCR" zul je al snel van alles vinden zoals
GOCR, Ocrad en Tesseract.

Met het Linux programma Xsane kun je scannen, en ook een OCR programma
instellen zodat je gescande pagina geOCRred wordt. Of dat in LibreOffice
kan weet ik zo niet. Vroeger kon dit wel met StarOffice als ik me niet
vergis.

Het lijkt er op dat Tesseract (sinds kort eigendom van Google) het beste
is op opensource gebied op het moment, en dat Abbyy Finereader het beste
commerciele programma is. Maar ik heb ook goede dingen gelezen over het
Cuneiform (ontwikkeld door de Russische overheid).

Zowel Tesseract als Cuneiform ondersteunen ook het Nederlands als taal,
dat schijnt voor (sommige?) OCR's belangerijke te zijn.

http://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software

Groet,
Paul.



--
Unsubscribe instructions: E-mail to users+help@nl.libreoffice.org
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
List archive: http://listarchives.libreoffice.org/nl/users/
All messages sent to this list will be publicly archived and cannot be deleted

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.