Date: prev next · Thread: first prev next last
2019 Archives by date, by thread · List index


Bonjour Gilles

le pdf, comme son nom l'indique n'est pas un logiciel mais un format. Plus précisément c'est une image. Une image n'intègre pas des zones de textes à moins de faire de l'ocr (reconnaissance de caractères). Reste qu'on est d'accord sur l'ensemble. Le pdf a plusieurs générations (comme pour tout format comme ODF 1.1 et 1.2). Il est aussi relié à un standard avec plusieurs niveaux. Le PDF/A-1a étant le plus restrictif et le plus respectueux des normes d'accessibilité. Il ne tolère pas la transparence, est généré à partir de texte et doit permettre à un lecteur d'écran (pour mal-voyant par exemple) de lire le texte. De fait si un lecteur d'écran arrive à lire un texte, on passe un stade par rapport à un "pdf d'une image" (exemple à partir d'un scanner !).

Selon l'outil utilisé pour convertir le document texte en pdf, on peut choisir, ou non, de respecter un standard. Si celui-ci n'est pas ou mal respecté alors on arrive aux problèmes que j'évoquais vendredi. A savoir que selon le logiciel employé le comportement varie.

Comme je l'ai précisé hier, pour moi ce sujet est clos :
- LibreOffice n'est nullement en cause
- le comportement est satisfaisant hors du lecteur pdf intégré à Firefox.

J'avais déjà utilisé Calibre pour faire ce genre de chose, mais je n'y pensais plus. Le résultat est pas mal, mais je sais d'avance que même si c'est rudimentaire et simple, c'est déjà trop pour le public en question.... Alors oui, un pdf n'est pas fait pour ça (récupérer un texte par copier/coller), mais là on est du coté de ceux à qui on n'a pas demandé leur avis et qui doivent faire avec.

Comme je le disais déjà, j'en ai déduit que j'ai 2 solutions :
l'immédiate : expliquer aux militants de mon groupe qu'il faut ouvrir ce pdf en dehors de firefox (et ça déjà, vu mon échange d'aujourd'hui c'est pas gagné !)

la plus longue : convaincre ceux qui font ce pdf : soit au pire de le générer mieux, soit de revenir les pieds sur terre et de proposer un document éditable (odt idéalement, mais ce serait Byzance !)

Merci en tout cas. L'intérêt sur cette question montre à quel point nous pouvons être nombreux à butter dessus. Si déjà l'on arrivait à faire comprendre qu'un pdf est une image....

Bonne soirée

Claire

Le 03/02/2019 à 14:19, Gilles a écrit :

Bonjour

le 26 décembre dernier, à propos d'édition de pdf, j’indiquais (extraits) :

    le pdf est un logiciel de dessin vectoriel dont l'unité de travail
    est la page. Il positionne très précisément  le texte en x,y dans
    la page, en tenant compte de son encombrement exact (selon la
    police, le corps, la graisse...). Il ignore le contenu et des
    concepts de structuration comme titre, note, folio, titre
    courant... lui sont étrangers. Il ne "sait" pas qu'un mot est
    coupé en deux (césure) et que l'autre moitié est sur la ligne
    suivante (et pire, la page suivante).
    Il existe des outils pour éditer le pdf mais ils sont en général
    chers et ne peuvent s'affranchir des contraintes ci-dessus.

    Si on veut modifier le contenu il faut donc _exporter_ le pdf dans
    un format _modifiable_.

    [...]

    Si on veut récupérer le texte - plutôt pour une document long - et
    restructurer, refaire la mise en page, changer de police etc. il
    faut un outil spécialisé :

    [...]

    - une autre bonne solution est d'utiliser le logiciel Open-Source,
    en français, _Calibre_ [https://calibre-ebook.com/fr] (qui est un
    gestionnaire de bibliothèque d'e-books) qui dispose d'outils de
    conversion puissants - et paramétrables - entre autres depuis le
    pdf vers epub, docx, rtf, html, etc.
    On peut utiliser les réglages par défaut mais si on s'investit
    dans le paramétrage on peut obtenir des résultats excellents.
    Documentation ici : https://manual.calibre-ebook.com/fr/conversion.ht

Ça ne mange pas de pain d'essayer - rapidement et facilement avec les réglages par défaut -  d'autant plus que Calibre est un excellent logiciel de gestion de bibliothèque d'e-book qui va servir un jour ou l'autre.

Cordialement

Gilles

On 01/02/2019 21:44, Ocleyr2lalune wrote:

Bonjour à tous

je cherche une solution à la portée de tous, y compris des non technophiles permettant de contourner le problème suivant.

Vous connaissez Amnesty ? Sans faire un débat sur cette ONG, ils proposent d'envoyer des courriers de façon urgente, par exemple pour lutter contre la peine de mort. Décision en 2019, les modèles de lettre sont intégrés dans un document pdf, charge à la personne qui veut envoyer la lettre de copier le texte dans son traitement de texte préféré.

Exemple https://www.amnesty.org/fr/documents/asa17/9729/2019/fr/0

Oui mais voilà, un copier coller de la version française provoque dans Writer 6.1.4.2(Fedora 29) un saut de ligne au mieux tous les 2 mots.
Sur le pdf en anglais ou en espagnol, c'est bien plus gérable...

Les gens qui conçoivent le fichier en français sont probablement moins scrupuleux coté interopérabilité, standard pdf. J'essaierai aussi de faire avancer les choses de ce coté là mais c'est pas gagné !

Bref, si vous avez une idée ....

Merci bien

Claire



--
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.