Re: [fr-users] Convertir un pdf en calc

Ocleyr2lalune <cleyr.listes -AT- free.fr>
Fri, 04 Jul 2025 19:26:16 +0200

Bonjour 

votre méthode de départ est fastidieuse et effectivement cela peut venir d'une méconnaissance de 
Calc et de LibreOffice 

De façon historique Star Office (le grand-père de LibreOffice) avait un navigateur web. Il en a 
conservé quelques outils utiles :
Les documents dans Writer peuvent être enregistrés en html.
Les tables html peuvent être importées dans Calc jusqu'à proposer une actualisation reguliere du 
contenu.

Vous pouvez donc déjà simplement faire un copier coller du tableau d'une page web vers calc. En 
utilisant le collage special. Les options de menus sont différentes. Il vous suffit de les essayer. 
Il n'y en a pas tant que ça pour voir ce qui convient à votre besoin. 
Et puis il y a https://help.libreoffice.org/latest/fr/text/scalc/guide/webquery.html
Faites plusieurs essais là aussi. Ça peut être intéressant en première approche de choisir comme 
import "html_all" , plus qu'une table spécifique. Puis ensuite vous pouvez sélectionner un import 
plus précis. Cela vous donnera un import plus propre (juste parce qu'il n'y aura pas à aligner 
plusieurs tables sur une même colonne).

En résumé vous avez un contenu textuel/chiffre, donc des données que vous supprimez en faisant une 
capture pour faire ensuite de l'ocr et recuperer les données que vous aviez au départ. 
Au moins vous savez faire de l'ocr mais vous perdez du temps et de l'énergie.

N'hésitez pas a créer votre propre sujet pour que l'on vous guide sur cet usage (ou un autre lié à 
LibreOffice !) avec un lien vers une page dont vous voulez récupérer un tableau.

Enfin au risque de me répéter, sur la question de ce fil posée par Étienne, il est important de 
garder en tête que si LibreOffice ne fait pas d'OCR, il proposera l'édition (légère) de PDF dès 
lors qu'ils ne sont pas issus d'images (scan, capture). Ce que ne fait pas une visionneuse PDF, 
Okular compris. 

Toute solution qui passe par de l'OCR, est une analyse d'image. C'est donc comme si on exploitait 
le scan d'un fichier.
alors que le pdf, s'il est créé a partir d'un export d'un fichier bureautique contient des 
informations plus riches et directement exploitables. Or Étienne a précisé que les pdf provenaient 
d'un export depuis Excel. Cela devrait rendre l'OCR inutile. A moins que des protections 
supplémentaires aient ete ajoutées à la creation du PDF pour éviter la récupération du contenu.

(Oui ce message est long... Comme souvent, désolée)

Claire
⁣

Le 4 juil. 2025, 13:06, à 13:06, Pierre-Jean Raugel <pierrejeanraugel@gmail.com> a écrit:

Bonjour,

Pour ce qui me concerne, j'ai adopté la procédure suivante:

 * Traiter le pdf en OCR puissant,
     o Copier le tableau ligne à ligne dans Calc en utilisant Collage
       Spécial > Collage Spécial > Utiliser le dialogue d'importation
   (Collage Spécial > Collage Spécial peut être obtenu Ctrl + Maj + V)
   o Remplacer les points par des virgules dans le résultat du collage
     o Corriger manuellement les erreurs

A noter que j'ai essayé:

 * avec Chat GPT: le résultat était plutôt correct, mais la procédure
   était un peu plus lourde
 * avec Excel: je n'ai pas trouvé de procédure comparable à Collage
   Spécial > Collage Spécial > Utiliser le dialogue d'importation(mais
   je maîtrise moins bien Excel que Calc)

Précisions:

 * Je pars en fait de tableaux sur navigateur, que je copie avec
   capture d'écran, que j'enregistre en pdf.
 * Les procédures proposées ne m'ont pas semblé convaincantes:
     o Tabula n'a pas fonctionné après installation (sur Win 11)
     o Je n'ai pas compris comment utiliser Okular

Cordialement

Le 03/07/2025 à 11:53, Etienne a écrit :

Bonjour à tous,

C'est un fichier d'un de leurs fournisseurs créé avec excel et 
converti en pdf.

J'ai demandé à m fille qu'elle m'envoie le fichier tarif pour faire 
des essais de conversion.
J'essaierai aussi le copier coller mais sans grand espoir. En effet, 
il y a toujours des fioritures qui vont venir perturber le copier

coller.


En tout cas, merci pour vos réponses.
Cordialement,



Le 02/07/2025 à 18:13, Paul sur Wanadoo a écrit :

Bonjour

Je crois que la 1ère question à se poser porte sur le pdf à traiter.
Est-ce un fichier généré par un export vers PDF à partir d’une 
application bureautique ou autre, ou bien est-ce une simple image 
obtenue par un scanner par exemple ?

Si c’est un export PDF depuis une application, on peut au moins

faire

du copier-coller plus ou moins fastidieux entre les données du pdf

et

un fichier LibreOffice, mais la question du volume des données n’est

pas négligeable !

Cordialement

Paul AMIET
paul.amiet@wanadoo.fr
Ligne fixe sur box Internet 01 46 30 03 13
Afin de faciliter la lecture, je n'ai pas utilisé l'écriture 
inclusive. Il est donc entendu que derrière les noms masculins 
(éducateurs, salariés, bénévoles, tous, etc.), il peut y avoir aussi

bien des femmes que des hommes.
Si vous éprouvez une difficulté quelconque à lire ce message ou une 
de ses éventuelles pièces jointes, n'hésitez pas à me le signaler de

suite.

-- 
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour vous
désinscrire
Les archives de la liste sont disponibles à
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy


-- 
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy

Context

Re : Re : Re: [fr-users] Convertir un pdf en calc (continued)
- Re: [fr-users] Convertir un pdf en calc · jean-daniel dodin
- Re: [fr-users] Convertir un pdf en calc · C Fourcroy

Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.