Bonjour
votre méthode de départ est fastidieuse et effectivement cela peut venir d'une méconnaissance de
Calc et de LibreOffice
De façon historique Star Office (le grand-père de LibreOffice) avait un navigateur web. Il en a
conservé quelques outils utiles :
Les documents dans Writer peuvent être enregistrés en html.
Les tables html peuvent être importées dans Calc jusqu'à proposer une actualisation reguliere du
contenu.
Vous pouvez donc déjà simplement faire un copier coller du tableau d'une page web vers calc. En
utilisant le collage special. Les options de menus sont différentes. Il vous suffit de les essayer.
Il n'y en a pas tant que ça pour voir ce qui convient à votre besoin.
Et puis il y a https://help.libreoffice.org/latest/fr/text/scalc/guide/webquery.html
Faites plusieurs essais là aussi. Ça peut être intéressant en première approche de choisir comme
import "html_all" , plus qu'une table spécifique. Puis ensuite vous pouvez sélectionner un import
plus précis. Cela vous donnera un import plus propre (juste parce qu'il n'y aura pas à aligner
plusieurs tables sur une même colonne).
En résumé vous avez un contenu textuel/chiffre, donc des données que vous supprimez en faisant une
capture pour faire ensuite de l'ocr et recuperer les données que vous aviez au départ.
Au moins vous savez faire de l'ocr mais vous perdez du temps et de l'énergie.
N'hésitez pas a créer votre propre sujet pour que l'on vous guide sur cet usage (ou un autre lié à
LibreOffice !) avec un lien vers une page dont vous voulez récupérer un tableau.
Enfin au risque de me répéter, sur la question de ce fil posée par Étienne, il est important de
garder en tête que si LibreOffice ne fait pas d'OCR, il proposera l'édition (légère) de PDF dès
lors qu'ils ne sont pas issus d'images (scan, capture). Ce que ne fait pas une visionneuse PDF,
Okular compris.
Toute solution qui passe par de l'OCR, est une analyse d'image. C'est donc comme si on exploitait
le scan d'un fichier.
alors que le pdf, s'il est créé a partir d'un export d'un fichier bureautique contient des
informations plus riches et directement exploitables. Or Étienne a précisé que les pdf provenaient
d'un export depuis Excel. Cela devrait rendre l'OCR inutile. A moins que des protections
supplémentaires aient ete ajoutées à la creation du PDF pour éviter la récupération du contenu.
(Oui ce message est long... Comme souvent, désolée)
Claire
Le 4 juil. 2025, 13:06, à 13:06, Pierre-Jean Raugel <pierrejeanraugel@gmail.com> a écrit:
Bonjour,
Pour ce qui me concerne, j'ai adopté la procédure suivante:
* Traiter le pdf en OCR puissant,
o Copier le tableau ligne à ligne dans Calc en utilisant Collage
Spécial > Collage Spécial > Utiliser le dialogue d'importation
(Collage Spécial > Collage Spécial peut être obtenu Ctrl + Maj + V)
o Remplacer les points par des virgules dans le résultat du collage
o Corriger manuellement les erreurs
A noter que j'ai essayé:
* avec Chat GPT: le résultat était plutôt correct, mais la procédure
était un peu plus lourde
* avec Excel: je n'ai pas trouvé de procédure comparable à Collage
Spécial > Collage Spécial > Utiliser le dialogue d'importation(mais
je maîtrise moins bien Excel que Calc)
Précisions:
* Je pars en fait de tableaux sur navigateur, que je copie avec
capture d'écran, que j'enregistre en pdf.
* Les procédures proposées ne m'ont pas semblé convaincantes:
o Tabula n'a pas fonctionné après installation (sur Win 11)
o Je n'ai pas compris comment utiliser Okular
Cordialement
Le 03/07/2025 à 11:53, Etienne a écrit :
Bonjour à tous,
C'est un fichier d'un de leurs fournisseurs créé avec excel et
converti en pdf.
J'ai demandé à m fille qu'elle m'envoie le fichier tarif pour faire
des essais de conversion.
J'essaierai aussi le copier coller mais sans grand espoir. En effet,
il y a toujours des fioritures qui vont venir perturber le copier
coller.
En tout cas, merci pour vos réponses.
Cordialement,
Le 02/07/2025 à 18:13, Paul sur Wanadoo a écrit :
Bonjour
Je crois que la 1ère question à se poser porte sur le pdf à traiter.
Est-ce un fichier généré par un export vers PDF à partir d’une
application bureautique ou autre, ou bien est-ce une simple image
obtenue par un scanner par exemple ?
Si c’est un export PDF depuis une application, on peut au moins
faire
du copier-coller plus ou moins fastidieux entre les données du pdf
et
un fichier LibreOffice, mais la question du volume des données n’est
pas négligeable !
Cordialement
Paul AMIET
paul.amiet@wanadoo.fr
Ligne fixe sur box Internet 01 46 30 03 13
Afin de faciliter la lecture, je n'ai pas utilisé l'écriture
inclusive. Il est donc entendu que derrière les noms masculins
(éducateurs, salariés, bénévoles, tous, etc.), il peut y avoir aussi
bien des femmes que des hommes.
Si vous éprouvez une difficulté quelconque à lire ce message ou une
de ses éventuelles pièces jointes, n'hésitez pas à me le signaler de
suite.
--
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour vous
désinscrire
Les archives de la liste sont disponibles à
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy
--
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy
Context
- Re: *** SPAM *** Re: [fr-users] Convertir un pdf en calc (continued)
Privacy Policy |
Impressum (Legal Info) |
Copyright information: Unless otherwise specified, all text and images
on this website are licensed under the
Creative Commons Attribution-Share Alike 3.0 License.
This does not include the source code of LibreOffice, which is
licensed under the Mozilla Public License (
MPLv2).
"LibreOffice" and "The Document Foundation" are
registered trademarks of their corresponding registered owners or are
in actual use as trademarks in one or more countries. Their respective
logos and icons are also subject to international copyright laws. Use
thereof is explained in our
trademark policy.