Date: prev next · Thread: first prev next last
2014 Archives by date, by thread · List index


Bonsoir Philippe,

Le 17/12/2014 18:32, Philippe CLEMENT a écrit :

Le 17/12/2014 18:11, Bernard Ribot a écrit :
Bonjour Philippe,


Je l'avais essayé il y a longtemps et n'avais pas été convaincu, mais j'avoue ne plus me souvenir pour quelle(s) raison(s).

Ce que j'apprécie dans DocFetcher, outre sa rapidité et sa simplicité , c'est son langage de requête :
- support des opérateurs logiques : AND, OR, NOT,
- recherche d'expressions / phrases
- recherche de mots proches (à une certaine distance dans le texte) d'un mot donné
- recherche de mots similaires à un mot donné (recherche floue),
- support des caractères de substitution ? *
- rechercha dans certaines meta-don/nées : ///filename, title, author ou subject, sender, recipients pour les e-mails.

/Bernard

Bonsoir Bernard,

J'avais utilisé cet utilitaire pour recréer une GED (propriétaire) existante dans un service (sur un dossier réseau comprenant plusieurs Go de documents). L'avantage de Wilbur est qu'il est open source, d'une part, et d'autre part qu'il lit dans dans les fichiers compressés (zip, odt, ods etc.) à partir d'une requête et affiche un aperçu (txt) pour chaque résultat. Le fait que tu n'avais pas été convaincu résidait peut être dans le fait que nativment Wilbur ne lit pas dans les pdf ; pour cela il faut installer la petite extension pdftotext (à décompacter dans le répertoire d'installation de Wilbur)
http://philia.online.fr/wilbur/fiche_wilbur_fr.pdf

Amicalement,
Philippe

Pour en terminer avec ce presque hors-sujet :-) et pour information, voici la liste des formats que peut ouvrir DocFetcher :

 * AbiWord (abw, abw.gz, zabw)
 * EPUB (epub)
 * FLAC (flac)
 * HTML (htmi, htm, ..)
 * JPEG (jpg, jpeg)
 * HP3 (mp3)
 * MS Compiled HTML Help (chm)
 * MS Excel (xls)
 * MS Powerpoint (ppt)
 * MS Powerpoint 2007 (pptx, pptm)
 * MS Visio (vsd)
 * MS Word (doc)
 * MS Word 2007 (docx, docm)
 * OpenOffice.org Cale (ods, ots)
 * OpenOffice.org Draw (odg, otg)
 * OpenOffice.org Impress (odp, otp)
 * OpenOffice.org Writer (odt, ott)
 * PDF Document (pdf)
 * Rich Text Format (rtf)
 * Scalable Vector Graphics (svg)
 * Simple texte

Il affiche un aperçu en format texte, certains dans leur format d'origine, tel HTML. Pour les images il affiche les propriétés (dimensions, etc.). Je n'ai pas tout essayé (et pas tout indexé), seuls les documents ODF, MS, PDF et texte m'intéressant. Un bon point pour Wilbur en ce qui concerne les zip, DocFetcher a beaucoup de mal. Il y a aussi quelques problèmes avec les CHM. Je n'ai jamais pris le temps de remonter ces problèmes à l'éditeur.

Mais je vais réessayer Wilbur "un de ces quatre..." :-)

Bernard

--

Bernard Ribot
LibreOffice 4.3.5.1 / Windows 7 x86



--
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour savoir comment vous désinscrire
Les archives de la liste sont disponibles à http://listarchives.libreoffice.org/fr/users/
Tous les messages envoyés sur cette liste seront archivés publiquement et ne pourront pas être 
supprimés

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.