Date: prev next · Thread: first prev next last
2020 Archives by date, by thread · List index


Bonjour ptilou,

je ne sais pas de quels moyens tu disposes pour traiter cela, mais en gros,
je pense que c'est "indexable" via script par exemple.
Ici tu parles de filtrer les avis favorables/défavorables.
Donc, on se base sur le mot "avis favorable" pour savoir ça ? Est-ce que
dans tous les documents, c'est orthographié de la même manière ?
Que veux-tu trouver exactement dans tous ces articles ?

Je pense qu'un outil de recherche textuel conviendrait pas mal (en séparant
les articles dans des documents différents - ce serait mieux).
Au boulot, nous utilisons pour l'instant Coveo qui est très puissant.
Un alternative gratuite serait peut-être lucene (d'apache) - pas encore
testé ça ;).

Pour établir un état des lieux en linux par exemple, un : grep -i -E
"^Titre :|^Administration :|^Référence :|^Séance du :"
<document-de-15000-lignes>
te donnerais déjà un résultat avec toutes les lignes "intéressantes" mais
après que peux-tu en faire ?

Yves

Le dim. 15 nov. 2020 à 11:39, philippe L <ptilou@gmail.com> a écrit :

Bonjour,

J'ai un kindle, et je ne sais pas au juste le nombre de documents, mais un
volume important (60 Go d'ecrit !)

J'ai un fichier texte formé de 1500 pages qui sont les décisions de la
CADA, et je me pose la question afin d'être exploitable, avec le kindle qui
n'est pas un chars d'assaut en matière de calcul, de faire une table des
matière en vue d'une meilleurs exploitation des documents ?

(c'est du droit !)
Voila la structure du fichier :
"Type : avis

Administration : ministre de la culture (direction des archives de France)


Référence : 20050311

Séance du : 20/01/2005

La commission d'accès aux documents administratifs a examiné la
demande d'avis citée en objet dans sa séance du 20 janvier 2005 et
portant sur la possibilité de communiquer à Monsieur M.A., à titre
dérogatoire, le dossier Pierre Stibbe, conservé par le centre
historique des archives nationales sous la cote F/7/15495, lequel ne
deviendra librement communicable, en vertu de l'article L.213-2 du
code du patrimoine, qu'en 2027.
La commission a tenu compte du sérieux du projet de recherche du
demandeur, qui rédige une thèse sur la doctrine juridique des
professeurs de droit face à la qualification juive sous le régime de
Vichy (1940-1944), et de l'intérêt incontestable que présente la
communication de ces documents dans le cadre de cette recherche. Elle
a relevé par ailleurs que les archives demandées se rapportaient à des
faits largement connus.
Elle a, en conséquence, émis un avis favorable à la communication à
titre dérogatoire desdits documents."


Je me demande comment constituer la table des matières de quatre
éléments, qui sont en titre, je me demande si c'est exploitable,
est-ce que c'est utile ?

est-ce que c'est pas mieux de chercher quelque chose qui créer des
abstraits ?

Et pour faire des abstracts je suppose qu'il faut soit un "site" de
référence, par exemple en matiére judiciaires la Cours de cassation,
mais pour d'autre décision, j'ai l'idée de chercher dans des résultat
de recherche, enfin je suis perdu si quelqu'un à des idées , elles
sont les bienvenue !

Par exemple pour le document cité, chercher les avis favorable, et
mettre à contrario les non -favorable !


--

ptilou

--
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour vous
désinscrire
Les archives de la liste sont disponibles à
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy



-- 
web site : http://www.molenbaix.com

-- 
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.