----- Mail original -----
De: "Nicolas Abel" <nicolas.abel1@ac-reunion.fr>
À: users@fr.libreoffice.org
Envoyé: Lundi 10 Mai 2021 08:48:58
Objet: [fr-users] Analyse sémantique d'un fichier csv ?
Bonjour à tous.
J'aurais besoin de faire une analyse sémantique d'un fichier csv.
Une colonne de ce fichier contient des chaînes de caractères;
j'aurais
besoin de trouver les mots les plus fréquents et de compter le nombre
d'
occurrences.
Je vais probablement pouvoir trouver un outil tierce qui sache le
faire;
mais je préférerais de loin pouvoir faire cela avec mon tableur
préféré.
J'imagine qu'il y a des solutions basées sur les expressions
régulières
par exemple; mais cela dépasse soit mon imagination, soit mes
compétences, soit les deux :)
Si vous avez des idées, je suis preneur.
En vous remerciant par avance pour votre aide.
Nicolas.
Bonjour,
J'ai continué à faire des recherches et voici ce qui existe :
https://www.rtextminer.com/index.html
https://www.opensemanticsearch.org/
attention, il faut bien nettoyer le fichier csv pour en extraire
les occurrences ...
le paquet deb à installer :
https://www.opensemanticsearch.org/download/
Merci pour votre aimable attention
Bien à vous
Bernard
--
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy
Context
Privacy Policy |
Impressum (Legal Info) |
Copyright information: Unless otherwise specified, all text and images
on this website are licensed under the
Creative Commons Attribution-Share Alike 3.0 License.
This does not include the source code of LibreOffice, which is
licensed under the Mozilla Public License (
MPLv2).
"LibreOffice" and "The Document Foundation" are
registered trademarks of their corresponding registered owners or are
in actual use as trademarks in one or more countries. Their respective
logos and icons are also subject to international copyright laws. Use
thereof is explained in our
trademark policy.