Bonjour,
Le 10/05/2021 à 16:27, Jean-Michel COSTE a écrit :
Le 10/05/2021 à 08:48, Nicolas Abel a écrit :
j'aurais besoin de*trouver les mots les plus fréquents* et de compter
le nombre d' occurrences.
Bonjour,
Si les chaînes de caractères contiennent plusieurs mots et Si tu ne sais
pas par avance quels mots chercher/compter, les expressions régulières
et les outils bash proposés par Bernard ne te seront d'aucun secours.
Et je ne vois pas d'outils simples pour réaliser ça....
Cordialement,
J'ai trouvé cela si tu utilises Linux (je ne sais pas s'il y a
l'équivalent de sed sous windows...) :
https://unix.stackexchange.com/questions/2244/how-do-i-count-the-number-of-occurrences-of-a-word-in-a-text-file-with-the-comma
C'est la quatrième réponse qui détaille la méthode.
Il faut extraite la colonne que tu veux analyser et la copier dans un
fichier .csv puis y appliquer la commande suivante en la collant dans un
terminal :
sed -e 's/[^[:alpha:]]/ /g' ton_fichier.csv | tr '\n' " " | tr -s " " |
tr " " '\n'| tr 'A-Z' 'a-z' | sort | uniq -c | sort -nr | nl
tu peut rediriger le résultat vers un fichier .txt en ajoutant à la fin
decompte.txt
Et ça marche...
Amicalement,
Jean-Pierre Giraud
--
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy
Context
- Re: [fr-users] Analyse sémantique d'un fichier csv ? (continued)
Privacy Policy |
Impressum (Legal Info) |
Copyright information: Unless otherwise specified, all text and images
on this website are licensed under the
Creative Commons Attribution-Share Alike 3.0 License.
This does not include the source code of LibreOffice, which is
licensed under the Mozilla Public License (
MPLv2).
"LibreOffice" and "The Document Foundation" are
registered trademarks of their corresponding registered owners or are
in actual use as trademarks in one or more countries. Their respective
logos and icons are also subject to international copyright laws. Use
thereof is explained in our
trademark policy.