Bonjour,
le tableur n'est pas le meilleur outil pour cela,
awk/gawk/powershell peuvent à mon avis le faire très facilement :
sous ubuntu wsl (avec win100) si ton fichier s'appelle test.csv et si ton
délimiteur de mot est un ou plusieurs espaces :
gawk '{a[$0]++} END{for (k in a) print k,a[k]}' RS='[[:space:]]+' test.csv
te donneras ce que tu souhaites.
En fait, il faut créer une "collection" ou table hash avec comme index les
mots trouvés et tu additionnes la valeur.
Yves
Le lun. 10 mai 2021 à 09:00, Nicolas Abel <nicolas.abel1@ac-reunion.fr> a
écrit :
Bonjour à tous.
J'aurais besoin de faire une analyse sémantique d'un fichier csv.
Une colonne de ce fichier contient des chaînes de caractères; j'aurais
besoin de trouver les mots les plus fréquents et de compter le nombre d'
occurrences.
Je vais probablement pouvoir trouver un outil tierce qui sache le faire;
mais je préférerais de loin pouvoir faire cela avec mon tableur préféré.
J'imagine qu'il y a des solutions basées sur les expressions régulières
par exemple; mais cela dépasse soit mon imagination, soit mes
compétences, soit les deux :)
Si vous avez des idées, je suis preneur.
En vous remerciant par avance pour votre aide.
Nicolas.
--
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour vous
désinscrire
Les archives de la liste sont disponibles à
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy
--
web site : http://www.molenbaix.com
--
Envoyez un mail à users+unsubscribe@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy
Context
- Re: [fr-users] Analyse sémantique d'un fichier csv ? (continued)
Privacy Policy |
Impressum (Legal Info) |
Copyright information: Unless otherwise specified, all text and images
on this website are licensed under the
Creative Commons Attribution-Share Alike 3.0 License.
This does not include the source code of LibreOffice, which is
licensed under the Mozilla Public License (
MPLv2).
"LibreOffice" and "The Document Foundation" are
registered trademarks of their corresponding registered owners or are
in actual use as trademarks in one or more countries. Their respective
logos and icons are also subject to international copyright laws. Use
thereof is explained in our
trademark policy.