J'ai à traiter un très gros fichier (près de 100 000 lignes) Calc. Ce
fichier comporte, par enregistrement, le nom du titulaire d'un IBAN,
l'IBAN,
et la somme virée sur le compte.
Sans surprise, je peux avoir plusieurs centaines de virements sur un
même
IBAN. C'est ce qui explique la taille du fichier. J'ai aussi
différents noms
de titulaires pour un même IBAN (ex : Carrefour 29, SA Carrefour,
Carrefour
Brest...)
Sachant que la colonne des montants virés ne m'intéresse pas, comment me
serait-il possible de n'avoir face à chaque IBAN qu'un seul
exemplaire de
chaque titulaire ?
Le fichier se présente aujourd'hui comme suit :
titulaire1 IBAN1
ligne répétée de nombreuses fois puis
titulaire2 IBAN1
ligne à nouveau répétée puis
titulaire A IBAN A
ligne elle aussi répétée 10, 100, 200 fois !
titulaire B IBAN A
idem pour la répétition
etc...
je voudrais n'avoir que
titulaire1 IBAN1
titulaire2 IBAN1
titulaire A IBAN A
titulaire B IBAN A
Je suis parti d'un fichier csv avec 3 colonnes : titulaire, IBAN et
virements (environ 100 000 lignes !) Puis j'ai utilisés avec Calc les
sous-totaux où l'IBAN est le point de regroupement et on compte les
titulaires. Comme dit plus haut, je n'ai aucun souci à perdre la colonne
virement.