Supprimer les lignes dupliquées du CSV
Dédoublonnez un CSV par toute la ligne ou par une seule colonne clé. La correspondance préserve les guillemets et respecte le délimiteur.
Réponse rapide: Dédoublonnez un CSV par toute la ligne ou par une seule colonne clé. La correspondance préserve les guillemets et respecte le délimiteur.
Dernière mise à jour
Questions fréquentes
- Comment puis-je dédupliquer un CSV par la ligne entière ?
- Déposez le fichier et laissez toutes les cases à cocher dans le panneau 'Correspondre sur' décochées — cela par défaut utilisera la déduplication sur la ligne entière et conservera chaque ligne unique une fois. Activez 'Correspondance insensible aux espaces' si les espaces finaux ne doivent pas être pris en compte.
- Comment puis-je dédupliquer par une seule colonne clé (comme l'email) ?
- Cochez cette seule colonne dans le panneau 'Correspondre sur'. La première ligne contenant chaque valeur unique est conservée ; les lignes suivantes avec la même valeur sont supprimées, même si leurs autres colonnes diffèrent.
- Quelle ligne est conservée lorsqu'il y a un doublon ?
- La première occurrence dans le fichier. Si vous souhaitez le dernier enregistrement par clé (par exemple, le dernier achat par client), triez le fichier dans l'ordre inverse avant la déduplication, puis triez à nouveau après.
- La comparaison est-elle sensible à la casse ?
- Oui — `Ada` et `ada` sont traités comme des valeurs différentes. Utilisez l'outil Trouver & Remplacer avec `^.*` regex pour mettre en minuscules une colonne d'abord si vous avez besoin d'une correspondance insensible à la casse.
- Préserve-t-il les champs entre guillemets ?
- Oui. Le citation, les virgules intégrées et les nouvelles lignes transitent exactement par le parseur.
- Mon CSV sera-t-il téléchargé ?
- Non. La déduplication s'exécute entièrement dans votre navigateur en utilisant Papaparse — rien n'est envoyé à notre serveur.
- Puis-je dédupliquer par plusieurs colonnes clés ?
- Oui. Le panneau 'Correspondre sur' permet de cocher n'importe quelle combinaison de colonnes — laissez-les toutes décochées pour faire correspondre sur la ligne entière, ou cochez (par exemple) `email` + `date_inscription` pour dédupliquer sur une clé composite.
- Quel est le plus grand fichier que je peux dédupliquer ?
- Il n'y a pas de limite fixe. Un fichier d'un million de lignes se déduplique généralement en quelques secondes ; la limite est la mémoire de votre navigateur.
- Pourquoi une ligne 'dupliquée' n'a-t-elle pas été supprimée ?
- Presque toujours à cause d'une différence invisible — espace blanc final, un style de citation différent ou un caractère Unicode similaire. Exécutez le fichier avec le Nettoyeur de fichiers CSV avec 'couper les espaces' d'abord.
- La déduplication préserve-t-elle l'ordre original des colonnes ?
- Oui. Seules les lignes sont supprimées ; l'en-tête et l'ordre des colonnes restent intacts.