Doppelte Zeilen aus CSV entfernen
Entferne Duplikate in einer CSV entweder durch die gesamte Zeile oder durch eine einzelne Schlüsselspalte. Der Vergleich bewahrt die Anführungszeichen und respektiert das Trennzeichen.
Kurze Antwort: Entferne Duplikate in einer CSV entweder durch die gesamte Zeile oder durch eine einzelne Schlüsselspalte. Der Vergleich bewahrt die Anführungszeichen und respektiert das Trennzeichen.
Zuletzt aktualisiert
Häufig gestellte Fragen
- Wie de-dupliziere ich eine CSV nach der gesamten Zeile?
- Ziehen Sie die Datei und lassen Sie jedes Kontrollkästchen im 'Match on'-Panel deaktiviert — das standardisiert die De-Duplikation nach der gesamten Zeile und behält jede einzigartige Zeile einmal bei. Aktivieren Sie 'Whitespace-insensitive match', falls nachfolgende Leerzeichen nicht zählen sollen.
- Wie de-dupliziere ich nach einer Schlüsselspalte (wie E-Mail)?
- Aktivieren Sie diese einzelne Spalte im 'Match on'-Panel. Die erste Zeile mit jedem eindeutigen Wert wird beibehalten; spätere Zeilen mit dem gleichen Wert werden entfernt, selbst wenn ihre anderen Spalten unterschiedlich sind.
- Welche Zeile wird beibehalten, wenn es eine Duplikation gibt?
- Die erste Vorkommen in der Datei. Wenn Sie den neuesten Datensatz pro Schlüssel möchten (z. B. den letzten Kauf pro Kunde), sortieren Sie die Datei in umgekehrter Reihenfolge, bevor Sie de-duplizieren, und sortieren Sie danach erneut.
- Ist der Vergleich groß-/kleinschreibungssensitiv?
- Ja — `Ada` und `ada` werden als unterschiedliche Werte behandelt. Verwenden Sie das Such- & Ersetzungswerkzeug mit `^.*` Regex, um eine Spalte zuerst in Kleinbuchstaben zu konvertieren, falls Sie eine Groß-/Kleinschreibung ignorierende Übereinstimmung benötigen.
- Bewahrt es zitierte Felder?
- Ja. Zitate, eingebettete Kommas und Zeilenumbrüche werden exakt durch den Parser umgewandelt.
- Wird meine CSV hochgeladen?
- Nein. Die De-Duplikation läuft vollständig in Ihrem Browser unter Verwendung von Papaparse — nichts wird an unseren Server gesendet.
- Kann ich nach mehreren Schlüsselspalten deduplikieren?
- Ja. Das 'Match on'-Panel ermöglicht es Ihnen, jede Kombination von Spalten zu aktivieren — lassen Sie sie alle deaktiviert, um nach der gesamten Zeile zu vergleichen, oder aktivieren Sie z. B. `email` + `signup_date`, um nach einem zusammengesetzten Schlüssel zu deduplizieren.
- Was ist die größte Datei, die ich deduplizieren kann?
- Es gibt keine feste Grenze. Eine Million-Zeilen-Datei wird normalerweise innerhalb von wenigen Sekunden dedupliziert; die Grenze ist der Speicher Ihres Browsers.
- Warum wurde eine 'Duplikat'-Zeile nicht entfernt?
- Fast immer aufgrund eines unsichtbaren Unterschieds — nachfolgende Leerzeichen, ein anderer Zitierstil oder ein Unicode-Aussehen wie Zeichen. Lassen Sie die Datei zuerst mit CSV File Cleaner und aktivierter 'Whitespace entfernen'-Option durchlaufen.
- Bewahrt die De-Duplikation die ursprüngliche Spaltenreihenfolge?
- Ja. Nur Zeilen werden entfernt; der Header und die Spaltenreihenfolge bleiben unverändert.