Verwijder dubbele rijen uit CSV
Verwijder duplicaten uit een CSV op basis van de hele rij of een enkele sleutelkolom. De overeenkomst behoudt de aanhalingstekens en respecteert het scheidingsteken.
Snel antwoord: Verwijder duplicaten uit een CSV op basis van de hele rij of een enkele sleutelkolom. De overeenkomst behoudt de aanhalingstekens en respecteert het scheidingsteken.
Laatst bijgewerkt
Veelgestelde vragen
- Hoe verwijder ik duplicaten uit een CSV op basis van de hele rij?
- Sleep het bestand en laat elke checkbox in het 'Match on' paneel uitgevinkt — dat standaard naar deduplicatie op basis van de hele rij en houdt elke unieke rij eenmaal. Schakel 'Whitespace-insensitive match' in als achtergebleven spaties niet meetellen.
- Hoe verwijder ik duplicaten op basis van één sleutelkolom (zoals email)?
- Vink die enkele kolom aan in het 'Match on' paneel. De eerste rij met elke unieke waarde wordt behouden; latere rijen met dezelfde waarde worden verwijderd, ook als hun andere kolommen verschillen.
- Welke rij wordt behouden wanneer er een duplicaat is?
- De eerste verschijning in het bestand. Als je de laatste registratie per sleutel wilt (bijv. de meest recente aankoop per klant), sorteer het bestand in omgekeerde volgorde voordat je dedupliseert, en sorteer het daarna opnieuw.
- Is de vergelijking hoofdlettergevoelig?
- Ja — `Ada` en `ada` worden als verschillende waarden behandeld. Gebruik de Vind & Vervang-tool met `^.*` regex om een kolom eerst naar kleine letters om te zetten als je een hoofdlettergevoelige vergelijking nodig hebt.
- Behoudt het gequote velden?
- Ja. Quoting, ingebedde komma's en nieuwe regels worden precies door de parser heen gerond.
- Zal mijn CSV worden geüpload?
- Nee. Deduplicatie vindt volledig in je browser plaats met Papaparse — er wordt niets naar onze server gestuurd.
- Kan ik dedupliceren op basis van meerdere sleutelkolommen?
- Ja. Het 'Match on' paneel laat je elke combinatie van kolommen aanvinken — laat ze allemaal uitgevinkt om te matchen op de hele rij, of vink (bijv.) `email` + `signup_date` aan om te dedupliceren op een samengestelde sleutel.
- Wat is het grootste bestand dat ik kan dedupliceren?
- Er is geen vaste limiet. Een bestand van een miljoen rijen dedupliceert meestal in een paar seconden; de limiet is het geheugen van je browser.
- Waarom werd een 'duplicaat' rij niet verwijderd?
- Bijna altijd vanwege een onzichtbaar verschil — achtergebleven spaties, een andere aanhalingstijl, of een Unicode-look-alike teken. Laat het bestand eerst door CSV File Cleaner draaien met 'trim whitespace' ingeschakeld.
- Behoudt deduplicatie de oorspronkelijke kolomvolgorde?
- Ja. Alleen rijen worden verwijderd; de header en kolomvolgorde blijven onaangetast.