Question 1

Hoe verwijder ik duplicaten uit een CSV op basis van de hele rij?

Accepted Answer

Sleep het bestand en laat elke checkbox in het 'Match on' paneel uitgevinkt — dat standaard naar deduplicatie op basis van de hele rij en houdt elke unieke rij eenmaal. Schakel 'Whitespace-insensitive match' in als achtergebleven spaties niet meetellen.

Question 2

Hoe verwijder ik duplicaten op basis van één sleutelkolom (zoals email)?

Accepted Answer

Vink die enkele kolom aan in het 'Match on' paneel. De eerste rij met elke unieke waarde wordt behouden; latere rijen met dezelfde waarde worden verwijderd, ook als hun andere kolommen verschillen.

Question 3

Welke rij wordt behouden wanneer er een duplicaat is?

Accepted Answer

De eerste verschijning in het bestand. Als je de laatste registratie per sleutel wilt (bijv. de meest recente aankoop per klant), sorteer het bestand in omgekeerde volgorde voordat je dedupliseert, en sorteer het daarna opnieuw.

Question 4

Is de vergelijking hoofdlettergevoelig?

Accepted Answer

Ja — `Ada` en `ada` worden als verschillende waarden behandeld. Gebruik de Vind & Vervang-tool met `^.*` regex om een kolom eerst naar kleine letters om te zetten als je een hoofdlettergevoelige vergelijking nodig hebt.

Question 5

Behoudt het gequote velden?

Accepted Answer

Ja. Quoting, ingebedde komma's en nieuwe regels worden precies door de parser heen gerond.

Question 6

Zal mijn CSV worden geüpload?

Accepted Answer

Nee. Deduplicatie vindt volledig in je browser plaats met Papaparse — er wordt niets naar onze server gestuurd.

Question 7

Kan ik dedupliceren op basis van meerdere sleutelkolommen?

Accepted Answer

Ja. Het 'Match on' paneel laat je elke combinatie van kolommen aanvinken — laat ze allemaal uitgevinkt om te matchen op de hele rij, of vink (bijv.) `email` + `signup_date` aan om te dedupliceren op een samengestelde sleutel.

Question 8

Wat is het grootste bestand dat ik kan dedupliceren?

Accepted Answer

Er is geen vaste limiet. Een bestand van een miljoen rijen dedupliceert meestal in een paar seconden; de limiet is het geheugen van je browser.

Question 9

Waarom werd een 'duplicaat' rij niet verwijderd?

Accepted Answer

Bijna altijd vanwege een onzichtbaar verschil — achtergebleven spaties, een andere aanhalingstijl, of een Unicode-look-alike teken. Laat het bestand eerst door CSV File Cleaner draaien met 'trim whitespace' ingeschakeld.

Question 10

Behoudt deduplicatie de oorspronkelijke kolomvolgorde?

Accepted Answer

Ja. Alleen rijen worden verwijderd; de header en kolomvolgorde blijven onaangetast.