CSV Data Profiler
Drop een CSV en krijg direct een profiel per kolom: type, vulgraad, unieke waarden, min / max en de meest voorkomende waarden.
Snel antwoord: Drop een CSV en krijg direct een profiel per kolom: type, vulgraad, unieke waarden, min / max en de meest voorkomende waarden.
Laatst bijgewerkt
Veelgestelde vragen
- Wat vertelt de gegevensprofiler me?
- Per kolom: het afgeleide type (getal, boolean, datum, string of leeg), hoeveel cellen zijn ingevuld, hoeveel zijn leeg, hoeveel onderscheidende waarden, de min en max voor numerieke kolommen, en de top-3 meest voorkomende waarden met tellingen.
- Hoe werkt type-inferentie?
- We nemen tot 200 niet-lege waarden per kolom. Een kolom wordt getypeerd als `getal` / `boolean` / `datum` alleen wanneer ≥80% van die monsters schoon kan worden geparsed; anders valt het terug naar `string`. De drempel van 80% tolereert een paar afwijkende waarden zonder een schone kolom verkeerd te classificeren.
- Welke datumformaten worden gedetecteerd?
- ISO (YYYY-MM-DD), ISO-slash (YYYY/MM/DD), `DD-Mon-YYYY` (bijv. `02-Jan-2026`) en ISO datetime (we gebruiken de datumvoorvoegsel). Ambigue formaten zoals de Amerikaanse/EU-slashes hebben de speciale datumconversie nodig.
- Wordt mijn CSV geüpload?
- Nee. Het hele profiel draait in je browser met behulp van Papaparse — je gegevens bereiken onze server nooit.
- Waarom is de invullingsgraad nuttig?
- Lege cellen zijn een belangrijke indicator van optionele velden, gebroken pijplijnen of upstream-filterbugs. Een kolom die 100% ingevuld zou moeten zijn maar bij de profilering op 87% staat, betekent bijna altijd dat er ergens gegevens worden verloren.
- Hoe groot mag een bestand zijn dat ik kan profileren?
- Honderdduizenden rijen worden meestal binnen enkele seconden verwerkt. De voettekst telt elke rij precies; alleen type-sampling is begrensd (200 monsters per kolom).
- Waarom lijkt de 'distinct' telling te hoog?
- Witruimtedifferentiën en varianten in hoofdletters tellen als afzonderlijke onderscheidende waarden. Voer het bestand door de Cleaner met 'witruimtes trimmen' ingeschakeld voor een eerlijkere telling.
- Wat laat 'topwaarden' me zien?
- De drie meest voorkomende niet-lege celwaarden per kolom, met hun tellingen. Uitstekend voor het opsporen van categorische kolommen en uitschieters (bijv. een statuskolom die `betaald: 9.812 · in afwachting: 41 · betaald: 2` toont).
- Worden min/max getoond voor niet-numerieke kolommen?
- Nee — ze zijn alleen zinvol voor numerieke kolommen en worden overal elders weggelaten.
- Kan ik het profiel als een rapport exporteren?
- Nog niet. Kopieer de tabel voorlopig in een sheet; een downloadbaar Markdown / PDF-rapport staat op de roadmap.