Profil de données CSV
Déposez un CSV et obtenez un profil instantané par colonne : type, taux de remplissage, valeurs distinctes, min / max et les valeurs les plus courantes.
Réponse rapide: Déposez un CSV et obtenez un profil instantané par colonne : type, taux de remplissage, valeurs distinctes, min / max et les valeurs les plus courantes.
Dernière mise à jour
Questions fréquentes
- Que me dit le profilateur de données ?
- Par colonne : le type déduit (nombre, booléen, date, chaîne ou vide), combien de cellules sont remplies, combien sont vides, combien de valeurs distinctes, le min et le max pour les colonnes numériques, et les 3 valeurs les plus courantes avec leurs comptes.
- Comment fonctionne l'inférence du type ?
- Nous échantillonnons jusqu'à 200 valeurs non vides par colonne. Une colonne est typée `nombre` / `booléen` / `date` uniquement lorsque ≥80 % de ces échantillons se parsent correctement ; sinon, elle revient à `chaîne`. Le seuil de 80 % tolère quelques valeurs errantes sans classifier mal une colonne propre.
- Quels formats de date sont détectés ?
- ISO (YYYY-MM-DD), ISO slash (YYYY/MM/DD), `DD-Mon-YYYY` (ex. `02-Jan-2026`) et datetime ISO (nous utilisons le préfixe de date). Les formats ambigus comme les slashs US/EU nécessitent le convertisseur de date dédié.
- Mon CSV sera-t-il téléchargé ?
- Non. L'ensemble du profil s'exécute dans votre navigateur en utilisant Papaparse — vos données n'atteignent jamais notre serveur.
- Pourquoi le taux de remplissage est-il utile ?
- Les cellules vides sont un indicateur principal des champs optionnels, des canaux cassés ou des bogues de filtre en amont. Une colonne censée être remplie à 100 % mais affichant 87 % signifie presque toujours que des données sont perdues quelque part.
- Quelle taille de fichier puis-je profiler ?
- Des centaines de milliers de lignes se terminent généralement en quelques secondes. Le pied de page compte chaque ligne exactement ; seul l'échantillonnage de type est limité (200 échantillons par colonne).
- Pourquoi le compte 'distinct' pourrait-il sembler trop élevé ?
- Les différences d'espacement et les variantes de casse comptent comme des valeurs distinctes séparées. Faites passer le fichier par le Nettoyeur avec 'supprimer les espaces' activé pour un compte plus honnête.
- Que montre 'valeurs les plus courantes' ?
- Les trois valeurs de cellule non vides les plus courantes par colonne, avec leurs comptes. Excellent pour repérer les colonnes catégorielles et les valeurs aberrantes (par exemple, une colonne de statut montrant `payé : 9,812 · en attente : 41 · payé : 2`).
- Les min/max sont-ils affichés pour les colonnes non numériques ?
- Non — ils ont seulement du sens pour les colonnes numériques et sont omis ailleurs.
- Puis-je exporter le profil en tant que rapport ?
- Pas encore. Copiez le tableau dans une feuille pour l'instant ; un rapport téléchargeable en Markdown / PDF est prévu dans la feuille de route.