CSV Datenprofilierer
Lade eine CSV hoch und erhalte sofort ein pro-Spalte-Profil: Typ, Ausfüllquote, unterschiedliche Werte, min / max und die häufigsten Werte.
Kurze Antwort: Lade eine CSV hoch und erhalte sofort ein pro-Spalte-Profil: Typ, Ausfüllquote, unterschiedliche Werte, min / max und die häufigsten Werte.
Zuletzt aktualisiert
Häufig gestellte Fragen
- Was sagt mir der Datenprofiler?
- Pro Spalte: der abgeleitete Typ (Zahl, Boolean, Datum, Zeichenfolge oder leer), wie viele Zellen ausgefüllt sind, wie viele leer sind, wie viele unterschiedliche Werte es gibt, das Minimum und Maximum für numerische Spalten und die drei häufigsten Werte mit Zählungen.
- Wie funktioniert die Typinferenz?
- Wir probieren bis zu 200 nicht-leere Werte pro Spalte. Eine Spalte wird als `Zahl` / `Boolean` / `Datum` typisiert, wenn ≥80% dieser Proben sauber analysiert werden; andernfalls fällt sie auf `Zeichenfolge` zurück. Die 80%-Schwelle toleriert ein paar abweichende Werte, ohne eine saubere Spalte falsch zu klassifizieren.
- Welche Datumsformate werden erkannt?
- ISO (YYYY-MM-DD), ISO-Schrägstrich (YYYY/MM/DD), `DD-Mon-YYYY` (z. B. `02-Jan-2026`) und ISO-Datetime (wir verwenden das Datumspräfix). Mehrdeutige Formate wie US/EU-Schrägstriche benötigen den speziellen Datums-Konverter.
- Wird meine CSV hochgeladen?
- Nein. Das gesamte Profil läuft in Ihrem Browser mit Papaparse — Ihre Daten erreichen niemals unseren Server.
- Warum ist die Füllrate nützlich?
- Leere Zellen sind ein wichtiges Indiz für optionale Felder, fehlerhafte Pipelines oder Fehler in vorhergehenden Filtern. Eine Spalte, die 100% gefüllt sein sollte, aber mit 87% profiliert wird, bedeutet fast immer, dass irgendwo Daten verloren gehen.
- Wie groß darf eine Datei sein, die ich profilieren kann?
- Hunderte von Tausenden von Zeilen werden normalerweise in wenigen Sekunden bearbeitet. Die Fußzeile zählt jede Zeile genau; nur das Typ-Sampling ist begrenzt (200 Proben pro Spalte).
- Warum kann die Anzahl der 'unterschiedlichen' Werte zu hoch erscheinen?
- Whitespace-Unterschiede und unterschiedliche Schreibweisen zählen als separate unterschiedliche Werte. Überprüfen Sie die Datei mit dem Cleaner unter aktivierter Option 'Whitespace trimmen' für eine ehrlichere Zählung.
- Was zeigt mir 'top values'?
- Die drei häufigsten nicht-leeren Zellwerte pro Spalte mit ihren Zählungen. Hervorragend zum Erkennen kategorischer Spalten und Ausreißer (z. B. eine Status-Spalte, die `bezahlt: 9.812 · ausstehend: 41 · bezahlt: 2` zeigt).
- Werden Minimum/Maximum für nicht-numerische Spalten angegeben?
- Nein — sie ergeben nur für numerische Spalten Sinn und werden überall sonst weggelassen.
- Kann ich das Profil als Bericht exportieren?
- Noch nicht. Kopieren Sie die Tabelle vorerst in ein Tabellenblatt; ein herunterladbarer Markdown-/PDF-Bericht steht auf der Roadmap.