Perfilador de datos CSV
Suelta un CSV y obtiene un perfil instantáneo por columna: tipo, tasa de llenado, valores distintos, min / max y los valores más comunes.
Respuesta rápida: Suelta un CSV y obtiene un perfil instantáneo por columna: tipo, tasa de llenado, valores distintos, min / max y los valores más comunes.
Última actualización
Preguntas frecuentes
- ¿Qué me dice el perfilador de datos?
- Por columna: el tipo inferido (número, booleano, fecha, cadena o vacío), cuántas celdas están llenas, cuántas están vacías, cuántos valores distintos, el mínimo y máximo para columnas numéricas, y los 3 valores más comunes con sus conteos.
- ¿Cómo funciona la inferencia de tipo?
- Tomamos muestras de hasta 200 valores no vacíos por columna. Una columna se tipifica como `número` / `booleano` / `fecha` solo cuando ≥80% de esas muestras se analizan correctamente; de lo contrario, se considera `cadena`. El umbral del 80% tolera algunos valores erróneos sin clasificar incorrectamente una columna limpia.
- ¿Qué formatos de fecha se detectan?
- ISO (YYYY-MM-DD), ISO con barras (YYYY/MM/DD), `DD-Mon-YYYY` (por ejemplo, `02-Ene-2026`) y ISO datetime (usamos el prefijo de fecha). Los formatos ambiguos como las barras US/EU necesitan el convertidor de fechas dedicado.
- ¿Se subirá mi CSV?
- No. Todo el perfil se ejecuta en tu navegador usando Papaparse; tus datos nunca llegan a nuestro servidor.
- ¿Por qué es útil la tasa de llenado?
- Las celdas vacías son un indicador principal de campos opcionales, tuberías rotas o errores de filtro en la fuente. Una columna que se espera esté 100% llena pero se perfila al 87% casi siempre significa que los datos se están perdiendo en algún lugar.
- ¿Qué tan grande puede ser un archivo que puedo perfilar?
- Cientos de miles de filas generalmente terminan en unos segundos. El pie de página cuenta cada fila exactamente; solo el muestreo de tipos está limitado (200 muestras por columna).
- ¿Por qué puede parecer que el conteo de 'distintos' es demasiado alto?
- Las diferencias en espacios en blanco y variantes de mayúsculas cuentan como valores distintos separados. Ejecuta el archivo a través del Limpiador con 'recortar espacios en blanco' activado para obtener un conteo más honesto.
- ¿Qué me muestra 'valores principales'?
- Los tres valores de celdas no vacías más comunes por columna, con sus conteos. Excelente para detectar columnas categóricas y valores atípicos (por ejemplo, una columna de estado que muestra `pagado: 9,812 · pendiente: 41 · pagado: 2`).
- ¿Se muestran mínimos/máximos para columnas no numéricas?
- No; solo tienen sentido para columnas numéricas y se omiten en otros lugares.
- ¿Puedo exportar el perfil como un informe?
- Aún no. Copia la tabla en una hoja por ahora; un informe descargable en Markdown / PDF está en la hoja de ruta.