Eliminar filas duplicadas de CSV
Elimina duplicados de un CSV por toda la fila o por una sola columna clave. La coincidencia preserva las comillas y respeta el delimitador.
Respuesta rápida: Elimina duplicados de un CSV por toda la fila o por una sola columna clave. La coincidencia preserva las comillas y respeta el delimitador.
Última actualización
Preguntas frecuentes
- ¿Cómo elimino duplicados en un CSV por toda la fila?
- Suelta el archivo y deja todas las casillas de verificación en el panel 'Coincidir en' desmarcadas: eso por defecto elimina duplicados por toda la fila y mantiene cada fila única una vez. Activa 'Coincidencia insensible a espacios en blanco' si los espacios en blanco finales no deben contarse.
- ¿Cómo elimino duplicados por una columna clave (como correo electrónico)?
- Marca esa única columna en el panel 'Coincidir en'. Se conserva la primera fila que contenga cada valor único; las filas posteriores con el mismo valor se eliminan, incluso si sus otras columnas difieren.
- ¿Qué fila se conserva cuando hay un duplicado?
- La primera ocurrencia en el archivo. Si deseas el registro más reciente por clave (por ejemplo, la compra más reciente por cliente), ordena el archivo en orden inverso antes de eliminar duplicados, y luego vuelve a ordenar después.
- ¿La comparación es sensible a mayúsculas?
- Sí: `Ada` y `ada` se tratan como valores diferentes. Usa la herramienta Buscar y Reemplazar con `^.*` regex para convertir a minúsculas una columna primero si necesitas coincidencias que no distingan entre mayúsculas.
- ¿Preserva los campos entre comillas?
- Sí. Las comillas, comas incrustadas y saltos de línea se mantienen exactamente a través del analizador.
- ¿Se subirá mi CSV?
- No. La eliminación de duplicados ocurre completamente en tu navegador usando Papaparse: nada se envía a nuestro servidor.
- ¿Puedo eliminar duplicados por múltiples columnas clave?
- Sí. El panel 'Coincidir en' te permite marcar cualquier combinación de columnas: déjalas todas desmarcadas para coincidir en toda la fila, o marca (por ejemplo) `email` + `signup_date` para eliminar duplicados en una clave compuesta.
- ¿Cuál es el archivo más grande que puedo limpiar?
- No hay un límite fijo. Un archivo de un millón de filas generalmente se limpia en un par de segundos; el límite es la memoria de tu navegador.
- ¿Por qué no se eliminó una fila 'duplicada'?
- Casi siempre debido a una diferencia invisible: espacio en blanco final, un estilo de comillas diferente o un carácter Unicode similar. Pasa el archivo a través de CSV File Cleaner con 'eliminar espacios en blanco' activado primero.
- ¿La eliminación de duplicados preserva el orden original de las columnas?
- Sí. Solo se eliminan filas; el encabezado y el orden de las columnas permanecen intactos.