Eliminar filas duplicadas de datos en Excel

01 de 02

Elimina os rexistros de datos duplicados en Excel

Eliminar duplicados - Procurar rexistros idénticos por nome de campo. © Ted Francés

Os programas de folla de cálculo como Excel adoitan ser utilizados como bases de datos para cousas como inventarios de pezas, rexistros de vendas e listas de correo.

As bases de datos en Excel están compostas por táboas de datos que normalmente están organizadas en filas de datos chamados rexistros.

Nun rexistro, os datos de cada cela ou campo da liña están relacionados, como o nome, enderezo e número de teléfono dunha empresa.

Un problema común que se produce como unha base de datos crece en tamaño é o de rexistros duplicados ou filas de datos.

Esta duplicación pode ocorrer se:

De calquera xeito, os rexistros duplicados poden causar toda unha serie de problemas, como enviar varias copias de documentos á mesma persoa cando a información da base de datos se usa nunha combinación de correspondencia, polo que é unha boa idea buscar e eliminar rexistros duplicados de xeito regular base.

E aínda que é fácil elixir rexistros duplicados nunha pequena mostra como a da imaxe anterior, as táboas de datos poden conter facilmente centos, se non miles de rexistros, o que fai que sexa moi difícil elixir rexistros duplicados, especialmente os rexistros parcialmente coincidentes.

Para facilitar a realización desta tarefa, Excel ten unha ferramenta de datos integrada chamada, non sorprendente, Eliminar duplicados , que se pode usar para atopar e eliminar rexistros idénticos e parcialmente coincidentes.

Non obstante, a forma na que se deseña a ferramenta Eliminar duplicados , os rexistros coincidentes e coincidentes parcialmente deben tratarse por separado.

Isto ocorre porque o cuadro de diálogo Eliminar duplicados amosa os nomes de campo da táboa de datos seleccionados e escolle cales campos a incluír na busca de rexistros coincidentes:

Nomes de campo vs cartas de columnas

Como se mencionou, a ferramenta Eliminar duplicados consiste nunha caixa de diálogo onde escolle cales corresponden os campos a buscar marcando os nomes de campo ou columna desexados.

A información que mostra a caixa de diálogo - nomes de campo ou letras de columna - depende de se os datos conteñen unha fila de títulos ou encabezados na parte superior da táboa de datos como se ve na imaxe de arriba.

Se o fai - asegúrate de que a opción no lado dereito do cadro de diálogo - Os meus datos ten cabeceiras - está desmarcada e Excel mostrará os nomes nesta fila como nomes de campo na caixa de diálogo.

Se os seus datos non teñen unha fila de cabeceira, o cadro de diálogo amosará as letras correspondentes na caixa de diálogo para o intervalo de datos seleccionado.

Rango contiguo de datos

Para que a ferramenta Eliminar duplicados funcione correctamente, a táboa de datos debe ser un intervalo de datos contiguo; isto non debe ter ningunha fila baleira, columnas e, se é posible, non hai celas baleiras situadas dentro da táboa.

Non ter espazos en branco dentro dunha táboa de datos é unha boa práctica no que respecta á xestión de datos en xeral e non só á hora de buscar datos duplicados. As outras ferramentas de datos de Excel, como a clasificación e o filtrado, funcionan mellor cando a táboa de datos é un intervalo de datos contiguo.

Elimina o exemplo de rexistros de datos duplicados

Na imaxe de arriba, a táboa de datos contén dous rexistros idénticos para A. Thompson e dous rexistros parcialmente coincidentes para R. Holt - onde todos os campos coinciden, excepto o número do alumno.

Os pasos indicados a continuación detallan como usar a ferramenta de datos Eliminar duplicados para:

  1. Elimine o segundo de dous rexistros idénticos para A. Thompson.
  2. Elimina o segundo rexistro parcialmente coincidente para R. Holt.

Apertura do cuadro de diálogo Eliminar duplicados

  1. Fai clic en calquera cela que conteña datos na base de datos de mostra.
  2. Fai clic na pestana Datos na cinta.
  3. Faga clic na icona Eliminar duplicados para destacar todos os datos na táboa de datos e para abrir o cuadro de diálogo Eliminar duplicados .
  4. A caixa de diálogo Eliminar duplicados mostra todos os títulos das columnas ou os nomes de campo da nosa mostra de datos
  5. As marcas de verificación que se atopan xunto aos nomes de campo indican as columnas que Excel tratará de coincidir na busca de rexistros duplicados
  6. De xeito predeterminado, cando se abre a caixa de diálogo, todos os nomes de campo están desactivados

Atopar rexistros idénticos

  1. Xa que estamos a buscar rexistros completamente idénticos neste exemplo, deixaremos que todos os títulos da columna estean marcados
  2. Faga clic en Aceptar

Neste punto deberíanse ver os seguintes resultados:

02 de 02

Localice e elimine Rexistros parcialmente coincidentes con Eliminar duplicados

Eliminar duplicados - Procurar rexistros parcialmente coincidentes por nome de campo. © Ted Francés

Comprobando un campo á vez

Dado que Excel só elimina rexistros de datos que coinciden exactamente cos campos de datos seleccionados, a mellor forma de atopar todos os rexistros de datos parcialmente coincidentes é eliminar a marca de verificación dun só campo a un tempo, como se fai nos seguintes pasos.

As buscas posteriores de rexistros que coinciden en todos os campos excepto o nome, a idade ou o programa eliminarán todas as combinacións posibles para rexistros parcialmente coincidentes.

Atopando rexistros parcialmente coincidentes

  1. Fai clic en calquera cela que conteña datos na táboa de datos, se fose necesario
  2. Fai clic na pestana Datos na cinta .
  3. Faga clic na icona Eliminar duplicados para destacar todos os datos na táboa de datos e para abrir o cuadro de diálogo Eliminar duplicados .
  4. Todos os nomes de campo ou títulos de columna para a táboa de datos están seleccionados.
  5. Para buscar e eliminar rexistros que non teñen coincidencia en todos os campos, elimine a marca de verificación ademais dos nomes de campos que Excel ignore.
  6. Para este exemplo, prema na caixa de verificación que se atopa ao carón do título da columna ID do alumno para eliminar a marca de verificación.
  7. Excel agora só busca e elimina rexistros que teñen datos coincidentes nos campos Apelidos , Iniciais e Programas .
  8. Faga clic en Aceptar
  9. O cadro de diálogo debería pechar e ser substituído por unha mensaxe dicindo: 1 valores duplicados atopados e eliminados; Mantéñense 6 valores únicos.
  10. A fila que contén o segundo rexistro de R. Holt co ID de estudante de ST348-252 eliminaranse da base de datos.
  11. Faga clic en Aceptar para pechar a caixa de mensaxes

Neste punto, a táboa de datos de exemplo debería estar libre de todos os datos duplicados.