La función COUNTIF y la función de limpieza de datos son las dos formas más sencillas de encontrar duplicados en Hojas de cálculo de Google.

Acerca de Google Sheets

Hojas de cálculo de Google es una aplicación gratuita de hojas de cálculo basada en la nube que ofrece Google como parte de su completa suite ofimática para competir con Microsoft Office. Google Sheets puede preparar datos, realizar cálculos y mucho más.

Se utiliza para modificar, organizar y almacenar datos. El paquete de productividad Google Docs incorpora este programa, compuesto por Google Drive, Google Sheets y Google Slides.

Sin embargo, una de las ventajas de Google Sheets es que, a diferencia de Excel, puede utilizarse en colaboración en tiempo real con otros usuarios.

Google Sheets ha simplificado la creación de bases de datos al ofrecer una interfaz fácil de usar y herramientas prácticas para organizar los datos.

Utilizar Google Sheets puede aumentar la productividad y ahorrar tiempo. Los usuarios ya no se preocupan por perder datos cruciales o sobrescribir archivos involuntariamente porque el marco de trabajo está basado en la nube.

Uno de los programas de hojas de cálculo y bases de datos más utilizados es Google Sheets, accesible en todos los sistemas operativos móviles y de escritorio más populares.

¿Cómo ayudan las Hojas de Google a crear bases de datos de forma más sencilla?

Tradicionalmente, la creación de bases de datos ha sido una operación ardua y lenta. Sin embargo, los recientes avances tecnológicos, en particular las Hojas de cálculo de Google, han simplificado enormemente este procedimiento. Además, el programa cuenta con muchas capacidades, como la posibilidad de añadir gráficos, fórmulas e imágenes.

Para la gestión y el almacenamiento de datos en tiempo real, la mayoría de las empresas lo utilizan en lugar de otras costosas bases de datos como PostgreSQL, MySQL, SQL Server, etc. La mayoría de los pequeños conjuntos de datos prefieren las hojas de Google como alternativa.

Las hojas de Google no son un sistema integral de gestión de bases de datos para su empresa. Sin embargo, a diferencia de otros sistemas de gestión de bases de datos, funciona a las mil maravillas para que las pequeñas empresas y proyectos gestionen eficazmente las operaciones financieras de su firma.

Es importante destacar que tiene varias capacidades sofisticadas que son accesibles de forma gratuita, como Google Sheets API, Apps script, Form triggers, Timed triggers e ImportXML.

Los usuarios del script para aplicaciones pueden conectarse a diferentes bases de datos porque el script para aplicaciones incluye un servicio JDBC para conectarse a MySQL, Microsoft SQL Server y otras bases de datos.

Las empresas pueden reducir sus gastos en diversos productos de sistemas de gestión de datos utilizando todas sus capacidades.

Ahora, hablemos del impacto de los valores duplicados en la base de datos.

Impacto de los valores duplicados en la base de datos

Si los datos se utilizan con fines analíticos o de elaboración de informes, los valores duplicados en una base de datos podrían afectar negativamente a los datos.

En raras circunstancias, los valores duplicados podrían sesgar los datos, lo que puede dar lugar a inferencias inexactas a partir de los datos. En otros casos, los valores duplicados pueden hacer que los datos sean más difíciles de utilizar y comprender.

En cualquiera de los casos, es fundamental conocer los efectos potenciales de los valores duplicados en una base de datos y tomar precauciones para evitarlos o atenuarlos.

Resaltar duplicados en Google Sheets en una sola columna

En esta sección se examinarán los métodos para llamar la atención sobre los datos duplicados en las hojas de cálculo de Google y para eliminarlos.

La fórmula común utilizada para resaltar duplicados es

=COUNTIF(rango, criterio)

A continuación le indicamos paso a paso cómo utilizar esta fórmula en las hojas de cálculo de Google.

Vaya a la opción «Formato» del menú superior y desplácese hasta «Formato condicional», como se muestra a continuación.

formatmenu

Las nuevas opciones de formato condicional aparecerán en la parte derecha después de hacer clic en el botón de formato condicional, como se ve a continuación:

countifformula

Tras definir el rango de celdas en el que desea resaltar los duplicados, desplácese hacia abajo hasta la sección Reglas de formato y elija la opción «Fórmula personalizada es» del menú desplegable, como se muestra en el ejemplo anterior.

En este campo, introduzca la fórmula

=COUNTIF($G$6:$G$14,G6)>1

La celda G debe sustituirse por la columna adecuada en función de su necesidad de resaltar la duplicación.

Tras pulsar el botón de hecho, se resaltarán los duplicados de la columna, como se ve en la imagen superior.

duplicatehighlights

A través de la configuración del estilo de formato, como se ilustra a continuación, puede cambiar el color de resaltado u otras opciones de formato:

highlightformatting

Hemos visto cómo resaltar los duplicados de una sola columna en el ejemplo anterior.

En la sección siguiente, veremos cómo resaltar duplicados de varias columnas.

Resaltar duplicados en Google Sheets en múltiples columnas

Todas las fases de este proceso serán las mismas que las comentadas anteriormente, excepto la fórmula y el rango de celdas que definamos para resaltar los duplicados.

Para comprenderlo mejor, utilicemos un ejemplo.

Vaya a la opción «Formato condicional» del menú de navegación «Formato» para ejecutar la fórmula. Las opciones serán visibles en el lado derecho, como se ilustra en la imagen inferior.

En la sección «Aplicar a rango» se especifica un rango de celdas

En la sección «Reglas de formato», la fórmula utilizada para resaltar los duplicados de varias columnas es

=COUNTIF($F$6:$I$8,F6)>1

Es una fórmula muy sencilla y fácil de implementar. La fórmula sólo contiene un rango de celdas a partir del cual tenemos que identificar los duplicados.

Tras ejecutar esta fórmula, se resaltan los duplicados de cuatro columnas, como se ve en el ejemplo siguiente.

En esta ilustración, también hemos cambiado el color de resaltado a azul.

multiplecolumn

Examinaremos cómo resaltar los datos duplicados de las filas en la siguiente sección.

Resaltar duplicados en las filas de las hojas de cálculo de Google

En una hoja de cálculo de Google, identificar filas de datos duplicados es un poco diferente a resaltar columnas duplicadas.

No repetiremos todos los pasos ya que son todos iguales excepto la fórmula.

Pongamos un ejemplo.

El rango de celdas a partir del cual desea resaltar los duplicados aparece en la parte «Aplicar a rango» de las opciones de formato condicional, como se muestra en la imagen siguiente.

En la sección «Fórmula personalizada es», la fórmula introducida es

=COUNTIF(ARRAYFORMULA($A$3:$A$10&$B$3:$B$10&$C$3:$C$10),$A3&$B3&$C3)>1

Tenga en cuenta que, aunque la fórmula parece complicada, consiste en los números de celda inicial y final de las filas en las que desea resaltar los duplicados.

El resultado se mostrará como se indica a continuación después de ejecutar esta fórmula.

En esta ilustración, también se modifica el color de resaltado, lo que es posible en la misma parte del menú de estilos de formato que cuando se resaltan columnas duplicadas.

duplicaterows

Resaltar duplicados en Hojas de cálculo de Google por criterios específicos

Si desea resaltar los duplicados en función de criterios específicos, debe utilizar el operador estrella («*») para indicar a la función COUNTIF que vincule los dos rangos definidos y muestre el resultado.

La sintaxis de la fórmula para llevar a cabo la condición anterior sería

=(COUNTIF(Rango,Criterios)>1) * (Nueva condición) )

Pongamos un ejemplo para entenderlo.

Criterios: Supongamos que desea resaltar todas las filas duplicadas de la base de datos dejando intactas las primeras entradas de las filas duplicadas.

Veamos cómo hacerlo en una hoja de Google. Excepto por el cambio de fórmula, todas las etapas son las mismas que las explicadas anteriormente en los otros enfoques, así que entremos directamente en materia.

La fórmula para ejecutar los criterios arriba indicados es la siguiente

=COUNTIF(ArrayFormula($A$3:$A3&$B$3:$B3&$C$3:$C3),$A3&$B3&$C3)>1

La fórmula, aparentemente complicada y larga, implica el inicio y el final de los números de las celdas.

La hoja de Google que aparece a continuación muestra que se omiten las primeras entradas Manzana y Naranja, y se resaltan las últimas.

duplicatewithcriteria

Hasta ahora hemos visto cómo resaltar datos duplicados en filas, columnas y con criterios específicos.

En la siguiente sección exploraremos rápidamente cómo eliminar datos duplicados utilizando atajos.

Atajo para eliminar duplicados

Elija la base de datos o la columna cuyos registros duplicados desee eliminar, seleccione «Limpieza de datos» en el menú de la parte superior, desplácese hasta «Eliminar duplicados» y haga clic en Aceptar, como se muestra en la imagen siguiente.

removeduplicates

Verá un cuadro emergente para elegir alternativas y aprobar la eliminación de duplicados después de hacer clic en «Eliminar duplicados», como se muestra en la imagen siguiente.

Hay una selección para «Datos como fila de cabecera», como se muestra en la imagen inferior. Marque esta casilla si su hoja tiene una fila de encabezado para que Google Sheet la ignore al eliminar los duplicados.

removeduplicate1

Los duplicados se eliminarán cuando confirme sus selecciones y haga clic en el botón «Eliminar duplicados», mostrando el estado que aparece a continuación.

duplicatesremoved

¿Cómo crear una lista única?

Vamos a extraer una lista única de una base de datos con numerosos duplicados.

La fórmula es increíblemente sencilla de entender y aplicar.

Para entenderlo, tomemos una de nuestras hojas de cálculo de Google anteriores.

La sintaxis para crear la lista única es

=única(inicio de rango: fin de rango)

Como se ve en la imagen siguiente, la fórmula se coloca en la columna D, se define el rango de celdas del que queremos extraer los datos únicos y, tras ejecutarla, el resultado se muestra en la columna D.

uniquelist

¿Cómo eliminar espacios en blanco en las Hojas de cálculo de Google?

Cuando se trabaja en una Hoja de cálculo de Google con datos de texto o numéricos, es frecuente encontrarse con espacios excesivos en las celdas, lo que resulta molesto.

En esta parte, veremos cómo deshacerse de esos espacios en blanco adicionales.

Utilicemos la Hoja de Google que se muestra a continuación para eliminar los espacios en blanco excesivos.

whitespaces

Elija la columna o conjunto de datos que tenga espacios en blanco adicionales, vaya al «Menú Datos» en la parte superior, desplácese hasta «Limpieza de datos» y haga clic en «Recortar espacios en blanco», como se muestra a continuación.

whitespacesremoval

Cuando seleccione «Recortar espacios en blanco», verá el resultado como se indica en la imagen inferior. Como puede ver, la columna está ahora libre de espacios en blanco adicionales.

trimwhitespaces

Palabras finales

La duplicación de datos no sólo es una pérdida de tiempo innecesaria, sino que también tiene el potencial de provocar problemas importantes y errores costosos.

Si su hoja de Google es de pequeño tamaño, puede encontrarlos manualmente, pero si tiene numerosas hojas, le llevaría mucho tiempo y sería propenso a errores. Las técnicas anteriores le ayudarán a identificar los duplicados en su documento de Google y a eliminarlos de una vez.

A continuación, puede consultar la hoja de trucos definitiva sobre las preguntas frecuentes en las hojas de Google.