Geekflare est soutenu par son public. Nous pouvons percevoir des commissions d'affiliation sur les liens d'achat présents sur ce site.
En Base de données Dernière mise à jour : 16 septembre 2023
Partager sur :
Invicti Web Application Security Scanner - la seule solution qui offre une vérification automatique des vulnérabilités avec Proof-Based Scanning™.

La fonction COUNTIF et la fonction de nettoyage des données sont les deux moyens les plus simples de trouver des doublons dans Google Sheets.

À propos de Google Sheets

Google Sheets est un tableur gratuit, basé sur le cloud, proposé par Google dans le cadre de sa suite bureautique complète destinée à concurrencer Microsoft Office. Google Sheets permet de préparer des données, d'effectuer des calculs, etc.

Il est utilisé pour modifier, organiser et stocker des données. Le programme de productivité Google Docs intègre ce programme, qui comprend Google Drive, Google Sheets et Google Slides.

Toutefois, l'un des avantages de Google Sheets est que, contrairement à Excel, il peut être utilisé en collaboration en temps réel avec d'autres utilisateurs.

Google Sheets a simplifié la création de bases de données en offrant une interface conviviale et des outils pratiques pour organiser les données.

L'utilisation de Google Sheets permet d'accroître la productivité et de gagner du temps. Les utilisateurs n'ont plus à craindre de perdre des données cruciales ou d'écraser involontairement des fichiers, car le cadre est basé sur le cloud.

L'un des tableurs et programmes de base de données les plus utilisés est Google Sheets, qui est accessible sur tous les systèmes d'exploitation de bureau et mobiles courants.

Comment Google Sheets permet-il de simplifier la création de bases de données ?

Traditionnellement, la création de bases de données est une opération difficile et fastidieuse. Toutefois, les récents développements technologiques, en particulier Google Sheets, ont considérablement simplifié cette procédure. Le programme dispose également de nombreuses fonctionnalités, telles que la possibilité d'ajouter des données à une base de données. graphiquesdes formules et des images.

Pour la gestion et le stockage de données en temps réel, la plupart des entreprises l'utilisent à la place d'autres bases de données coûteuses comme PostgreSQL, MySQLSQL Server, etc. La plupart des petits ensembles de données préfèrent les feuilles Google comme alternative.

Google Sheets n'est pas un système de gestion de base de données complet pour votre entreprise. Cependant, contrairement à d'autres systèmes de gestion de base de données, il fait des merveilles pour les petites entreprises et les projets afin de gérer efficacement les opérations financières de l'entreprise.

Il est important de noter qu'il dispose de plusieurs fonctionnalités sophistiquées accessibles gratuitement, telles que l'API Google Sheets, le script Apps, les déclencheurs de formulaires, les déclencheurs temporisés et l'ImportXML.

Les utilisateurs du script d'application peuvent se connecter à différentes bases de données car le script d'application inclut un service JDBC pour se connecter à MySQL, Microsoft SQL Server et d'autres bases de données.

Les entreprises peuvent réduire leurs dépenses liées aux différents produits de gestion des données en utilisant toutes leurs capacités.

Examinons maintenant l'impact des valeurs dupliquées dans la base de données.

Impact des valeurs en double dans la base de données

Si les données sont utilisées à des fins d'analyse ou de reporting, les valeurs en double dans une base de données peuvent avoir une incidence négative sur les données.

Dans de rares cas, les valeurs dupliquées peuvent fausser les données, ce qui peut entraîner des déductions inexactes à partir des données. Dans d'autres cas, la duplication des valeurs peut rendre les données plus difficiles à utiliser et à comprendre.

Dans les deux cas, il est essentiel de connaître les effets potentiels des valeurs dupliquées dans une base de données et de prendre des précautions pour éviter ou réduire ces effets.

Mettre en évidence les doublons dans Google Sheets en une seule colonne

Cette section examine les méthodes permettant d'attirer l'attention sur les doublons de données dans les feuilles Google et de les éliminer.

La formule couramment utilisée pour mettre en évidence les doublons est la suivante :

=COUNTIF(range, criterion)

Voici un guide étape par étape sur l'utilisation de cette formule dans Google Sheets.

Naviguez jusqu'à l'option "Format" dans le menu supérieur et descendez jusqu'à "Mise en forme conditionnelle", comme indiqué ci-dessous.

menu format

Les nouvelles options de mise en forme conditionnelle apparaissent sur le côté droit après avoir cliqué sur le bouton de mise en forme conditionnelle, comme indiqué ci-dessous :

contre-formule

Après avoir défini la plage de cellules dans laquelle vous souhaitez mettre en évidence les doublons, descendez jusqu'à la section Règles de format et choisissez l'option "Formule personnalisée" dans le menu déroulant, comme indiqué dans l'exemple ci-dessus.

Dans ce champ, saisissez la formule :

=COUNTIF($G$6:$G$14,G6)>1

La cellule G doit être remplacée par la colonne appropriée en fonction de votre besoin de mettre en évidence les doublons.

Après avoir appuyé sur le bouton "Terminé", les doublons de la colonne seront mis en évidence, comme le montre l'image ci-dessus.

dupliquer les points forts

Les paramètres de style de mise en forme, comme illustré ci-dessous, permettent de modifier la couleur de surbrillance ou d'autres options de mise en forme :

surlignerformater

Nous avons vu comment mettre en évidence les doublons d'une seule colonne dans l'exemple ci-dessus.

Dans la section suivante, nous verrons comment mettre en évidence les doublons de plusieurs colonnes.

Mise en évidence des doublons dans Google Sheets dans plusieurs colonnes

Toutes les phases de ce processus sont identiques à celles décrites ci-dessus, à l'exception de la formule et de la plage de cellules que nous définissons pour mettre en évidence les doublons.

Pour mieux le comprendre, prenons un exemple.

Accédez à l'option "Mise en forme conditionnelle" du menu de navigation "Format" pour exécuter la formule. Les options seront visibles sur le côté droit, comme illustré dans l'image ci-dessous.

Une plage de cellules est spécifiée dans la section "Appliquer à la plage".

Dans la section "Règles de format", la formule utilisée pour mettre en évidence les doublons de plusieurs colonnes est la suivante :

=COUNTIF($F$6:$I$8,F6)>1

Il s'agit d'une formule très simple et facile à mettre en œuvre. La formule ne contient qu'une série de cellules à partir desquelles nous devons identifier les doublons.

Après avoir exécuté cette formule, les doublons de quatre colonnes sont mis en évidence, comme le montre l'exemple ci-dessous.

Dans cette illustration, nous avons également changé la couleur de surbrillance en bleu.

colonne multiple

Nous verrons dans la section suivante comment mettre en évidence les données en double dans les lignes.

Mise en évidence des doublons dans les lignes de Google Sheets

Dans une feuille Google, l'identification des lignes de données en double est un peu différente de la mise en évidence des colonnes en double.

Nous ne répéterons pas toutes les étapes, car elles sont toutes identiques, à l'exception de la formule.

Prenons un exemple.

La plage de cellules à partir de laquelle vous souhaitez mettre en évidence les doublons est répertoriée dans la partie "Appliquer à la plage" des options de format conditionnel, comme le montre l'image ci-dessous.

Dans la section "Formule personnalisée", la formule introduite est la suivante

=COUNTIF(ARRAYFORMULA($A$3:$A$10&$B$3:$B$10&$C$3:$C$10),$A3&$B3&$C3)>1

Notez que, bien que la formule semble compliquée, elle se compose des numéros de cellule de début et de fin des lignes où vous souhaitez mettre en évidence les doublons.

Le résultat s'affichera comme indiqué ci-dessous après l'exécution de cette formule.

Dans cette illustration, la couleur de mise en évidence est également modifiée, ce qui est possible dans la même partie du menu des styles de mise en forme que pour la mise en évidence des colonnes dupliquées.

duplicatas

Mise en évidence des doublons dans Google Sheets en fonction de critères spécifiques

Si vous souhaitez mettre en évidence les doublons sur la base de critères spécifiques, vous devez utiliser l'opérateur étoile ("*") pour demander à la fonction COUNTIF de relier les deux plages définies et d'afficher le résultat.

La syntaxe de la formule pour réaliser la condition ci-dessus serait la suivante :

=(COUNTIF(Range,Criteria)>1) * (New Condition) )

Prenons un exemple pour le comprendre.

Critères : Supposons que vous souhaitiez mettre en évidence toutes les lignes dupliquées dans la base de données tout en laissant intactes les premières entrées des lignes dupliquées.

Voyons comment procéder dans une feuille Google. À l'exception du changement de formule, toutes les étapes sont les mêmes que celles expliquées ci-dessus dans les autres approches, alors entrons directement dans le vif du sujet. 

La formule permettant d'exécuter les critères susmentionnés est la suivante : 

=COUNTIF(ArrayFormula($A$3:$A3&$B$3:$B3&$C$3:$C3),$A3&$B3&$C3)>1

La formule apparemment compliquée et longue implique le début et la fin des numéros de cellules.

La feuille Google ci-dessous montre que les premières entrées Apple et Orange sont ignorées et que les dernières sont mises en évidence. 

dupliquer avec les critères

Jusqu'à présent, nous avons vu comment mettre en évidence les données en double dans les lignes, les colonnes et avec des critères spécifiques.

Dans la section suivante, nous verrons rapidement comment supprimer les données en double à l'aide de raccourcis.

Raccourci pour supprimer les doublons 

Choisissez la base de données ou la colonne pour laquelle vous souhaitez supprimer les enregistrements en double, sélectionnez "Nettoyage des données" dans le menu du haut, descendez jusqu'à "Supprimer les doublons" et cliquez sur OK, comme le montre l'image ci-dessous.

supprimer les doublons

Après avoir cliqué sur "Supprimer les doublons", vous verrez apparaître une fenêtre contextuelle vous permettant de choisir des alternatives et d'approuver la suppression des doublons, comme le montre l'image ci-dessous.

Il existe une sélection pour "Données en tant que ligne d'en-tête", comme le montre l'image ci-dessous. Cochez cette case si votre feuille comporte une ligne d'en-tête afin que Google Sheet l'ignore lors de la suppression des doublons.

removeduplicate1

Les doublons seront éliminés lorsque vous confirmerez vos sélections et cliquerez sur le bouton "Supprimer les doublons", affichant l'état ci-dessous.

duplicata supprimé

Comment créer une liste unique ?

Extrayons une liste distincte d'une base de données contenant de nombreux doublons.

La formule est incroyablement simple à comprendre et à appliquer.

Pour comprendre cela, prenons l'une de nos feuilles Google précédentes.

La syntaxe pour créer la liste unique est la suivante

=unique(range start: range end)

Comme le montre l'image ci-dessous, la formule est définie dans la colonne D, la plage de cellules à partir de laquelle nous voulons extraire les données uniques est définie et, après son exécution, le résultat s'affiche dans la colonne D.

liste unique

Comment supprimer les espaces dans Google Sheets ?

Lorsque vous travaillez sur une feuille Google avec du texte ou des données numériques, vous rencontrez souvent des espaces excessifs dans les cellules, ce qui est gênant.

Dans cette partie, nous allons voir comment se débarrasser de ces espaces blancs supplémentaires.

Utilisons la feuille Google ci-dessous pour éliminer les espaces blancs excessifs.

espaces blancs

Choisissez la colonne ou l'ensemble de données qui comporte des espaces blancs supplémentaires, allez dans le "Menu Données" en haut, descendez jusqu'à "Nettoyage des données" et cliquez sur "Supprimer les espaces blancs", comme indiqué ci-dessous.

suppression des espaces blancs

Lorsque vous sélectionnez "Trim Whitespaces", vous obtiendrez le résultat indiqué dans l'image ci-dessous. Comme vous pouvez le constater, la colonne est désormais exempte d'espaces blancs supplémentaires.

espaces blancs

Dernières paroles

La duplication des données n'est pas seulement une perte de temps inutile, mais elle peut également entraîner des problèmes importants et des erreurs coûteuses.

Si votre feuille Google est de petite taille, vous pouvez les trouver manuellement, mais si vous avez de nombreuses feuilles, cela prendra beaucoup de temps et sera source d'erreurs. Les techniques ci-dessus vous aideront à identifier les doublons dans votre document Google et à les supprimer d'un seul coup.

Ensuite, vous pouvez consulter l'ultime Google sheets FAQ cheat sheet.

  • Satish Shethi
    Auteur
Merci à nos sponsors
D'autres lectures intéressantes sur la base de données
Alimentez votre entreprise
Quelques outils et services pour aider votre entreprise à se développer.
  • Invicti utilise le Proof-Based Scanning™ pour vérifier automatiquement les vulnérabilités identifiées et générer des résultats exploitables en quelques heures seulement.
    Essayez Invicti
  • Web scraping, proxy résidentiel, proxy manager, web unlocker, search engine crawler, et tout ce dont vous avez besoin pour collecter des données web.
    Essayez Brightdata
  • Monday.com est un système d'exploitation tout-en-un qui vous aide à gérer vos projets, vos tâches, votre travail, vos ventes, votre CRM, vos opérations, vos flux de travail et bien plus encore.
    Essayez le lundi
  • Intruder est un scanner de vulnérabilité en ligne qui détecte les faiblesses de votre infrastructure en matière de cybersécurité, afin d'éviter des violations de données coûteuses.
    Essayer l'intrus