Geekflare est soutenu par son public. Nous pouvons percevoir des commissions d'affiliation sur les liens d'achat présents sur ce site.
En AI Dernière mise à jour : 16 septembre 2023
Partager sur :
Invicti Web Application Security Scanner - la seule solution qui offre une vérification automatique des vulnérabilités avec Proof-Based Scanning™.

Les chatbots d'IA comme ChatGPT ne se limitent pas à répondre à vos questions. Ils peuvent rédiger des courriels, des lettres de motivation, des essais, des poèmes, des articles de blog et bien plus encore.

L'écriture d'IA est comme un caméléon - elle peut se fondre dans n'importe quel autre type d'écriture si bien qu'il est difficile de faire la différence.

Malheureusement, il est alors incroyablement difficile pour nous, les humains, de détecter si une IA a écrit quelque chose à la place d'une personne. Bien sûr, nous pourrions tous suivre le conseil de Sherlock Holmes et "éliminer l'impossible", mais qui a le temps pour cela ?

Et si je vous disais que le paragraphe ci-dessus est écrit par une IA ? Oui, j'ai demandé à YouWrite d'écrire une introduction rapide pour ce billet, et c'est ce qu'il a fait. Plutôt convaincant, non ? C'est le problème, c'est trop convaincant pour que n'importe qui puisse le présenter comme son propre travail et en tirer profit.

Les IA ne se contentent pas de reformuler le contenu ; elles apprennent le sujet et le présentent dans un langage naturel à l'aide d'un logiciel de gestion de contenu. RLHF. Cela signifie que le contenu généré ne sera pas lu de manière robotique et qu'il ne pourra pas être comparé aux données disponibles en ligne pour détecter le plagiat.

Il n'est pas facile de détecter les contenus générés par l'IA, et je ne vais pas vous donner de faux espoirs en vous disant que vous pouvez les détecter avec une précision de 100%. Cependant, avec un peu de travail de détective et l'aide d'outils de détection de l'écriture AI, vous pouvez attraper la plupart des œuvres de l'IA.

Vous trouverez ci-dessous des méthodes manuelles de détection du plagiat d'IA ainsi que quelques outils automatiques.

Outils de détection du plagiat par l'IA

Outils de détection du plagiat par l'IA

Il existe un grand nombre d'outils capables de détecter les contenus rédigés par l'IA. Toutefois, leur précision varie et peut échouer en fonction du type de contenu et de sa longueur.

J'ai testé ces outils en utilisant différents types de contenus générés par ChatGPT, GPT-3 Terrain de jeux, WriteSonic, Rytret YouWrite. Ils ont réussi à détecter tous les types de contenu générés par ChatGPT et GPT-3 Playground.

Bien qu'ils aient obtenu des résultats mitigés pour les outils d'écriture dédiés, il est intéressant de noter que tous n'ont pas détecté YouWrite ; je suppose que c'est parce que YouWrite commet des erreurs de type humain dans le but d'éviter d'être détecté.

Je vous recommande d'utiliser ces outils en plus de la vérification manuelle du contenu. Commencez par analyser le contenu à l'aide de l'un de ces outils, puis vérifiez manuellement la présence d'indices permettant de confirmer vos soupçons.

J'énumère ci-dessous ceux qui ont donné les meilleurs résultats et qui sont les plus faciles à utiliser :

Remarque : Pour la démonstration, je vais utiliser le texte généré à partir de WriteSonic sur "Les bienfaits des mangues".

#1. Originalité AI

La numérisation à grande échelle de contenus générés par l'IA peut représenter un défi de taille pour de nombreux éditeurs de sites web. Cependant, j'ai la solution parfaite pour vous. Originalité AI peut vérifier l'ensemble de votre contenu et évaluer le risque que votre site web soit affecté par les futures mises à jour de l'IA de Google.

YouTube vidéo

J'aimerais également souligner une caractéristique que j'apprécie particulièrement chez Originality AI : ses capacités de détection de l'IA en plusieurs langues. Cette fonction élimine les barrières linguistiques à l'échelle mondiale, en prenant en charge 15 langues.

#2. Contenu à l'échelle

J'ai trouvé le détecteur de contenu AI en Contenu à l'échelle s'est avéré le plus précis pour la plupart des tests que j'ai effectués. Il vous permet de scanner jusqu'à 2500 caractères par scan et fait une prédiction en pourcentage montrant la densité réelle ou fausse du contenu.

Contenu à l'échelle

Le contenu qui est plus de 60% faux peut être considéré comme écrit par l'IA, du moins en grande partie. Dans la capture d'écran ci-dessous, vous pouvez voir que le contenu de 96% est faux, et que je l'ai entièrement généré avec l'IA.

#3. GPTZero

Si vous voulez voir exactement quel contenu est généré par l'IA, alors GPTZero est une bonne option. GPTZero ne note pas le contenu. Il met plutôt en évidence le contenu exact qui est probablement généré par l'IA.

GPTZero

Bien qu'il affiche des scores de perplexité et d'éclatement pour se faire une idée du caractère aléatoire du texte, il prend surtout en charge 5 000 caractères par analyse et peut également télécharger des fichiers. La numérisation de contenus volumineux contribue grandement à améliorer la précision.

GPTZero

#4. Détecteur de sortie GPT-2

Les créateurs de ChatGPT proposent également un robot pour détecter leur propre travail. Comme GPT-2 et GPT-3 ne diffèrent que par le nombre total de données utilisées pour l'entraînement, ce robot peut être utilisé comme outil de détection. Détecteur GPT-2 fonctionne également pour les IA basées sur le GPT-3.

Détecteur de sortie GPT-2

Il n'y a pas de limite à la quantité de contenu qu'il peut analyser, il est donc parfait pour détecter les très longs contenus générés par l'IA. J'ai également trouvé que sa précision était bonne, en particulier pour le contenu généré par ChatGPT. Cependant, il est un peu lent dans ses prédictions, donc ne considérez ses résultats que lorsqu'il montre que plus de 50% du contenu est faux.

#5. Détecteur de contenu Writer AI

Détecteur de contenu Writer AI Les résultats sont discutables lorsqu'il s'agit de détecter du contenu provenant d'outils de rédaction d'IA, mais il fonctionne très bien pour le contenu généré par ChatGPT. Vous pouvez analyser 1500 caractères par analyse et même ajouter l'URL du contenu s'il a déjà été publié.

Détecteur d'IA de l'écrivain

Pour mon texte test généré par l'IA, il a indiqué que 94% du contenu était généré par l'homme, ce qui est assez éloigné par rapport à d'autres outils. Néanmoins, il vaut la peine de l'utiliser pour détecter le contenu ChatGPT, surtout s'il a déjà été publié.

#6. Projet et objectif

Un outil simple mais puissant de détection de l'écriture AI. D'après mon expérience, Projet et objectif offre des résultats similaires à ceux de Content At Scale, mais il n'a pas de limite de nombre de mots, ce qui vous permet de numériser de longs textes. Cependant, sa durée de numérisation augmente en fonction de la quantité de contenu que vous numérisez.

Projet-Objectif

Pour mon exemple de texte, il est indiqué que 94% du texte est généré par l'IA.

Détection manuelle du plagiat par l'IA 🕵️

Détecter manuellement le plagiat de l'IA

ChatGPT n'est même pas un gros problème lorsqu'il s'agit de plagiat par l'IA. Il existe de nombreux outils alternatifs qui reposent sur la même technologie GPT-3 et sont conçus pour l'écriture. Ils sont très avancés et spécialement conçus pour créer un contenu de type humain difficile à attraper.

Les outils de détection automatique sont un peu aléatoires en fonction du type, de la longueur et de la complexité du contenu. Pour l'instant, la meilleure solution consiste donc à relier manuellement les points pour déterminer si le texte est généré par l'IA ou non.

Vous trouverez ci-dessous une liste d'indices courants qui vous permettront de repérer les contenus générés par l'IA.

#1. Informations périmées

ChatGPT et d'autres IA basées sur le GPT-3 ont vu leurs connaissances réduites à la fin de l'année 2021. Même si certains robots d'IA disposent d'un moteur de recherche à rechercher les informations les plus récentes, ils s'appuient toujours sur des données anciennes pour rédiger des contenus longs tels que des essais ou des articles de blog.

Si vous remarquez que l'article parle constamment de données périmées, en particulier avant 2021, il pourrait s'agir de données générées par l'IA.

Dans la capture d'écran ci-dessous, j'ai demandé à YouWrite de me parler de la récente Coupe du monde de la FIFA, et voici ce qu'il a trouvé.

Informations périmées

Il parle de la Coupe du monde 2018 au lieu de la récente Coupe du monde 2022. Même si l'outil est mis à jour pour parler d'événements récents comme la Coupe du monde 2022, il utilise toujours les données obsolètes sur lesquelles il est construit pour rédiger des articles longs.

#2. Utilise la même structure de phrase pour les descriptions

Lors de la rédaction des descriptions de plusieurs produits/applications, l'IA utilise généralement la même structure de phrase qu'elle modifie pour l'adapter à la description d'un produit. Les descriptions commencent généralement par le même mot, comme The, It, A, ou le nom du produit. Les descriptions ont également un thème spécifique qu'elles répètent.

Par exemple, ci-dessous, j'ai demandé à ChatGPT de me parler de "sites web d'emplois de saisie de données". Vous pouvez voir que toutes les descriptions commencent par "A" et ont un objectif précis.

Utilise la même structure de phrase pour les descriptions

J'ai également posé la même question à YouChat, qui a fait la même chose en répétant le nom de chaque site web au début, et les descriptions elles-mêmes ressemblent à une version reformulée de chacun d'entre eux.

YouChat

Si l'article que vous analysez contient une description de quelque chose de similaire, c'est un excellent moyen d'identifier l'écriture AI.

#3. Utilise des phrases courtes

Dans la plupart des cas, l'IA utilise des phrases d'une ligne avec une seule virgule au maximum. Peut-être essaie-t-elle de minimiser les risques d'erreur, mais elle évite d'écrire de longues phrases qui pourraient nécessiter l'utilisation de deux points, de points-virgules ou de lignes horizontales épaisses.

Je sais que ce n'est pas le meilleur indice pour attraper un auteur d'IA, mais cela vaut la peine d'y penser pour renforcer vos soupçons.

#4. Peut fournir des informations incorrectes

Pour les questions complexes qui impliquent généralement une certaine forme d'instruction, l'IA peut ne pas comprendre l'intention et fournir des informations incorrectes. Je ne parle pas ici d'informations périmées, mais d'informations erronées qu'elles vous communiquent en toute confiance lorsqu'elles ne maîtrisent pas le sujet.

Par exemple, j'ai demandé à YouWrite de me dire "comment rootter un téléphone Android sans PC". Il m'a quand même montré des méthodes qui impliquent l'utilisation d'un PC à un moment ou à un autre de l'instruction.

Peut fournir des informations incorrectes

#5. N'ajoute pas d'opinion personnelle

Lorsqu'elle parle de quelque chose, l'IA se contente d'évoquer des faits connus. Contrairement aux humains, elle ne parlera pas de son expérience personnelle. Bien qu'il soit possible de demander aux IA de rédiger un rapport pratique, elles ont tendance à éviter de le faire par défaut.

Si vous remarquez que l'article ne parle que de faits connus, il y a de fortes chances qu'il ait été rédigé par une IA. Par exemple, lorsqu'elle parle d'une application, elle parlera de ses caractéristiques plutôt que de la fluidité de la navigation ou de la manière d'utiliser l'application.

#6. Explications succinctes

Comme les IA sont limitées par les connaissances actuellement disponibles, elles ont tendance à rédiger des explications et des descriptions brèves. D'après mon expérience, si elles parlent d'un sujet particulier, comme le rootage d'Android, elles s'en tiennent à 2 ou 3 paragraphes maximum. Quant aux applications ou aux produits, la description ne dépasse généralement pas un paragraphe.

Les humains peuvent écrire en profondeur sur un sujet, y compris les caractéristiques, les limites, l'expérience personnelle, le prix, etc. En revanche, l'IA se concentre généralement sur les principales caractéristiques ou les points forts, de sorte que l'article est également court. Si l'instructeur demande plus de détails, le risque d'informations incorrectes augmente considérablement.

#7. Vérifier les antécédents de l'auteur

En tant qu'enseignant ou webmaster, si vous avez accès aux travaux antérieurs du rédacteur ou à ses missions, il peut être judicieux de les comparer avec l'article dont vous vous méfiez. Il est très peu probable que le rédacteur ait un style d'écriture similaire à celui d'une IA. Même si l'IA peut changer de ton d'écriture, les styles qu'elle choisit sont plutôt génériques et elle ne peut pas copier votre ton.

Prenons l'exemple du paragraphe généré par l'IA dans l'introduction de ce billet. Quiconque a lu mes articles précédents peut facilement constater que mon style d'écriture est totalement différent de celui de l'IA.

Vous pouvez simplement lire 2 ou 3 travaux antérieurs de l'auteur et voir s'ils correspondent au style d'écriture de l'article suspect.

Mes pensées 💭

Personnellement, je pense que l'aide de l'IA est en fait un excellent moyen d'éliminer le blocage de l'écrivain, de rassembler toutes les informations en un seul endroit et de trouver l'inspiration. Toutefois, elle ne devrait jamais remplacer l'écriture humaine, car l'IA est limitée aux connaissances déjà acquises.

Vous pouvez également explorer certaines des meilleures outils de vérification du plagiat pour empêcher la copie.

  • Karrar Haider
    Auteur
Merci à nos sponsors
Autres lectures intéressantes sur l'IA
Alimentez votre entreprise
Quelques outils et services pour aider votre entreprise à se développer.
  • Invicti utilise le Proof-Based Scanning™ pour vérifier automatiquement les vulnérabilités identifiées et générer des résultats exploitables en quelques heures seulement.
    Essayez Invicti
  • Web scraping, proxy résidentiel, proxy manager, web unlocker, search engine crawler, et tout ce dont vous avez besoin pour collecter des données web.
    Essayez Brightdata
  • Monday.com est un système d'exploitation tout-en-un qui vous aide à gérer vos projets, vos tâches, votre travail, vos ventes, votre CRM, vos opérations, vos flux de travail et bien plus encore.
    Essayez le lundi
  • Intruder est un scanner de vulnérabilité en ligne qui détecte les faiblesses de votre infrastructure en matière de cybersécurité, afin d'éviter des violations de données coûteuses.
    Essayer l'intrus