Depuis la sortie de ChatGPT, une question qui circule dans l’esprit de la plupart des gens lorsqu’ils lisent quoi que ce soit en ligne est :”Ceci a-t-il été écrit par un humain ou une IA ?”ChatGPT a certainement été un pionnier, produisant un contenu diversifié qui ressemble tellement à l’humain. Mais la sophistication de ces modèles pose une question que nous n’avions pas prévu d’affronter si tôt dans le développement de l’IA.
Comment différencierons-nous le texte écrit par une IA de celui écrit par des humains ? Après tout, tout le monde a le droit de savoir s’il lit du contenu écrit par un humain ou vomis par une machine. La moralité de la question devient une préoccupation encore plus pressante dans les milieux académiques et politiques.
Ainsi, il va sans dire qu’il est extrêmement important de pouvoir dire l’origine d’un contenu si l’on veut empêcher une mauvaise utilisation flagrante de la technologie. Et dans ce guide, nous apprendrons à faire exactement cela.
Originality.AI
L’une des méthodes que vous pouvez utiliser pour détecter le contenu écrit par une IA consiste à utiliser un autre outil basé sur l’IA. Certains outils populaires incluent :
Originality.AI– Cet outil est mieux adapté aux créateurs de contenu professionnels qui veulent s’assurer qu’ils ne publient rien sur leur site qui finit par être signalé par les algorithmes de Google pour la détection de contenu AI. Il s’agit d’un outil payant qui offre également des fonctionnalités telles que la gestion d’équipe.GPTZero – Cet outil de détection de contenu IA, conçu principalement pour les éducateurs, utilise un score de perplexité et de rafale pour détecter le contenu écrit par l’IA. Très habile dans son travail, il peut même trouver des phrases individuelles dans un texte qui ont été écrits par l’IA.HuggingFace GPT-2 Output Detector – Le nom peut être une bouchée et suggérer que l’outil est obsolète (cue GPT-2), mais il fonctionne étonnamment bien avec le texte généré à l’aide de GPT-3.5 également.GLTR (Giant Language Model Test Room) – L’outil détecte le contenu écrit par l’IA sur la base d’un principe simple, le texte généré par l’IA est prédictif et non aléatoire. GLTR juge chaque mot en fonction de sa probabilité de le prédire compte tenu du contexte à sa gauche. Si vous avez un texte plutôt facile à prévoir, vous avez un texte écrit par l’IA. Simple.Content at Scale’s AI Detector – Un autre détecteur de contenu fiable d’un outil d’IA génératif qui peut vous aider à détecter gratuitement le contenu généré par l’IA.Writer’s AI Content Detector – Un autre outil gratuit AI Content Detector qui peut détecter le contenu écrit par l’IA avec une certaine précision. Vous pouvez numériser jusqu’à 1500 mots à la fois en utilisant la version gratuite.AI Text Classifier by OpenAI – Un outil de détection de contenu AI d’OpenAI, la société derrière ChatGPT elle-même. Bien qu’il doive encore être développé davantage pour fournir une détection précise, il peut vous aider à détecter le contenu généré par ChatGPT. un outil de détection d’IA sur son site Web qui est actuellement gratuit pendant qu’il est en phase bêta. Un bon outil à considérer lorsque vous souhaitez détecter du contenu par IA.Kazan SEO-Un autre outil gratuit qui offre un outil de détection d’IA fiable ainsi que de nombreuses autres fonctionnalités telles que l’optimisation SEO, trouver des mots-clés de cluster, etc.
Vous pouvez trouver un examen plus détaillé de chaque outil dans notre guide séparé sur le lien ci-dessous.
Meilleurs outils de détection de contenu AI
Les meilleurs outils là-bas en ce moment qui peut détecter avec précision le contenu écrit par l’IA, même le contenu généré à l’aide de ChatGPT.
Les outils de détection de contenu sont-ils suffisants ?
Les outils de détection de contenu conviennent à maintenant, mais la vérité est qu’ils ont du mal à suivre la vitesse folle avec laquelle le développement de l’IA progresse. Exemple : ces outils avaient encore du mal à détecter le texte des modèles GPT-3.5, et GPT-4 est déjà arrivé sur les lieux. C’est comme une course, et les outils de détection de contenu semblent perdre. Et sans parler du fait que la plupart d’entre eux sont notoirement faciles à contourner en effectuant des modifications clairsemées. Et si vous deviez prendre du texte généré par une IA et le paraphraser en utilisant une autre, il pourrait être impossible de détecter l’utilisation de ces outils.
De plus, la plupart de ces outils nécessitent des textes plus longs pour fonctionner de manière fiable. Certains d’entre eux ont même une limite minimale pour un nombre de caractères requis pour analyser. Cela peut rendre plus difficile la détection de l’écriture automatique dans des textes plus petits, tels que des e-mails.
C’est aussi un fait qu’un outil de détection de contenu a parfois du mal à détecter le contenu d’un autre outil parce que cela nécessite l’accès à certaines informations sur l’IA modèles que les entreprises ne fournissent pas. Par exemple, considérez OpenAI. Ils développent des techniques de filigrane pour les textes développés par leurs modèles, tels que GPT-3 Watermark ajoute un motif imperceptible au texte qui n’affecte en rien l’utilisateur final, mais rend évident, par exemple un outil de détection de contenu, que le texte provenait de GPT-3. Mais les données filigranées resteront uniquement dans OpenAI, ce qui facilitera la détection des données par leur propre outil.
En bref, bien que ces outils puissent être utiles, ils ne sont pas infaillibles. Alors, quelle alternative existe-t-il ? Je suis content que vous ayez demandé. Vous devez apprendre à reconnaître les signes !
Les signes qu’une IA a écrit le contenu
Il existe des signes révélateurs que vous pouvez vous entraîner à observer pour dans le contenu écrit par un outil d’IA. Sans vous entraîner consciemment, vous n’avez pas beaucoup de chance car c’est le danger de ces outils. Alors, il est temps de boucler votre ceinture !
Le fait à propos de ces modèles est qu’ils fonctionnent en prédisant le mot suivant le plus probable dans une phrase et n’ont aucune connaissance réelle de ce qu’ils disent. Puisqu’il s’agit d’un modèle basé sur la prédiction, certains schémas abondent.
Modules pelucheux avec répétition
La plupart du contenu écrit par l’IA se lira comme un morceau pelucheux, comme quelqu’un répétant des mots et des idées pour répondre au nombre de mots. Vous devez également analyser le texte pour voir avec quelle fluidité il se lit ; si vous sentez que le texte n’est pas fluide et que certains mots et phrases sont répétés, il est probablement écrit par l’IA.
Selon les chercheurs, il y a souvent une répétition de mots courants, tels que”le », « il », et « est », etc. plus qu’il n’y en aurait dans un texte écrit par un humain. Puisqu’ils prédisent le mot le plus probable, le texte se retrouve avec de tels mots au lieu de mots inhabituels. Mais il y a aussi une répétition d’une idée, dans les mêmes mots et expressions, tout au long du texte. Cela rend le contenu quelque peu ennuyeux.
Phrases surutilisées
Vous trouverez également de nombreux clichés et un langage générique dans les textes produits par une machine. C’est l’un des résultats d’eux étant des modèles prédictifs. Des phrases telles que « Mais il y a de nombreux avantages », « Vous êtes-vous déjà demandé… ? », etc. remplissent la page en écriture automatique.
Recherchez les fautes de frappe
L’une des caractéristiques des modèles d’IA est qu’ils ne feront pas de fautes d’orthographe. Donc, si vous voyez une faute de frappe dans le texte, il est prudent de supposer que le texte aurait été écrit par un humain.
Structure de phrase inhabituelle
Le texte généré par l’IA peut avoir une phrase des structures inhabituelles ou qui ne respectent pas les règles de grammaire habituelles. Ils peuvent sembler beaux à la surface, mais une inspection plus approfondie révèle des indices subtils que l’écriture n’est pas naturelle.
Un élément organique manquant qui vient de la créativité humaine
Peu importe les avantages de productivité et d’efficacité de l’utilisation d’une IA, la vérité est que sans intervention humaine, ces réseaux d’apprentissage automatique ont tendance à produire un contenu plutôt rigide et peu naturel. À quoi d’autre pouvez-vous vous attendre ? C’est une machine; il livre écrit de manière informative, généralement à la 2e ou à la 3e personne. Il n’y a jamais de voix à la première personne, de touche personnelle ou d’histoires, car comment peut-il y en avoir ? De plus, le type de voix utilisé reste constant tout au long. Il ne se transforme jamais en une autre voix puisque les machines n’enfreignent pas les règles d’écriture comme le font les humains.
Il manque également le cœur que seule l’écriture naturelle peut avoir. Il n’y a pas d’émotions ou de personnalité.
Des idées qui ne se connectent pas de manière organique
Vous pourriez souvent tomber sur des articles qui semblent sauter d’une idée à l’autre sans aucun préambule. Ces idées brouillées qui brouillent votre cerveau en essayant de garder une compréhension constante sont caractéristiques de l’écriture de l’IA. En d’autres termes, l’IA peut avoir du mal à maintenir la cohérence et à suivre un récit ou un argument clair.
Pas d’utilisation de métaphores ; mais lorsqu’ils sont utilisés, ils peuvent se sentir forcés
L’écriture que produit l’IA a tendance à être inornée et fade, sans l’utilisation de métaphores ou d’autres dispositifs littéraires. Alors que d’autres fois, de telles métaphores sont insérées avec force là où elles ne semblent pas naturelles. Paradoxalement, il peut même parfois utiliser un langage non naturel que vous entendez rarement.
Il peut être difficile de s’entraîner à repérer ces schémas dans une écriture. Mais il existe une façon plus amusante de s’entraîner; vous pouvez jouer à un jeu. Daphne Ippolito, chercheur principal chez Google Brain, a développé un tel jeu. Le jeu consiste à deviner où se termine l’écriture humaine et où commencent les phrases générées par ordinateur. Elle a constaté que les gens s’amélioraient progressivement pour repérer l’écriture de l’IA tout en jouant au jeu.
Bien que les éléments mentionnés ci-dessus vous aideront, le fait est que nous sommes le tout en territoire inexploré ici. Et à mesure que la technologie de l’IA se développe et devient de plus en plus sophistiquée, il devient de plus en plus difficile de faire la différence entre le réel et l’IA.