ChatGPT-4 vs ChatGPT-3.5 Default vs. ChatGPT-3.5 Legacy : Différences testées

ChatGPT 4.0 devrait faire de grandes vagues dans l’univers des chatbots. Mais est-il vraiment supérieur à son prédécesseur ? Voyons cela de plus près.

ChatGPT n’était que la partie émergée de l’iceberg de l’automatisation à venir, avec Google, Microsoft et bien d’autres entreprises à la pointe de l’IA.

Pour commencer, nous avons trouvé quelques chatbots comme ChatGPT, dont beaucoup n’appartiennent pas aux grandes entreprises technologiques.

Mais appelez cela le pouvoir du marketing : ChatGPT reste le roi de tous les chatbots d’IA de ce type. Il peut faire beaucoup de choses, y compris des mathématiques, de la poésie et des articles de blog, et les gens l’utilisent même pour intenter des procès.

DoNotPay is working on using GPT-4 to generate "one click lawsuits" to sue robocallers for $1,500. Imagine receiving a call, clicking a button, call is transcribed and 1,000 word lawsuit is generated. GPT-3.5 was not good enough, but GPT-4 handles the job extremely well: pic.twitter.com/gplf79kaqG
— Joshua Browder (@jbrowder1) March 14, 2023

De nombreux professionnels s’inquiètent de voir leurs compétences devenir inutiles dans un avenir proche.

Cependant, j’ai lu un article de Linkedin qui disait : “L’IA ne vous remplacera pas, mais elle vous remplacera :

L’IA ne vous remplacera pas, mais une personne utilisant l’IA peut le faire.

En croisant les doigts, nous allons donc nous informer sur la dernière mise à jour de ChatGPT et voir en quoi elle diffère des versions précédentes.

ChatGPT : L’ancienne version, la version par défaut et la mise à jour

Il y a trois versions disponibles pour les utilisateurs payants : Legacy (3.5), Default (3.5), et la récente ChatGPT Update (4).

Nous allons approfondir leurs capacités, mais voici ce qu’OpenAI a à dire sur les différences :

Ainsi, alors que les utilisateurs gratuits n’ont que Legacy 3.5 pour jouer, l’abonnement premium offre les trois pour essayer de déterminer ce que les utilisateurs pensent être le meilleur.

Pour résumer l’image précédente, les plans payants permettent d’obtenir des résultats plus précis à une vitesse décente. Cependant, les distinctions ne sont apparentes que si les invites sont compliquées et nécessitent de la créativité.

Paramètre	ChatGPT 4	ChatGPT 3.5
Score à l’examen du barreau	10 % les plus élevés	10% inférieurs
Défi de raisonnement AI2 (ARC)	96.3%	85.2%
Score en codage Python	67%	48.1%
Interprétation visuelle	Oui	Non
Contexte	Plus de 25 000 mots	Moins

Source : OpenAI

En outre, ChatGPT 4 peut accepter des entrées visuelles.

Bon, assez de définitions théoriques. Mettons les mains dans le cambouis et évaluons ces candidats sur le terrain de la vie réelle.

Les sections suivantes sont remplies d’images qui peuvent sembler peu claires. Dans ce cas, cliquez avec le bouton droit de la souris sur une image et sélectionnez Ouvrir dans un nouvel onglet pour l’afficher correctement.

Les mathématiques

En tant qu’ingénieur diplômé, je ne peux m’empêcher de leur poser quelques problèmes de base. Commençons par les équations algébriques.

Étape I

Beaucoup d’entre nous ont vu ces équations ax2 bx c=0, où nous devons résoudre X. Ici, j’ai donné cette simple consigne, Résolvez x : ^x2 x – 6 = 0

Bien que tous aient donné les mêmes racines (X= -3,2), Legacy et la mise à jour ont été plus semblables en utilisant la formule directement (comme tout étudiant) pour trouver le résultat.

Cependant, Default 3.5 expliquait deux méthodes, dont la factorisation, que tout étudiant compétent utilise normalement lorsqu’on lui donne des équations aussi banales.

Étape II

Ensuite, je l’ai invité à résoudre une équation cubique légèrement complexe : x^3 -12x^2 48x – 64 = 0.

Cela prouve vraiment pourquoi ChatGPT 4 est la “mise à jour”.

Voici les réponses :

Tout ce battage médiatique et ChatGPT Legacy et Default n’ont pas pu résoudre une équation cubique générique. Cependant, Legacy a fait un peu mieux et a trouvé deux racines correctement, alors que Default a échoué avec toutes.

La mise à jour a été le grand vainqueur de la deuxième étape et a résolu l’équation à la perfection, en trouvant les trois racines avec une belle explication.

Raisonnement logique

Nous pouvons supposer que la plupart des problèmes mathématiques élémentaires ont des solutions de type dictionnaire. Si vous connaissez le théorème ou la formule, entrez les valeurs et vous obtiendrez les résultats.

Et ChatGPT, en tant qu’IA, peut répondre rapidement à ce type de questions. Cependant, le raisonnement logique est un territoire différent, où l’IA a de grandes chances de tomber à plat.

Première étape

Je leur ai donné le classique :

A est plus vieux que B.
C est plus ancien que A.
B est plus vieux que C.
La troisième affirmation est-elle vraie ou fausse si les deux premières sont vraies ?

Toutes les versions de ChatGPT ont répondu que la troisième affirmation était fausse.

Ensuite, j’ai utilisé des noms à la place de l’alphabet, et les résultats pourraient vous surprendre :

Ainsi, Default 3.5 a poursuivi ses performances médiocres et a été confondu avec cette modeste variation. Cependant, l’héritage et la mise à jour ont fonctionné de manière optimale.

Étape II

Vous avez peut-être remarqué que l’objectif des étapes I et II est de trouver le point de différence, où la complexité d’une invite donnée différencie la mise à jour des deux autres.

Dans le cas présent, il s’agissait d’une simple énigme logique :

Un matin, après le lever du soleil, Rohit se tenait face à un poteau. L’ombre du poteau tombait exactement à sa droite. Dans quelle direction se trouvait-il ?
a. Le nord
b. L’ouest
c. Sud
d. Est

Cette question a poussé le Legacy à donner une réponse inexacte, tandis que le Default a répondu par de vagues clarifications conduisant à une conclusion erronée.

Seule la mise à jour s’est distinguée en donnant la bonne réponse, avec des énoncés faciles à suivre.

Lettres

Intenter un procès peut s’avérer délicat, mais parfois il n’est pas nécessaire d’en arriver là si vous parvenez à rédiger un premier avis percutant.

Dans ce cas, j’ai opté pour l’exercice suivant : Écrivez une lettre à Tim Cook pour qu’il me remette Apple parce qu’il n’a pas répondu à l’un de mes tweets.

C’est drôle, oui ! Mais voyons ce que l’IA peut en tirer.

Le Legacy 3.5 a tout de suite pris l’invitation comme un esclave robotisé et a produit une lettre qui pourrait faire de moi un excellent sujet de moquerie si elle atteignait sa destination.

Le Défaut n’était pas bon non plus. Cependant, il m’a simplement fait taire comme un vieil homme grincheux le ferait avec un enfant de cinq ans.

Bien que les arguments avancés aient été pertinents, cela a mis fin au plaisir et à l’apprentissage.

Bien qu’il s’agisse d’une question assez simple, elle nécessitait un peu de réflexion et de créativité. Et c’est là que le grand frère, la mise à jour, a fait valoir ses arguments :

Tout d’abord, elle a été rédigée presque parfaitement. Deuxièmement, elle m’a évité une recherche sur Google pour trouver l’adresse du siège d’Apple (bien qu’il faille vérifier ce genre d’informations).

Troisièmement, c’était bien écrit, avec un ton officiel et une touche d’humour. En outre, l’intention était claire dans la ligne d’objet elle-même.

Enfin, la lettre exprimait le sentiment d’un fan d’Apple mécontent.

Ainsi, ChatGPT 4 (alias la mise à jour) est à mille lieues de ses anciens cousins. Il est terriblement intelligent et fait preuve de bon sens, ce qui en fait bien plus qu’un chatbot ennuyeux.

Poésie

Avec le lancement de ChatGPT, j’ai pensé que la poésie pourrait être son point faible.

Après tout, il faut des émotions, de la créativité et beaucoup d’efforts à un être humain pour créer quelque chose qui résonne vraiment avec ses lecteurs.

En d’autres termes, la poésie est l’art dans ce qu’il a de meilleur, et je souhaitais secrètement que l’IA échoue. Mais c’était avant que mon collègue ne nous frappe tous durement dans le canal Slack de Geekflare avec une création ChatGPT qui datait d’avant la mise à jour 4.0.

Étape I

Voici la consigne que j’ai donnée à nos candidats : “Exprimez poétiquement pourquoi la chaîne de pizzas Dominos peut tirer profit du fait de servir des hamburgers ou de ne pas en servir, tout en conservant son menu actuel. Ne dépassez pas 100 mots”

Voyez-vous la différence ?

La version de Default était ultra-courte, 32 mots seulement, et n’a pas pu utiliser la bande passante disponible pour mettre en valeur sa créativité.

L’Héritage, bien qu’il ait utilisé le plus grand nombre de mots parmi les trois, conclut que l’initiative de servir des pizzas à côté n’est pas risquée et qu’elle sera couronnée de succès dans tous les cas, ce qui n’est pas tout à fait vrai.

La poésie de la mise à jour ne comptait que 53 mots, soit près de la moitié du nombre de mots alloués. Pourtant, il était clair sur les récompenses et les pièges potentiels et n’a pas pu arriver à un résultat, ce qui est, je suppose, plus humain que le reste.

Deuxième étape

Ensuite, je leur ai demandé à tous d’”expliquer la poésie à un enfant de cinq ans”

Il est intéressant de noter que Legacy n’a pas pu prendre en compte le contexte de la conversation et a expliqué “Poésie” littéralement. Default a pris le contexte et l’a résumé en un paragraphe, ce qui est tout de même convenable.

Poursuivant la tendance, ChatGPT 4 a simplifié sa créativité tout en conservant la saveur poétique.

ChatGPT Premium vs. ChatGPT Free

Free, étant gratuit, manque de vitesse et de précision et n’est pas à la hauteur de ChatGPT 4, mais il n’est pas non plus totalement inutile.

Pour le comparer sur un pied d’égalité, je lui ai lancé les mêmes invites que celles avec lesquelles nous avons testé Legacy, Default et Update.

🔵 Mathématiques: Il a résolu les équations quadratiques mais a donné les mauvaises réponses pour les équations cubiques. (comme pour Legacy et Default)

🔵 Raisonnement logique: A réussi la première étape avec les alphabets et les noms mais a échoué à la seconde (comme le Legacy).

🔵 Lettres: N’a pas écrit la lettre et a jugé l’invite contraire à l’éthique et inappropriée. (comme le Défaut)

🔵 Poésie: A généré une poésie en 30 mots et l’a expliquée décemment. (similaire à la valeur par défaut).

Nous pouvons donc conclure que la version gratuite n’est pas mauvaise non plus. En fait, elle est au même niveau que Default 3.5 et même meilleure à certains égards.

Lisez aussi : Des invites puissantes pour améliorer votre expérience ChatGPT

La voie de l’avenir

Les rumeurs selon lesquelles l’IA remplacera les emplois à l’avenir ne sont pas complètement fausses.

L’automatisation a d’abord touché l’industrie manufacturière, et elle se répand maintenant partout ailleurs.

Personnellement, elle est bien plus rapide que moi pour résoudre des équations cubiques, créer des poèmes ou écrire des lettres. Cependant, le fait qu’elle dise rarement NON à une demande et qu’elle n’apprenne guère de ses erreurs la place loin derrière nous, les humains.

Je le répète, l’IA ne nous remplacera pas, mais quelqu’un qui l’utilise peut le faire.

Chez Geekflare, notre équipe marketing utilise ChatGPT de manière intéressante. Par exemple, nous avons récemment atteint la barre des 100 millions de vues, et notre PDG a pensé à en faire profiter le public par le biais d’un cadeau.

Et je suppose que les responsables du marketing avaient besoin d’un titre pour attirer l’attention des lecteurs. Ils ont donc proposé un titre et demandé à ChatGPT de suggérer quelques variantes, comme celle-ci :

En outre, nous l’utilisons pour résumer le contenu, vérifier la grammaire, suggérer des titres pour de nouveaux articles, etc.

En conclusion, il existe de nombreuses façons de tirer parti de l’IA et d’aller à l’encontre des stéréotypes qui la considèrent comme un tas de ferraille inutile.

La seule chose à retenir est qu’il doit y avoir quelqu’un (d’humain) pour juger le travail de l’IA, car il peut être (grossièrement) inexact et trompeur.

La mise à jour est vraiment quelque chose !

Lors de ma courte expérience, ChatGPT 4 m’a semblé plus créatif, plus compréhensif et plus réaliste. Il n’en reste pas moins qu’il s’agit d’une machine et qu’elle peut donner des réponses erronées en toute confiance.

Mais ce qui est stupéfiant, c’est le niveau d’amélioration qu’OpenAI a apporté à ce projet en l’espace de quelques mois seulement.

Et j’ai hâte de voir la magie avec laquelle la prochaine mise à jour nous déconcertera !

PS : Ce n’est pas qu’une simple fenêtre de chat ; exploitez sa puissance avec ces meilleures extensions Chrome ChatGPT. Et avez-vous déjà pensé à intégrer ChatGPT à Siri?

Hitesh Sant
Contributeur
- LinkedIn
Hitesh Sant est rédacteur technique senior chez Geekflare, où il couvre la cybersécurité, les systèmes d’exploitation, l’IA générative et les crypto-monnaies. Ses écrits bénéficient de son expérience pratique des logiciels SaaS chauds et des dernières technologies, dans le but de démystifier des concepts technologiques complexes pour les consommateurs finaux.