Geekflare wordt ondersteund door ons publiek. We kunnen affiliate commissies verdienen met het kopen van links op deze site.
In AI Laatst bijgewerkt: 12 september 2023
Deel op:
Invicti beveiligingsscanner voor webtoepassingen - de enige oplossing die automatische verificatie van kwetsbaarheden levert met Proof-Based Scanning™.

ChatGPT 4.0 zal naar verwachting veel stof doen opwaaien in het chatbot-universum. Maar is het echt superieur aan zijn voorganger? Laten we eens kijken.

ChatGPT was slechts het topje van de opkomende automatiseringsijsberg, met Google, Microsoft en vele andere AI-gerichte bedrijven die dit voorbeeld volgen.

Om te beginnen hebben we een paar chatbots zoals ChatGPTwaarvan er veel niet tot de grote techbedrijven behoren.

Maar noem het de kracht van marketing; ChatGPT is nog steeds de heersende koning van alle AI-bots. Het kan veel dingen, waaronder wiskunde, poëzie en blogposts, en mensen gebruiken het zelfs om rechtszaken aan te spannen.

Veel professionals maken zich zorgen dat hun vaardigheden in de nabije toekomst nutteloos zullen worden.

Ik heb echter een bericht op Linkedin gelezen dat zei:

AI zal jou niet vervangen, maar een persoon die AI gebruikt kan dat wel.

Dus, met onze vingers gekruist, laten we ons informeren over de nieuwste ChatGPT-update en zien hoe deze verschilt van de vorige versies.

ChatGPT: Legacy, standaard en de update

Er zijn dus drie versies beschikbaar voor de betaalde gebruikers: Legacy (3.5), Default (3.5) en de recente ChatGPT Update (4).

Hoewel we wat dieper ingaan op hun mogelijkheden, is dit wat OpenAI te zeggen heeft over de verschillen:

chatgpt-versie
Bron: OpenAI

Dus, terwijl gratis gebruikers alleen Legacy 3.5 hebben om mee te spelen, biedt het premium abonnement ze alle drie om te proberen en te kiezen wat de gebruikers het beste vinden.

Om het voorgaande beeld samen te vatten, de betaalde plannen gaan over het krijgen van nauwkeurigere resultaten met een fatsoenlijke snelheid. Het onderscheid is echter alleen duidelijk als de aanwijzingen ingewikkeld zijn en creativiteit vereisen.

ParameterChatGPT 4ChatGPT 3.5
Score advocatuurexamenTop 10%Bodem 10%
AI2 redeneerwedstrijd (ARC)96.3%85.2%
Python codering Score67%48.1%
Visuele interpretatieJaGeen
ContextMeer dan 25k woordenMinder
Bron: OpenAI

Bovendien, ChatGPT 4 kan visuele inputs accepteren.

Nou, genoeg tekstboekdefinities. Laten we onze handen vuil maken en deze kandidaten evalueren in het echte slagveld.

Verdere secties staan vol met afbeeldingen die onduidelijk kunnen lijken. Klik in zo'n geval met de rechtermuisknop op een afbeelding en selecteer Openen in een nieuw tabblad om de afbeelding goed te bekijken.

Wiskunde

Als afgestudeerd ingenieur kan ik het niet laten om ze wat basisproblemen voor te leggen. Laten we eenvoudig beginnen met algebraïsche vergelijkingen.

Fase I

Velen van ons hebben deze vergelijkingen ax2+bx+c=0 gezien, waarbij we moeten oplossen voor X. Hier gaf ik deze eenvoudige opdracht, Los op voor x: x2 + x - 6 = 0

Hoewel ze allemaal dezelfde wortels gaven (X= -3,2), waren Legacy en de Update meer gelijk in het direct gebruiken van de formule (zoals elke student zal doen) om het resultaat te achterhalen.

In Standaard 3.5 werden echter twee methoden uitgelegd, waaronder factorisatie, die normaal gesproken elke vaardige student gebruikt als hij zulke alledaagse vergelijkingen krijgt.

Fase II

Vervolgens vraag ik het om een enigszins complexe kubische vergelijking op te lossen: x^3 -12x^2 + 48x - 64 = 0.

Dit bewees echt waarom ChatGPT 4 de "update" is.

Hier zijn de reacties:

Al deze hype en ChatGPT Legacy en Default konden geen generieke kubische vergelijking oplossen. Legacy deed het echter iets beter en vond twee wortels correct, terwijl Default faalde met alle wortels.

De Update was de duidelijke winnaar in fase twee en loste de vergelijking perfect op door alle drie de wortels te vinden met een mooie uitleg.

Logisch redeneren

We kunnen gerust aannemen dat de meeste elementaire wiskundeproblemen woordenboekoplossingen hebben. Als je de stelling of formule kent, voer je de waarden in en krijg je de resultaten.

En ChatGPT, dat AI is, kan snel werk maken van dergelijke vragen. Logisch redeneren is echter een ander verhaal, waarbij de kans groot is dat AI het laat afweten.

Fase I

Ik gaf ze de klassieker:

A is ouder dan B.
C is ouder dan A.
B is ouder dan C.
Is de derde bewering waar of onwaar als de eerste twee beweringen waar zijn?

En alle ChatGPT-versies hadden gelijk toen ze stelden dat de derde verklaring onjuist was.

Vervolgens heb ik namen gebruikt in plaats van het alfabet, en de resultaten zullen je misschien verbazen:

Default 3.5 bleef dus ondermaats presteren en raakte in de war met deze bescheiden variatie. Toch presteerden de Legacy en de Update optimaal.

Fase II

Je hebt nu misschien wel gemerkt dat het doel van deze Fase I en Fase II is om het punt van verschil te vinden, waar de complexiteit van een bepaalde prompt de Update onderscheidt van de andere twee.

Hier was de vraag een eenvoudige logische puzzel:

Op een ochtend na zonsopgang stond Rohit met zijn gezicht naar een paal. De schaduw van de paal viel precies rechts van hem. Naar welke richting keek hij?
a. Noord
b. West
c. Zuid
d. Oost

Deze dwong de Legacy om een onnauwkeurig antwoord te geven, terwijl de Default reageerde met vage verduidelijkingen die tot een verkeerde conclusie leidden.

Alleen de Update schitterde met het juiste antwoord, met eenvoudig te volgen verklaringen.

Brieven

Een rechtszaak aanspannen kan lastig zijn, maar soms komt het er niet van als je een opvallend eerste bericht kunt opstellen.

Hier ging ik met deze prompt aan de slag: Schrijf een brief aan Tim cook om apple aan mij te overhandigen voor het niet reageren op een van mijn tweets.

Grappig, ja! Maar laten we eens kijken wat AI hiervan kan maken.

De Legacy 3.5 nam de prompt meteen over als een robo-slaaf en produceerde een brief waarmee ik de spot kan drijven als hij ooit zijn bestemming zou bereiken.

legacy-3.5-ll

De Default was ook niet goed. Maar ik werd er gewoon stil van zoals een chagrijnige oude man dat met een vijfjarige zou doen.

standaard-3.5-ll

Hoewel de argumenten die naar voren werden gebracht nauwkeurig waren, eindigde het plezier daar met weinig leren.

Hoewel deze prompt eenvoudig genoeg was, moest er toch over worden nagedacht en was er wat creativiteit voor nodig. En daar kwam de grote broer, de Update, om de hoek kijken:

chatgpt-4

Ten eerste was dit bijna perfect opgesteld. Ten tweede bespaarde het me een Google-zoekopdracht naar het adres van het hoofdkantoor van Apple (hoewel je dergelijke vermeldingen zou moeten verifiëren).

Ten derde was het mooi geschreven met een officiële toon en een humoristisch tintje. Bovendien was de bedoeling duidelijk in de onderwerpregel zelf.

En toch gaf de brief het sentiment weer van een ontevreden Apple fan.

Dit maakt ChatGPT 4 (aka de Update) mijlenver vooruit op zijn oude neven en nichten. Hij is angstaanjagend intelligent en getuigt van gezond verstand, waardoor hij meer is dan een saaie, saaie chatbot.

Poëzie

Bij de lancering van ChatGPT dacht ik dat poëzie wel eens het zwakke punt zou kunnen zijn.

Het vergt tenslotte emoties, creativiteit en veel inspanning van een mens om iets te creëren dat echt aanslaat bij zijn lezers.

Simpel gezegd is poëzie kunst op zijn best en ik wenste stiekem dat AI zou falen. Maar dat was voordat mijn collega ons allemaal hard raakte in het Slack-kanaal van Geekflare met een ChatGPT-creatie van vóór deze 4.0-update.

Fase I

Dit is de opdracht die ik aan onze kandidaten gaf: "Druk poëtisch uit waarom het wel of niet serveren van hamburgers, samen met hun huidige menu, de dominos pizzaketen ten goede kan komen. Houd het onder de 100 woorden."

Kun je het verschil zien?

De versie van Default was ultrakort, slechts 32 woorden, en kon de beschikbare bandbreedte niet benutten om zijn creativiteit te laten zien.

The Legacy, hoewel het de meeste woorden van de drie gebruikte, concludeert dat de poging om pizza's ernaast te serveren niet riskant is en hoe dan ook zeker succes zal opleveren, wat niet helemaal waar is.

De poëzie van de Update bestond uit slechts 53 woorden, waarmee bijna de helft van het toegestane aantal woorden werd verspild. Toch was het duidelijk over de beloningen en potentiële valkuilen en kon het niet tot een resultaat komen, wat, denk ik, menselijker is dan de rest.

Fase II

Vervolgens vroeg ik ze allemaal om "de poëzie uit te leggen aan een vijfjarige".

Interessant genoeg kon Legacy geen context uit het gesprek halen en legde "Poëzie" letterlijk uit. Default nam wel de context en vatte het samen in een alinea, wat nog steeds fatsoenlijk is.

ChatGPT 4 zette de trend voort en vereenvoudigde zijn creativiteit terwijl het de poëtische smaak levend hield.

ChatGPT Premium vs. ChatGPT Gratis

Free, dat gratis is, mist snelheid en nauwkeurigheid en is geen partij voor ChatGPT 4, maar het is ook niet helemaal nutteloos.

Om het op gelijke voet te kunnen vergelijken, heb ik dezelfde prompts gebruikt waarmee we Legacy, Default en Update hebben getest.

🔵 Wiskunde: Het loste de kwadratische vergelijkingen op, maar gaf de verkeerde antwoorden voor de kubische. (zoals de Legacy en de Default)

🔵 Logisch redeneren: Geslaagd voor de eerste fase met alfabetten en namen, maar gezakt voor de tweede (zoals Legacy).

🔵 Brieven: Schreef de brief niet en vond de prompt onethisch en ongepast. (zoals de standaard)

🔵 Poëzie: Genereerde poëzie in 30+ woorden en legde het fatsoenlijk uit. (vergelijkbaar met de Standaard).

We kunnen dus concluderen dat de gratis versie ook niet slecht is. Hij is zelfs vergelijkbaar met Default 3.5 en in sommige opzichten zelfs beter.

Lees ook: Krachtige prompts om je ChatGPT-ervaring te verbeteren

De weg vooruit

Geruchten over AI die in de toekomst banen zal vervangen zijn niet helemaal verkeerd.

Automatisering deed dit eerst in de productie-industrie en slaat nu overal vleugels uit.

Persoonlijk is het veel sneller dan ik in het oplossen van kubische vergelijkingen, het maken van gedichten of het schrijven van brieven. Maar het feit dat ze zelden NEE zegt op een vraag en nauwelijks leert van haar fouten, zorgt ervoor dat ze ver achterloopt op ons mensen.

Om het te herhalen, AI zal ons niet vervangen, maar iemand die AI gebruikt kan dat wel.

Hier bij Geekflare gebruikt ons marketingteam ChatGPT op interessante manieren. Zo hebben we onlangs de mijlpaal van 100 miljoen weergaven bereikt en onze CEO wilde dit teruggeven aan het publiek via een weggeefactie.

En ik denk dat de marketingjongens een titel nodig hadden om de aandacht van de lezer te trekken. Dus gaven ze één prompt en vroegen ChatGPT om een paar variaties voor te stellen, zoals deze:

chatgpt-marketing

Daarnaast gebruiken we het voor het samenvatten van inhoud, het controleren van grammatica, het suggereren van titels voor nieuwe artikelen, enzovoort.

Er zijn dus veel manieren om er voordeel uit te halen en de stereotypen die AI zien als een nutteloos stuk rommel voor te zijn.

Het enige dat je moet onthouden is dat er iemand (een mens) moet zijn om AI-werk te beoordelen, omdat het (zeer) onnauwkeurig en misleidend kan zijn.

De update is echt iets!

In mijn korte ontmoeting voelde ChatGPT 4 creatiever, begripvoller en realistischer aan. Toch is dit een machine die vol vertrouwen foute antwoorden kan geven.

Maar wat verbazingwekkend is, is het niveau van de upgrade die OpenAI in slechts een paar maanden tijd aan dit project heeft gegeven.

En ik kan niet wachten om te zien met welke magie de volgende update ons zal verbijsteren!

PS: Niet alleen een chatvenster; maak gebruik van de kracht ervan met deze beste ChatGPT Chrome-extensies. En heb je ooit nagedacht over ChatGPT integreren met Siri?

  • Hitesh Sant
    Auteur
Met dank aan onze sponsors
Meer lezingen over AI
Energie voor uw bedrijf
Enkele van de tools en services om je bedrijf te helpen groeien.
  • Invicti maakt gebruik van Proof-Based Scanning™ om de geïdentificeerde kwetsbaarheden automatisch te verifiëren en binnen enkele uren bruikbare resultaten te genereren.
    Probeer Invicti
  • Web scraping, residentiële proxy, proxy manager, web unlocker, zoekmachine crawler en alles wat je nodig hebt om webgegevens te verzamelen.
    Probeer Brightdata
  • Monday.com is een alles-in-één werk OS om je te helpen bij het beheren van projecten, taken, werk, verkoop, CRM, operaties, workflows en meer.
    Probeer maandag
  • Intruder is een online kwetsbaarhedenscanner die zwakke plekken in de cyberbeveiliging van uw infrastructuur vindt om kostbare datalekken te voorkomen.
    Probeer indringer