ChatGPT-4 vs. ChatGPT-3.5 Default vs. ChatGPT-3.5 Legacy: Getestete Unterschiede

ChatGPT 4.0 wird voraussichtlich große Wellen im Chatbot-Universum schlagen. Aber ist es seinem Vorgänger wirklich überlegen? Schauen wir mal vorbei.

ChatGPT war nur die Spitze des bevorstehenden Automatisierungs-Eisbergs, dem Google, Microsoft und viele andere KI-First-Unternehmen folgten.

Für den Anfang haben wir ein paar Chatbots wie ChatGPT gefunden, von denen viele nicht zu Big Tech gehören.

Aber nennen Sie es die Macht des Marketings; ChatGPT ist immer noch der amtierende König aller dieser KI-Bots. Es kann viele Dinge tun, einschließlich Mathematik, Poesie und Blog-Posts, und die Leute nutzen es sogar, um Klagen einzureichen.

DoNotPay arbeitet daran, GPT-4 zu verwenden, um „Ein-Klick-Klagen“ zu generieren, um Robocaller auf 1.500 US-Dollar zu verklagen. Stellen Sie sich vor, Sie erhalten einen Anruf, klicken auf eine Schaltfläche, der Anruf wird transkribiert und eine Klage mit 1.000 Wörtern wird generiert. GPT-3.5 war nicht gut genug, aber GPT-4 erledigt den Job sehr gut: pic.twitter.com/gplf79kaqG

– Joshua Browder (@jbrowder1) 14. März 2023

Es gibt Dutzende von Fachleuten, die sich Sorgen machen, dass ihre Fähigkeiten in naher Zukunft nutzlos werden.

Ich habe jedoch einen Linkedin-Beitrag gelesen, in dem es hieß:

KI wird Sie nicht ersetzen, aber eine Person, die KI verwendet, kann es.

Drücken wir also die Daumen, lassen Sie uns über das neueste ChatGPT-Update informieren und sehen, wie es sich von seinen vorherigen Versionen unterscheidet.

ChatGPT: Legacy, Standard und das Update

Den zahlenden Benutzern stehen also drei Versionen zur Verfügung: Legacy (3.5), Default (3.5) und das aktuelle ChatGPT-Update (4).

Obwohl wir ein wenig tiefer auf ihre Fähigkeiten eingehen werden, hat OpenAI Folgendes über die Unterschiede zu sagen:

Quelle: OpenAI

Während kostenlose Benutzer also nur Legacy 3.5 zum Spielen haben, bietet das Premium-Abonnement alle drei, um zu versuchen, sich mit dem zufrieden zu geben, was die Benutzer für das Beste halten.

Um das vorherige Bild zusammenzufassen, geht es bei den bezahlten Plänen darum, genauere Ergebnisse mit einer angemessenen Geschwindigkeit zu erzielen. Die Unterschiede sind jedoch nur offensichtlich, wenn die Eingabeaufforderungen kompliziert sind und Kreativität erfordern.

ParameterChatGPT 4ChatGPT 3.5Bar Exam ScoreTop 10%Low 10%AI2 Reasoning Challenge (ARC)96.3%85.2%Python Coding Score67%48.1%Visuelle InterpretationJaNeinKontextMehr als 25.000 WörterWenigerQuelle: OpenAI

Außerdem kann ChatGPT 4 visuelle Eingaben akzeptieren.

Nun, genug der Lehrbuchdefinitionen. Machen wir uns die Hände schmutzig und bewerten diese Kandidaten auf dem echten Schlachtfeld.

Weitere Abschnitte sind voller Bilder, die unklar erscheinen können. Klicken Sie in einem solchen Fall mit der rechten Maustaste auf ein beliebiges Bild und wählen Sie In neuem Tab öffnen, um es richtig anzuzeigen.

Mathematik

Als Diplom-Ingenieur kann ich nicht anders, als ihnen einige grundlegende Probleme zu stellen. Beginnen wir einfach mit algebraischen Gleichungen.

Stufe I

Viele von uns haben diese Gleichungen ax2+bx+c=0 gesehen, bei denen wir nach X auflösen müssen. Hier habe ich diese einfache Aufforderung gegeben: Löse nach x: x2 + x – 6 = 0

Während alle die gleichen Nullstellen ergaben (X= -3,2), waren Legacy und das Update ähnlicher darin, die Formel direkt zu verwenden (wie es jeder Schüler tun wird), um das Ergebnis herauszufinden.

  So ändern Sie Ihr Netflix-Profil, Untertitel und Audiosprache

Standard 3.5 erklärte jedoch zwei Methoden, einschließlich Faktorisierung, die normalerweise jeder erfahrene Student einsetzt, wenn er solch banale Gleichungen erhält.

Stadium II

Als nächstes fordere ich ihn auf, eine etwas komplexe kubische Gleichung zu lösen: x^3 -12x^2 + 48x – 64 = 0.

Dies hat wirklich bewiesen, warum ChatGPT 4 das „Update“ ist.

Hier die Antworten:

All dieser Hype und ChatGPT Legacy und Default konnten eine generische kubische Gleichung nicht lösen. Legacy schnitt jedoch etwas besser ab und fand zwei Wurzeln richtig, während Default mit allen versagte.

Das Update war der klare Gewinner in Phase zwei und löste die Gleichung perfekt, indem es alle drei Wurzeln mit einer schönen Erklärung fand.

Logisches Denken

Wir können mit Sicherheit davon ausgehen, dass die meisten elementaren mathematischen Probleme Wörterbuchlösungen haben. Wenn Sie den Satz oder die Formel kennen, geben Sie die Werte ein und erhalten Sie die Ergebnisse.

Und ChatGPT als KI kann solche Anfragen schnell bearbeiten. Logisches Denken ist jedoch ein anderes Gebiet, mit hoher Wahrscheinlichkeit, dass die KI versagt.

Stufe I

Ich habe ihnen den Klassiker gegeben:

A ist älter als B.
C ist älter als A.
B ist älter als C.
Ist die dritte Aussage wahr oder falsch, wenn die ersten beiden Aussagen wahr sind?

Und alle ChatGPT-Versionen gaben zu Recht an, dass die dritte Aussage falsch war.

Als nächstes habe ich Namen anstelle des Alphabets verwendet, und die Ergebnisse könnten Sie überraschen:

Also setzte Default 3.5 seine unterdurchschnittliche Leistung fort und wurde mit dieser bescheidenen Variante verwechselt. Trotzdem schnitten das Legacy und das Update optimal ab.

Stadium II

Sie haben vielleicht schon bemerkt, dass der Zweck dieser Phase I und Phase II darin besteht, den Unterschied zu finden, bei dem die Komplexität einer bestimmten Eingabeaufforderung das Update von den beiden anderen unterscheidet.

Hier war die Eingabeaufforderung ein einfaches logisches Puzzle:

Eines Morgens nach Sonnenaufgang stand Rohit vor einem Pfahl. Der Schatten der Stange fiel genau rechts von ihm. In welche Richtung blickte er?
A. Norden
B. Westen
C. Süd
D. Ost

Dieser drängte das Legacy, eine ungenaue Antwort zu geben, während der Default mit vagen Klarstellungen antwortete, die zu einer falschen Schlussfolgerung führten.

Nur das Update glänzte mit der richtigen Antwort, mit leicht nachvollziehbaren Aussagen.

Briefe

Das Einreichen von Klagen kann schwierig sein, aber manchmal kommt es nicht dazu, wenn Sie einen auffälligen ersten Bescheid verfassen können.

Hier ging ich mit dieser Aufforderung: Schreiben Sie einen Brief an Tim Cook, um mir Apple zu übergeben, weil er nicht auf einen meiner Tweets geantwortet hat.

Komisch, ja! Aber mal sehen, was KI daraus machen kann.

Der Legacy 3.5 nahm die Aufforderung sofort wie ein Robo-Sklave und produzierte am laufenden Band einen Brief, der mich zu einem hervorragenden Gegenstand des Spotts machen kann, wenn er jemals sein beabsichtigtes Ziel erreicht.

  So fügen Sie einem Objekt in Microsoft Word alternativen Text hinzu

Der Default war auch nicht gut. Es hat mich jedoch einfach zum Schweigen gebracht, wie es ein mürrischer alter Mann mit einem Fünfjährigen tun würde.

Während die vorgebrachten Argumente punktgenau waren, beendete dies den Spaß genau dort mit wenig Lernen.

Obwohl dies eine ziemlich einfache Eingabeaufforderung war, erforderte es etwas Überlegung und Kreativität. Und hier hat sich der große Bruder, das Update, durchgesetzt:

Erstens wurde dies nahezu perfekt entworfen. Zweitens ersparte es mir eine Google-Suche nach der Adresse der Apple-Zentrale (obwohl man solche Einträge überprüfen sollte).

Drittens war es schön geschrieben mit einem offiziellen Ton und einer humorvollen Note. Außerdem war die Absicht in der Betreffzeile selbst klar.

Und dennoch vermittelte der Brief die Stimmung eines verärgerten Apple-Fans.

Damit ist ChatGPT 4 (auch bekannt als das Update) seinen alten Cousins ​​meilenweit voraus. Es ist beängstigend intelligent und hat einige Anzeichen von gesundem Menschenverstand, was es zu mehr als einem langweiligen, langweiligen Chatbot macht.

Poesie

Mit dem Start von ChatGPT könnte die Poesie, dachte ich, sein Schwachpunkt sein.

Schließlich braucht ein Mensch Emotionen, Kreativität und viel Mühe, um etwas zu schaffen, das seine Leser wirklich anspricht.

Einfach gesagt, Poesie ist Kunst vom Feinsten, und ich wünschte mir insgeheim, dass die KI scheitern würde. Aber das war, bevor mein Kollege uns alle im Slack-Kanal von wdzwdz mit einer ChatGPT-Kreation hart getroffen hat, die vor diesem 4.0-Update war.

Stufe I

Hier ist die Aufforderung, die ich unseren Kandidaten gegeben habe: „Drücken Sie poetisch aus, warum oder warum das Servieren von Burgern zusammen mit ihrem aktuellen Menü der Dominos-Pizzakette zugute kommen kann. Beschränken Sie sich auf weniger als 100 Wörter.“

Erkennst du den Unterschied?

Die Version von Default war mit nur 32 Wörtern ultrakurz und konnte die verfügbare Bandbreite nicht nutzen, um seine Kreativität zu demonstrieren.

The Legacy, obwohl es die meisten Wörter unter den dreien verwendet hat, kommt zu dem Schluss, dass das Unterfangen, Pizzas nebenan zu servieren, nicht riskant ist und in jedem Fall zu sicherem Erfolg führen wird, was nicht ganz stimmt.

Die Poesie des Updates bestand aus nur 53 Wörtern, was fast die Hälfte der zugeteilten Wortzahl verschwendete. Trotzdem war es sich über die Belohnungen und potenziellen Fallstricke im Klaren und konnte zu keinem Ergebnis kommen, das meiner Meinung nach humaner ist als der Rest.

Stadium II

Als nächstes bat ich sie alle, „einem Fünfjährigen die Gedichte zu erklären“.

Interessanterweise konnte Legacy dem Gespräch keinen Kontext entnehmen und erklärte „Poetry“ wörtlich. Default hat den Kontext genommen und in einem noch anständigen Absatz zusammengefasst.

ChatGPT 4 setzte den Trend fort und vereinfachte seine Kreativität, während der poetische Geschmack am Leben erhalten wurde.

ChatGPT Premium vs. ChatGPT Free

Free, da es kostenlos ist, mangelt es an Geschwindigkeit und Genauigkeit und ist kein Match gegen ChatGPT 4, aber es ist auch nicht völlig nutzlos.

  So überprüfen Sie den freien Speicherplatz auf einem Mac

Um es auf Augenhöhe zu vergleichen, habe ich ihm die gleichen Eingabeaufforderungen gegeben, mit denen wir Legacy, Default und Update getestet haben.

🔵 Mathematik: Es hat die quadratischen Gleichungen gelöst, aber die falschen Antworten für die kubischen gegeben. (wie Legacy und Default)

🔵 Logisches Denken: Die erste Phase mit Alphabeten und Namen bestanden, aber die zweite nicht bestanden (wie Legacy).

🔵 Briefe: Ich habe den Brief nicht geschrieben und hielt die Aufforderung für unethisch und unangemessen. (wie der Standard)

🔵 Poesie: Gedichte in über 30 Wörtern erstellt und anständig erklärt. (ähnlich dem Standard).

Wir können also feststellen, dass die kostenlose Version auch nicht schlecht ist. Tatsächlich ist es auf Augenhöhe mit Default 3.5 und in einigen Aspekten sogar besser.

Lesen Sie auch: Leistungsstarke Eingabeaufforderungen zur Verbesserung Ihrer ChatGPT-Erfahrung

Der Weg voraus

Gerüchte, dass KI in Zukunft Jobs ersetzen wird, sind nicht ganz falsch.

Zuerst hat die Automatisierung dies in der Fertigungsindustrie getan, und jetzt breitet sie überall sonst Flügel aus.

Persönlich ist es viel schneller als ich, wenn es darum geht, kubische Gleichungen zu lösen, Gedichte zu schreiben oder Briefe zu schreiben. Dass es selten NEIN zu einer Aufforderung sagt und kaum aus seinen Fehlern lernt, bleibt uns Menschen jedoch verborgen.

Um es noch einmal zu wiederholen: KI wird uns nicht ersetzen, aber jemand, der KI verwendet, kann es.

Hier bei wdzwdz verwendet unser Marketingteam ChatGPT auf interessante Weise. Zum Beispiel haben wir kürzlich den Meilenstein von 100 Millionen Aufrufen erreicht, und unser CEO dachte daran, es dem Publikum über ein Werbegeschenk zurückzugeben.

Und ich schätze, die Marketingleute brauchten einen Titel, um die Aufmerksamkeit des Lesers zu erregen. Also gaben sie eine Aufforderung und baten ChatGPT, einige Variationen vorzuschlagen, wie diese:

Außerdem verwenden wir es zur Inhaltszusammenfassung, Grammatikprüfung, zum Vorschlagen von Titeln für neue Artikel und so weiter.

Zusammenfassend lässt sich sagen, dass es viele Möglichkeiten gibt, Vorteile zu nutzen und Stereotypen, die KI als nutzloses Stück Müll betrachten, einen Schritt voraus zu sein.

Das Einzige, woran man denken muss, ist, dass es jemanden (Menschen) geben muss, der die KI-Arbeit beurteilt, da sie (grob) ungenau und irreführend sein kann.

Das Update ist wirklich etwas!

In meiner kurzen Begegnung fühlte sich ChatGPT 4 kreativer, verständnisvoller und realistischer an. Dennoch ist dies eine Maschine und kann getrost falsche Antworten geben.

Aber was erstaunlich ist, ist das Ausmaß an Upgrades, das OpenAI in nur wenigen Monaten an diesem Projekt vorgenommen hat.

Und ich kann es kaum erwarten, die Magie zu sehen, mit der uns das nächste Update verwirren könnte!

PS: Nicht nur ein Chatfenster; Nutzen Sie seine Leistungsfähigkeit mit diesen besten ChatGPT Chrome-Erweiterungen. Und haben Sie jemals darüber nachgedacht, ChatGPT mit Siri zu integrieren?