OpenAI GPT-4: Multimodal, neue Funktionen, Bildeingabe, Verwendung und mehr

OpenAI hat mit der Veröffentlichung von GPT-4 letzte Nacht enorme Wellen geschlagen. Das KI-Sprachmodell der nächsten Generation ist eine spürbare Verbesserung gegenüber seinem Vorgänger und kann so viel mehr. Wenn Sie ein oder zwei Dinge über ChatGPT und seine Alternativen wissen, wissen Sie bereits, was dies für Chatbots und künstliche Intelligenz im Allgemeinen bedeutet. Für diejenigen, die Sprachmodelle oder insbesondere GPT-4 nicht kennen, haben wir jedoch Ihren Rücken. Wir haben die Blogs von OpenAI und das Internet durchforstet und einen speziellen Leitfaden zu GPT-4 kuratiert. Wenn Sie also jemand sind, der wenig bis gar keine Ahnung davon hat, holen Sie sich eine Tasse Kaffee und setzen Sie sich hin, während wir Ihnen alles über dieses KI-Modell erzählen.

GPT-4: Alles, was Sie wissen müssen (2023)

Das Thema GPT-4 ist weit verbreitet, wenn es um Informationen geht. Um Ihnen beim Sortieren zu helfen, haben wir unten eine Tabelle erstellt. Verwenden Sie es, wenn Sie schnell zu einem bestimmten Aspekt des Modells springen möchten.

Inhaltsverzeichnis

Was ist GPT-4?

Einfach ausgedrückt ist GPT-4 die neueste Iteration von OpenAI in den Large Language Model Systems (LLM) des Unternehmens. Sprachmodellsysteme sind im Allgemeinen Systeme, die versuchen, das nächste Wort in einem Satz vorherzusagen und ihre Eingaben intelligent hinzuzufügen. Sie tun dies, indem sie einen großen Datensatz untersuchen, der ihnen die Möglichkeit gibt, Muster zu erkennen und darauf zu reagieren.

GPT-4 ist das neueste Modell in dieser Serie und wird voraussichtlich eine große Verbesserung gegenüber Modellen der vorherigen Generation wie GPT 3 und 3.5 darstellen. Es gibt einige spezifische Dinge, in denen GPT-4 besser ist, auf die wir weiter unten ausführlich eingehen werden. Ein einfacher Punkt, den Sie jedoch verstehen sollten, ist, dass dieses neue Modell Chatbots wie ChatGPT und MS Bing in die Lage versetzen wird, in ihren Antworten viel leistungsfähiger zu sein. Sie können also davon ausgehen, dass sie bessere Antworten geben, kreativer gestalten und mit älteren und neueren ChatGPT-Eingabeaufforderungen unterschiedlich funktionieren.

GPT-4 ist multimodal

Wenn Sie die vorherigen GPT-Modelle verwendet haben, sind Sie sich möglicherweise der begrenzten Fähigkeit bewusst, nur den von Ihnen eingegebenen Text zu interpretieren. Eine der neuesten und größten Implementierungen des neuen Modells ist jedoch, dass es multimodal ist. Das bedeutet, dass GPT-4 Eingabeaufforderungen sowohl von Text als auch von Bildern akzeptieren kann.

Dies bedeutet, dass die KI das Bild nicht nur empfängt, sondern tatsächlich interpretiert und versteht . Dieses Verständnis gilt für Eingabeaufforderungen, die sowohl mit Text-als auch mit Bildeingaben durchsetzt sind. Darüber hinaus wird sich die multimodale Fähigkeit von GPT-4 auf alle Größen und Arten von Bildern und Texten ausbreiten, einschließlich Dokumenten mit Text und Fotos, Diagrammen (skizziert oder handgezeichnet) oder Screenshots. Die Ausgabe von GPT-4 bleibt so leistungsfähig wie bei reinen Texteingaben.

In einem von OpenAI organisierten Entwickler-Livestream stellte das Unternehmen GPT vor Die multimodale Natur von-4. GPT-4 wurde ein Screenshot eines Discord-Fensters im Stream zur Verfügung gestellt und gebeten, es akribisch detailliert zu beschreiben.

Das Modell dauerte etwas mehr als eine Minute und lieferte eine äußerst anschauliche und genaue Antwort. Die Antwort erfasste fast jedes einzelne Element des Eingabebildschirms. Vom Servernamen in der oberen linken Ecke über die verschiedenen Sprachkanäle bis hin zur Benennung aller Discord-Mitglieder online im rechten Bereich hat GPT-4 alles erfasst.

GPT-4 wurde einigen weiteren Tests unterzogen, bei denen Leute mehrere zufällige Kunstwerke einreichten, darunter Fotos eines Eichhörnchens, das eine Kamera hält. Das Modell wurde dann gebeten, herauszufinden, „was an diesem Bild lustig war“. Es gab wieder eine Antwort, die besagte, dass das Foto lustig sei, weil Eichhörnchen normalerweise Nüsse essen und sich nicht wie Menschen verhalten. Wie gesehen, lieferte es wieder eine sehr spezifische Antwort, wie es ein Mensch tun würde.

Allerdings , wie oben erwähnt, geht die Spezifität des Modells über Screenshots hinaus und auf Text-und Bildeingaben aller Art. OpenAI zeigte dasselbe, als Greg ein Foto eines handgezeichneten Modells einer Witz-Website machte. Anschließend lud er dasselbe auf den API-verbundenen Discord-Server von GPT-4 hoch. Das Modell wurde dann gebeten, „kurzen HTML/JS-Code zu schreiben, um die Seite in eine Website umzuwandeln und die Witze durch echte zu ersetzen.“

Erstaunlicherweise hat GPT-4 den funktionierenden Code dafür kompiliert. Beim Testen wurde eine voll funktionsfähige Website erstellt, auf der das Drücken der Tasten die Witze enthüllte. Die Tatsache, dass das ChatGPT-Modell die menschliche Handschrift entziffern und Code aus einer Kombination von Text-und Bildeingaben erstellen konnte, ist überwältigend. Die multimodale Fähigkeit von GPT-4 ist ein großer Schritt in Richtung einer KI, die die Eingabeaufforderungen vollständig versteht und Ergebnisse mit absolut perfekter Genauigkeit liefert.

Obwohl es keine nennenswerten Probleme gab, behauptete OpenAI, dass Geschwindigkeit etwas ist, mit dem GPT-4 arbeiten könnte, und es könnte einige Zeit dauern. Darüber hinaus befinden sich visuelle Eingaben für GPT-4 noch in der Forschungsvorschau und sind immer noch nicht öffentlich verfügbar.

Inwiefern ist GPT-4 besser als GPT 3.5/GPT-3?

Neben seinem atemberaubenden multimodalen Ansatz hat GPT-4 noch weitere Verbesserungsbereiche, in denen das neue Modell nicht nur übertrifft seine älteren Brüder. Einige dieser Bereiche sind:

1. Besseres Verständnis nuancierter Eingabeaufforderungen

OpenAI behauptet, dass es schwierig sein könnte, den Unterschied zwischen GPT-4 und GPT-3.5 auf den ersten Blick zu erkennen. Die Fähigkeiten des ersteren kommen jedoch zum Vorschein, wenn Sie ins Wesentliche gehen. Um den Unterschied zu demonstrieren, wurde das neue Modell in einer Vielzahl von Prüfungen auf menschlicher Ebene mit GPT-3.5 verglichen. OpenAI verwendete die neuesten öffentlich verfügbaren Tests und gab den Modellen kein spezifisches Training dafür.

GPT-4 vs. 3,5

Die Daten selbst zeichnen ein besseres Bild, als wir Ihnen sagen könnten. In allen Ergebnissen kam GPT-4 an die Spitze und schnitt besser ab als seine vorherige Version. Während bei einigen Prüfungen (z. B. SAT EBRW) die Schwelle kaum überschritten wurde, gab es bei anderen Prüfungen (Uniform Bar Exam, AP Chemistry und mehr) einen enormen Leistungssprung. OpenAI erklärte: „GPT-4 ist im Vergleich zu GPT-3.5 auch zuverlässiger, kreativer und im Allgemeinen in der Lage, differenziertere Anweisungen zu verarbeiten.“ Dies führt dazu, dass der Bot komplexere Eingabeaufforderungen problemlos versteht.

2. Exponentiell größere Wortgrenze

Während jeder GPT 3 und GPT 3.5 liebte, wünschten sich die Leute, dass es noch längere Eingaben erkennen könnte. Die Einführung von GPT-4 hat dieses Problem gelöst. Das neue GPT-4-KI-Sprachmodell verfügt über eine erstaunliche Eingabegrenze von 25.000 Wörtern, was sehr viel ist. Für den Kontext war GPT 3.5 auf 8.000 Wörter beschränkt.

Das bedeutet, dass Benutzer den Bot mit viel längeren Eingabeaufforderungen füttern können, die er lesen und dann Ausgaben rendern kann. Wenn GPT-4 endlich startet, können Sie also damit rechnen, eine viel detailliertere Antwort zu geben und längere Eingaben ohne Probleme zu nehmen. Für die Entwickler da draußen bedeutet dies, dass Sie neue APIs und Dokumentationen für den Chatbot fühlen und leichter Hilfe beim Schreiben von Code oder beim Beheben von Fehlern in vorhandenem Code erhalten können.

3. Unterstützt mehr Sprachen

ChatGPT wurde hauptsächlich von englischsprachigen Personen auf der ganzen Welt verwendet. GPT-4 berücksichtigt jedoch andere Sprachen. Das neueste Modell hat die Unterstützung von über 26 verschiedenen Sprachen demonstriert. Dazu gehören Ukrainisch, Koreanisch, germanische Sprachen und viele mehr.

OpenAI testete dasselbe, indem es die MMLU-Benchmarks in eine Vielzahl von Sprachen übersetzte. Von 26 Sprachen übertrifft GPT-4 die englischsprachige Leistung von GPT-3.5 in 24 von ihnen. Es muss jedoch noch mehr Datentraining durchgeführt werden, bevor GPT-4 alle Sprachen vollständig unterstützt.

4. Unterschiedliche Persönlichkeiten

Steuerbarkeit ist ein Konzept, bei dem Sie der KI mit einem festen Tonfall befehlen können, sich auf eine bestimmte Weise zu verhalten. Ein gutes Beispiel dafür ist, ChatGPT zu bitten, sich wie ein Cowboy oder ein Polizist zu verhalten (indem wir ihm eine Rolle zuweisen, wie wir es getan haben, als wir unseren Chatbot mit der ChatGPT-API erstellt haben). GPT-4 erhält diese Steuerbarkeit, aber OpenAI macht es jetzt schwieriger für die KI, den Charakter zu brechen. Entwickler können jetzt den Stil ihrer KI von Anfang an korrigieren, indem sie diese Anweisungen in der „System“-Nachricht beschreiben. Da diese Nachrichten leicht zu jailbreaken sind, arbeitet OpenAI auch daran, sie sicherer zu machen.

Von den Demos, die OpenAI in seinem Blog-Beitrag präsentierte, war es ziemlich lustig zu sehen, wie der Benutzer versuchte, GPT-4 dazu zu bringen, kein sokratischer Tutor zu sein und ihnen einfach die Antwort auf ihre Frage zu sagen. Da es jedoch als Tutor programmiert war, weigerte sich GPT-4, den Charakter zu brechen, was viele Entwickler erwarten können, wenn sie ihre Bots in Zukunft trainieren.

Mögliche Anwendungen von GPT-4?

Während die multimodale Anwendung von GPT-4 von Benutzern noch nicht möglich ist, hat sich OpenAI bereits mit Be My Eyes zusammengetan, eine App für Sehbehinderte. Die Integration von GPT-4 in die App ermöglicht es Ihnen, ein Bild von dem zu machen, was Sie gerade sehen, und die KI beschreibt genau, was auf dem Bildschirm angezeigt wird, einschließlich Kleider, Pflanzen, Geräte in einem Fitnessstudio, Lesen von Karten und vieles mehr.

GPT-4 hat sich auch mit anderen Apps wie Duolingo, Khan Academy für intelligentes Lernen und sogar mit der isländischen Regierung für die Spracherhaltung zusammengeschlossen. Während die API von GPT-4 derzeit auf Wartelistenbasis verfügbar ist, können wir davon ausgehen, dass Entwickler mit erstaunlichen Erfahrungen aufwarten werden, sobald sie endlich veröffentlicht wird. Noch bevor dies geschieht, sind die oben genannten Anwendungen bereits für Benutzer verfügbar.

Hat GPT-4 irgendwelche Einschränkungen?

Obwohl GPT-4 als nächster Schritt in der künstlichen Intelligenz angekündigt wird, hat es immer noch seine Bremsschwellen.

Für den Anfang fehlt GPT-4 das Wissen über jegliches Weltwissen über Ereignisse, die nach September 2021 stattgefunden haben. Das Modell lernt auch nicht aus seinen Erfahrungen. Dies kann dazu führen, dass das GPT-4-Modell logische Fehler macht und sogar dazu neigt, offensichtliche falsche Aussagen von einem Benutzer zu akzeptieren.

GPT-4 kann ebenso wie Menschen an Problemen scheitern würde. Wie GPT 3.5 kann auch das neue Modell halluzinieren und in seinen Vorhersagen sicher falsch liegen. Dies kann dazu führen, dass GPT-4 seine Arbeit nicht doppelt überprüft, wenn es manchmal einen Fehler macht.

Trotzdem verspricht OpenAI, dass GPT-4 besser trainiert wurde als die Vorgängermodelle, um dies zu vermeiden. In den unternehmensinternen Bewertungen der kontroversen Sachlichkeit erzielte das Modell im Vergleich zu GPT 3.5 eine um 35 % höhere Punktzahl bei der Reduzierung von Halluzinationen. Obwohl sich die Wahrnehmungen und Vorhersagen des Modells verbessert haben, sollten seine Ergebnisse immer noch in Verbindung mit menschlichem Rat betrachtet werden.

OpenAI Evals – Machen Sie GPT-4 gemeinsam besser

OpenAI verwendet sein eigenes Software-Framework, um Benchmarks für Modelle wie GPT-4 zu erstellen und auszuführen. Da es sich jedoch um Open Source handelt, hat das Unternehmen einige Vorlagen freigegeben, die am häufigsten verwendet wurden. OpenAI hat damit begonnen, dass Evaluierungen ein integraler Bestandteil von Crowdsourcing-Benchmarks sein werden, die verwendet werden können, um sicherzustellen, dass GPT-4 besser trainiert ist und noch bessere Leistungen erbringt.

Als solches hat das Unternehmen jeden (ja, jeden GPT-4-Benutzer) eingeladen, seine Modelle mit Benchmarks zu testen und ihre Beispiele einzureichen. Weitere Informationen dazu finden Sie auf der GPT-4-Forschungsseite von OpenAI.

So erhalten Sie jetzt Zugriff auf GPT-4

Leider ist GPT-4 noch nicht für alle verfügbar. OpenAI hat das neue Modell derzeit nur für ChatGPT Plus-Abonnenten mit einer Nutzungsobergrenze veröffentlicht. Die Plus-Abonnenten erhalten außerdem eingeschränkten Token-Zugriff auf zwei verschiedene Versionen von GPT-4. Während einige Benutzer die 32K-Engine von GPT-4 verwenden können, was ihnen ein längeres Wortlimit gibt, sind andere auf GPT-4 8K mit einer begrenzten Kapazität beschränkt. OpenAI hat erklärt, dass dies je nach Bedarf dynamisch angepasst wird. ChatGPT Plus-Abonnenten, die sofort Zugriff wünschen, sollten sich hier unsere Anleitung zum Zugriff auf GPT-4 ansehen.

Wenn Sie keine Lust haben, ChatGPT Plus zu bekommen, dann wird es Sie freuen zu hören, dass Microsoft Bing bereits GPT-4 verwendet. Während Sie nicht wie bei OpenAI mit dem Sprachmodell herumspielen können, ist es dennoch ziemlich gut, zu experimentieren und verschiedene Arten von Dingen auszuprobieren. Sehen Sie sich an, wie Sie MS Bing in einem beliebigen Webbrowser verwenden können, um loszulegen.

Häufig gestellte Fragen (FAQs)

1. Kommt GPT-4 zu ChatGPT?

GPT-4 kommt tatsächlich bereits zu ChatGPT. Wie oben erwähnt, ist das neue Modell für ChatGPT Plus-Abonnenten bereits live. Wenn Sie angemeldet sind, müssen Sie nur das richtige Modell auswählen und mit dem Chat beginnen. Sie können auch unserem obigen Link folgen, um zu erfahren, wie Sie ChatGPT Plus erhalten, falls Sie dies noch nicht getan haben.

2. Wird GPT-4 kostenlos sein?

GPT-4 ist derzeit leider nicht kostenlos. Es erfordert ein ChatGPT Plus-Abonnement, das 20 $ pro Monat kostet. OpenAI hat jedoch erklärt, dass es hofft, allen irgendwann kostenlose GPT-4-Abfragen anbieten zu können. Das Unternehmen könnte auch eine neue Abonnementstufe einführen, um einen verbesserten Zugriff auf neue KI-Sprachmodelle wie GPT-4 zu ermöglichen.

3. Kann ich mich vollständig auf GPT-4 verlassen?

Nein, Sie können sich nicht vollständig auf GPT-4 verlassen. Das neue Modell leidet immer noch unter einigen Einschränkungen, darunter ein alter Datensatz und gelegentliche Halluzinationen. Das Modell kann auch souverän falsche Antworten geben, die zwar nicht böse gemeint sind, aber dennoch böswillig sein können. Obwohl sich GPT-4 im Vergleich zu GPT 3.5 tatsächlich verbessert hat, hat es immer noch einige Probleme. Wenn Sie also das neueste Modell verwenden, verwenden Sie daneben das richtige menschliche Urteilsvermögen.

4. Was ist die Datensatzgröße von GPT-4?

Während viele Gerüchte umgingen, GPT-4 habe 100 Billionen Parameter im Gegensatz zu den 175 Milliarden von GPT-3, ist das höchstwahrscheinlich falsch. In einem Interview mit StriclyVC erklärte OpenAI-CEO Sam Altman indirekt, dass dies nicht der Fall sein wird und dass die „GPT-4-Gerüchteküche eine lächerliche Sache ist.“

Vielleicht für Aus diesem Grund hat OpenAI die Erwartungen gedämpft, wenn es um die Größe des Datensatzes von GPT-4 geht, und keine genaue Zahl angegeben. Die Zeit wird zeigen, ob es tatsächlich enthüllt wird. Nichtsdestotrotz glauben wir, dass es bei seiner ersten Demonstration recht gut abschneiden sollte.

5. Wie wurde GPT-4 trainiert?

Wie die vorherigen Sprachmodelle wurde auch das Basismodell von GPT-4 darauf trainiert, das nächste Wort in einem Dokument vorherzusagen. Daher sind die verwendeten Daten eine Kombination aus öffentlich zugänglichen Daten und OpenAIs eigenen lizenzierten Daten.

Diese Daten enthalten eine Mischung aus richtigen und falschen Informationen, schwachen und starken Argumenten, widersprüchlichen Aussagen und verschiedenen anderen Ideen. Dies gibt GPT-4 eine große Menge an Daten, aus denen es analysieren und erkennen kann, was von ihm verlangt wird.

Machen Sie sich bereit für das neue multimodale GPT-4-KI-Modell von OpenAI

Wir hoffen, dass Sie diese Erklärung mit mehr Informationen über GPT-4 verlassen als zuvor. GPT-4 ist ein Modell, das voller Möglichkeiten steckt und viel Aufregung für alle bedeutet. Sobald ChatGPT für alle vollständig implementiert ist, wird es interessant sein zu sehen, wie jeder das neue Modell voll ausnutzt, um Erfahrungen zu schaffen. Sie müssen jedoch nicht darauf warten, dass es ChatGPT erlebt. Sehen Sie sich all die coolen Dinge an, die Sie in ChatGPT tun können, und integrieren Sie dann ChatGPT mit Siri und holen Sie sich ChatGPT sogar auf Ihre Apple Watch! Was halten Sie von diesem aufregenden neuen Modell? Schreiben Sie Ihre Gedanken in die Kommentare unten!

Hinterlasse einen Kommentar

Letztes Jahr brachte MSI den Titan GT77 mit dem Intel Core i9-12900HX und der RTX 3080 Ti Laptop-GPU auf den Markt, und es war der leistungsstärkste Gaming-Laptop der Welt. Es war der schwerste Schlagmann […]

Es ist ein paar Monate her, seit die iPhone 14-Serie auf den Markt kam, und es ist allgemein bekannt, dass es das Jahr der Pro-Modelle ist. Aber wenn Sie beabsichtigen, sich für die ausgefallenen Profis zu entscheiden, ist die Menge zu schälen […]

Wondershare hat in den letzten Jahren einige der besten Software und Tools entwickelt, um unser Leben und unsere kreativen Bemühungen zu vereinfachen. Insbesondere Wondershare Filmora hat zahlreiche Auszeichnungen erhalten. Es wurde mit dem Video Editing Leader Award ausgezeichnet […]

OpenAI GPT-4: Multimodal, neue Funktionen, Bildeingabe, Verwendung und mehr

Published by IT Info on March 16, 2023

GPT-4: Alles, was Sie wissen müssen (2023)

Was ist GPT-4?

GPT-4 ist multimodal

Inwiefern ist GPT-4 besser als GPT 3.5/GPT-3?

1. Besseres Verständnis nuancierter Eingabeaufforderungen

2. Exponentiell größere Wortgrenze

3. Unterstützt mehr Sprachen

4. Unterschiedliche Persönlichkeiten

Mögliche Anwendungen von GPT-4?

Hat GPT-4 irgendwelche Einschränkungen?

OpenAI Evals – Machen Sie GPT-4 gemeinsam besser

So erhalten Sie jetzt Zugriff auf GPT-4

Häufig gestellte Fragen (FAQs)

1. Kommt GPT-4 zu ChatGPT?

2. Wird GPT-4 kostenlos sein?

3. Kann ich mich vollständig auf GPT-4 verlassen?

4. Was ist die Datensatzgröße von GPT-4?

5. Wie wurde GPT-4 trainiert?

Machen Sie sich bereit für das neue multimodale GPT-4-KI-Modell von OpenAI

IT Info

Boult Audio stellt die neue Drift plus Smartwatch in Indien vor

IT Info

Gurman: AirPods könnten Ihr nächstes Gesundheitstool sein

IT Info

Neues Pixelmator Pro Update fügt neue „Premium Device Mockups“ hinzu

OpenAI GPT-4: Multimodal, neue Funktionen, Bildeingabe, Verwendung und mehr

Published by IT Info on March 16, 2023

GPT-4: Alles, was Sie wissen müssen (2023)

Was ist GPT-4?

GPT-4 ist multimodal

Inwiefern ist GPT-4 besser als GPT 3.5/GPT-3?

1. Besseres Verständnis nuancierter Eingabeaufforderungen

2. Exponentiell größere Wortgrenze

3. Unterstützt mehr Sprachen

4. Unterschiedliche Persönlichkeiten

Mögliche Anwendungen von GPT-4?

Hat GPT-4 irgendwelche Einschränkungen?

OpenAI Evals – Machen Sie GPT-4 gemeinsam besser

So erhalten Sie jetzt Zugriff auf GPT-4

Häufig gestellte Fragen (FAQs)

1. Kommt GPT-4 zu ChatGPT?

2. Wird GPT-4 kostenlos sein?

3. Kann ich mich vollständig auf GPT-4 verlassen?

4. Was ist die Datensatzgröße von GPT-4?

5. Wie wurde GPT-4 trainiert?

Machen Sie sich bereit für das neue multimodale GPT-4-KI-Modell von OpenAI

Related Posts

IT Info

Boult Audio stellt die neue Drift plus Smartwatch in Indien vor

IT Info

Gurman: AirPods könnten Ihr nächstes Gesundheitstool sein

IT Info

Neues Pixelmator Pro Update fügt neue „Premium Device Mockups“ hinzu