Un peu plus de deux mois se sont écoulés depuis le lancement de GPT-4, mais les utilisateurs ont commencé à anticiper la sortie de GPT-5. Nous avons déjà vu à quel point le GPT-4 est capable et puissant dans divers types de tests et d’évaluations qualitatives. Avec de nombreuses nouvelles fonctionnalités telles que les plug-ins ChatGPT et la capacité de navigation sur Internet, il s’est encore amélioré. Maintenant, les utilisateurs attendent d’en savoir plus sur le prochain modèle OpenAI, GPT-5, la possibilité d’AGI, et plus encore. Donc, pour trouver des informations détaillées sur la date de sortie de GPT-5 et d’autres fonctionnalités attendues, suivez notre explication ci-dessous.
Table des matières
Date de sortie du GPT-5
Lorsque le GPT-4 est sorti en mars 2023, il était prévu qu’OpenAI publierait son modèle de nouvelle génération d’ici décembre 2023. Siqi Chen , le PDG de Runway a également tweeté disant que”gpt5 doit terminer sa formation en décembre”. Cependant, lors d’un événement du MIT en avril, le PDG d’OpenAI, Sam Altman, a déclaré”Nous ne le sommes pas et ne le ferons pas avant un certain temps“lorsqu’on lui a demandé si OpenAI entraînait GPT-5. Ainsi, la rumeur de la sortie du GPT-5 d’ici la fin de 2023 est déjà annulée.
Cela dit, les experts suggèrent qu’OpenAI pourrait sortir avec GPT-4.5, une version intermédiaire entre GPT-4 et GPT-5 d’ici octobre 2023, tout comme GPT-3.5. On dit que GPT-4.5 apportera enfin la capacité multimodale, c’est-à-dire la capacité d’analyser à la fois les images et les textes. OpenAI a déjà annoncé et démontré le multimodal de GPT-4 capacités lors de la diffusion en direct des développeurs GPT-4 en mars 2023.
Capacité multimodale GPT-4
En dehors de cela, OpenAI a actuellement beaucoup à faire sur le GPT-4 modèle avant qu’il ne commence à fonctionner sur GPT-5. Actuellement, le temps d’inférence de GPT-4 est très élevé et son fonctionnement est assez coûteux. L’accès à l’API GPT-4 est toujours difficile à obtenir. De plus, OpenAI vient tout juste d’ouvrir l’accès aux plugins ChatGPT et à la capacité de navigation sur Internet, qui sont encore en version bêta. Il n’a pas encore apporté Code Interpreter pour tous les utilisateurs payants, qui est à nouveau dans la phase Alpha.
Bien que GPT-4 soit très puissant, je suppose qu’OpenAI se rend compte que l’efficacité du calcul est l’un des éléments clés pour exécuter un modèle de manière durable. Et bien, ajoutez de nouvelles fonctionnalités et capacités au mélange, et vous avez une plus grande infrastructure à gérer tout en vous assurant que tous les points de contrôle sont opérationnels de manière fiable. Donc, pour tenter de deviner, le GPT-5 devrait sortir en 2024, juste au moment de la sortie de Google Gemini, si nous supposons que les agences gouvernementales ne mettent pas de barrage réglementaire.
Fonctionnalités et capacités du GPT-5 ( Attendu)
Réduction des hallucinations
Le discours brûlant dans l’industrie est que GPT-5 atteindra l’AGI (Intelligence générale artificielle), mais nous en viendrons à que plus tard en détail. En plus de cela, GPT-5 est censé réduire le temps d’inférence, améliorer l’efficacité, réduire les hallucinations supplémentaires et bien plus encore. Commençons par l’hallucination, qui est l’une des principales raisons pour lesquelles la plupart des utilisateurs ne croient pas facilement aux modèles d’IA.
Test de précision GPT-4
Selon OpenAI, GPT-4 a obtenu un score 40 % supérieur à GPT-3.5 dans les évaluations factuelles internes conçues de manière contradictoire dans les neuf catégories. Désormais, GPT-4 est 82 % moins susceptible de répondre à un contenu inexact et non autorisé. Il est très proche de toucher la barre des 80% dans les tests de précision dans toutes les catégories. C’est un énorme pas en avant dans la lutte contre les hallucinations.
Maintenant, on s’attend à ce qu’OpenAI réduise les hallucinations à moins de 10 % dans GPT-5, ce qui serait énorme pour rendre les modèles LLM dignes de confiance. J’ai utilisé le modèle GPT-4 pour de nombreuses tâches ces derniers temps, et jusqu’à présent, il n’a donné que des réponses factuelles. Il est donc fort probable que le GPT-5 hallucinera encore moins que le GPT-4.
Modèle efficace en termes de calcul
Ensuite, nous savons déjà que GPT-4 est coûteux à exécuter (0,03 USD par jeton de 1 000 USD) et que le temps d’inférence est également plus élevé. Alors que l’ancien modèle GPT-3.5-turbo est 15 fois moins cher (0,002 $ par jeton 1K) que le GPT-4. En effet, GPT-4 est formé sur un énorme mille milliards de paramètres, ce qui nécessite une infrastructure de calcul coûteuse. Dans notre récent explicateur sur le modèle PaLM 2 de Google, nous avons constaté que PaLM 2 est de taille assez petite et que cela se traduit par des performances rapides.
Un récent rapport de CNBC a confirmé que PaLM 2 est formé sur 340 milliards de paramètres, ce qui est bien inférieur à la grande taille de paramètre de GPT-4. Google a même poursuivi en disant que plus gros n’est pas toujours meilleur et que la créativité de la recherche est la clé pour créer de bons modèles. Donc, si OpenAI veut rendre ses modèles à venir optimaux pour le calcul, il doit trouver de nouvelles façons créatives de réduire la taille du modèle tout en maintenant la qualité de sortie.
Je suis revenu sur un projet sur lequel je travaillais avec l’API OpenAI GPT-4, j’ai remarqué que les temps de réponse de l’API étaient assez lents.
Réponse moyenne testée sur un nouveau contexte pour”Pouvez-vous me montrer un exemple matplotlib de dispersion de base ?”
GPT-3.5 : 13,4 secondes
GPT-4 : 44,7 secondes.
⏱️🦥🐢— Harrison Kinsley (@Sentdex) 10 mai , 2023
Une grande partie des revenus d’OpenAI provient des entreprises et des entreprises, donc oui, GPT-5 doit non seulement être moins cher, mais aussi plus rapide pour retourner la sortie. Les développeurs dénoncent déjà le fait que les appels de l’API GPT-4 cessent fréquemment de répondre et qu’ils sont obligés d’utiliser le modèle GPT-3.5 en production. Il doit figurer sur la liste de souhaits d’OpenAI pour améliorer les performances du prochain modèle GPT-5, en particulier après le lancement du modèle PaLM 2 beaucoup plus rapide de Google, que vous pouvez essayer dès maintenant.
Modèle d’IA multisensoriel
Alors que le GPT-4 a été annoncé comme un modèle d’IA multimodal, il ne traite que deux types de données, à savoir les images et les textes. Bien sûr, la fonctionnalité n’a pas encore été ajoutée à GPT-4, mais OpenAI pourrait éventuellement publier la fonctionnalité dans quelques mois. Cependant, avec GPT-5, OpenAI peut faire un grand pas en en le rendant véritablement multimodal. Il peut également traiter du texte, de l’audio, des images, des vidéos, des données de profondeur et de la température. Il serait capable d’interconnecter des flux de données de différentes modalités pour créer un espace d’intégration.
Source : Meta
Récemment, Meta a publié ImageBind, un modèle d’IA qui combine les données de six modalités différentes et les a mises en open source à des fins de recherche. Dans cet espace, OpenAI n’a pas révélé grand-chose, mais la société dispose de solides modèles de base pour l’analyse de la vision et la génération d’images. OpenAI a également développé CLIP (Contrastive Language–Image Pretraining) pour l’analyse d’images et DALL-E, une alternative Midjourney populaire qui peut générer des images à partir de descriptions textuelles.
C’est un domaine de recherche en cours et ses applications ne sont toujours pas claires. Selon Meta, il peut être utilisé pour concevoir et créer du contenu immersif pour la réalité virtuelle. Nous devons attendre et voir ce que fait OpenAI dans cet espace et si nous verrons plus d’applications d’IA dans diverses multimodalités avec la sortie de GPT-5.
Mémoire à long terme
Avec la de GPT-4, OpenAI a apporté une longueur de contexte maximale de 32 000 jetons, qui coûtait 0,06 $ par jeton de 1 000. Nous avons rapidement vu la transformation des jetons 4K standard en 32K en quelques mois. Récemment, Anthropic a augmenté la fenêtre de contexte de 9K à 100K jetons dans son chatbot Claude AI. On s’attend à ce que GPT-5 apporte une prise en charge de la mémoire à long terme via une longueur de contexte beaucoup plus grande.
Cela peut aider à créer des personnages IA et des amis qui se souviennent de votre personnalité et de vos souvenirs qui peuvent durer des années. En dehors de cela, vous pouvez charger des bibliothèques de livres et de documents texte dans une seule fenêtre contextuelle. Il peut y avoir diverses nouvelles applications d’IA en raison de la prise en charge de la mémoire à long terme et GPT-5 peut rendre cela possible.
Version GPT-5 : Peur d’AGI ?
En février 2023, Sam Altman a écrit un blog sur AGI et comment il peut bénéficier à toute l’humanité. AGI (Artificial General Intelligence), comme son nom l’indique, est la prochaine génération de systèmes d’IA qui sont généralement plus intelligents que les humains. On dit que le prochain modèle GPT-5 d’OpenAI atteindra l’AGI, et il semble qu’il y ait une part de vérité là-dedans.
Nous avons déjà plusieurs agents d’IA autonomes comme Auto-GPT et BabyAGI, qui sont basé sur GPT-4 et peut prendre des décisions par lui-même et arriver à des conclusions raisonnables. Il est tout à fait possible qu’une version d’AGI soit déployée avec GPT-5.
Dans le blog, Altman déclare que”Nous pensons que nous devons apprendre et nous adapter en permanence en déployant des versions moins puissantes de la technologie afin de minimiser les scénarios’un seul coup pour bien faire les choses'”tout en reconnaître les”risques massifs”dans la navigation dans des systèmes extrêmement puissants comme AGI. Avant la récente audience au Sénat , Sam Altman a également exhorté les législateurs américains à réglementer les nouveaux systèmes d’IA.
Lors de l’audience, Altman a déclaré :”Je pense que si cette technologie tourne mal, elle peut mal tourner. Et nous voulons nous exprimer à ce sujet. De plus, a-t-il ajouté,”Nous voulons travailler avec le gouvernement pour empêcher que cela ne se produise”. Depuis un certain temps, OpenAI s’est fait entendre sur les réglementations relatives aux nouveaux systèmes d’IA qui seraient très puissants et intelligents. Notez qu’Altman recherche une réglementation de sécurité autour de systèmes d’IA incroyablement puissants et non des modèles open source ou des modèles d’IA développés par de petites startups.
la réglementation devrait prendre effet au-dessus d’un seuil de capacité.
La sécurité des AGI est vraiment importante, et les modèles frontières doivent être réglementés.
la capture réglementaire est mauvaise , et nous ne devrions pas jouer avec les modèles en dessous du seuil. les modèles open source et les petites startups sont évidemment importants. https://t.co/qdWHHFjX4s— Sam Altman (@sama) 18 mai 2023
Il convient de noter que Elon Musk et d’autres personnalités éminentes, dont Steve Wozniak, Andrew Yang et Yuval Noah Harari, et al ont appelé à une pause sur les expériences d’IA géantes, en mars 2023. Depuis lors, il y a eu un large recul contre l’AGI et les nouveaux systèmes d’IA-plus puissants que GPT-4.
Si OpenAI va effectivement apporter la capacité AGI au GPT-5, attendez-vous à plus de retard dans sa sortie publique. La réglementation entrerait certainement en vigueur et le travail autour de la sécurité et de l’alignement serait examiné de manière approfondie. La bonne chose est qu’OpenAI dispose déjà d’un puissant modèle GPT-4, et il ajoute continuellement de nouvelles fonctionnalités et capacités. Il n’y a aucun autre modèle d’IA qui s’en approche, pas même le Google Bard basé sur PaLM 2.
OpenAI GPT-5 : position future
Après la sortie de GPT-4, OpenAI est devenu de plus en plus secret sur ses opérations. Il ne partage plus la recherche sur l’ensemble de données de formation, l’architecture, le matériel, le calcul de formation et la méthode de formation avec la communauté open source. Cela a été un tournant étrange pour une entreprise qui a été fondée en tant qu’organisation à but non lucratif (maintenant c’est un profit plafonné) basée sur les principes de la collaboration libre.
En mars 2023, conversation avec The Verge, Ilya Sutskever, le scientifique en chef d’OpenAI a déclaré :”Nous nous sommes trompés. Bref, nous nous sommes trompés. Si vous pensez, comme nous, qu’à un moment donné, l’IA-AGI-va être extrêmement, incroyablement puissante, alors cela n’a tout simplement pas de sens d’ouvrir le code source. C’est une mauvaise idée… Je m’attends à ce que dans quelques années, il devienne complètement évident pour tout le monde que l’IA open source n’est tout simplement pas judicieuse.“
Maintenant, il est devenu clair que ni GPT-4 ni le prochain GPT-5 ne seraient open-source afin de rester compétitif dans la course à l’IA. Cependant, une autre société géante, Meta, a abordé le développement de l’IA différemment. Meta a publié plusieurs modèles d’IA sous la licence CC BY-NC 4.0 (recherche uniquement, non commerciale) et gagne du terrain au sein de la communauté open source.
Voyant l’énorme adoption du LLaMA de Meta et d’autres modèles d’IA, OpenAI a également changé sa position sur l’open source. Selon de récents rapports , OpenAI travaille sur un nouveau modèle d’IA open source qui sera bientôt rendu public. Il n’y a aucune information sur ses capacités et sur sa compétitivité par rapport au GPT-3.5 ou GPT-4, mais c’est en effet un changement bienvenu.
En résumé, GPT-5 va être un modèle de frontière qui repoussera les limites de ce qui est possible avec l’IA. Il semble probable qu’une certaine forme d’AGI sera lancée avec GPT-5. Et si tel est le cas, OpenAI doit se préparer à une réglementation stricte (et à d’éventuelles interdictions) dans le monde entier. Quant à la date de sortie du GPT-5, la valeur sûre serait en 2024.
Laisser un commentaire
Il y a des choix de conception discutables dans Redfall, un méli-mélo de la célèbre formule Arkane à moitié cuite. J’adore les jeux créés par Arkane Studios, Dishonored devenant un titre que je revisite de temps en temps pour son gameplay émergent unique. Et […]
Le moniteur BenQ PD2706UA est là, et il est livré avec toutes les cloches et sifflets que les utilisateurs de productivité apprécieraient. Une résolution 4K, des couleurs calibrées en usine, une dalle de 27 pouces, un support ergonomique facilement ajustable, et bien plus encore. Il a beaucoup […]
Minecraft Legends est un jeu qui a piqué mon intérêt lors de sa révélation originale l’année dernière. Mais, j’admets que je n’ai pas suivi activement le jeu jusqu’à ce que nous nous rapprochions de sa sortie officielle. Après tout, mon amour […]