Chat GPT 4 vient d’être présentée par la société OpenAI qui a détaillé les fonctionnalités de son intelligence artificielle conversationnelle, Chat-GPT4.
Devant le succès mondial de sa grande sœur, cette nouvelle version était attendue par l’ensemble de la communauté web. En effet, depuis quelques semaines et comme évoqué dans cet article, l’application d’OpenAI est au centre de toutes les attentions du monde numérique.
Présentée parfois comme le futur d’Internet, cette application questionne sérieusement les futurs usages du numérique au point de forcer d’autres géants de la tech à sortir leurs propres applications d’intelligence artificielle avec plus ou moins de succès, comme c’est le cas pour Google avec Bard. Rappelons que l’application du moteur de recherche a connu quelques déconvenues lors de sa présentation et n’est toujours pas accessible au grand public.
Alors, quelles sont les nouvelles fonctionnalités et les limites de cette nouvelle version de Chat GPT ?
Une nouvelle version qui permet d’analyser les images et d’interpréter les entrées visuelles
Derrière ce terme un peu technique, se cache peut-être l’une des mises à jour les plus importantes de Chat GPT, à savoir la prise en compte d’images, de croquis et de dessins dans l’interaction avec l’internaute.
Cette nouvelle fonctionnalité est un véritable atout dans l’utilisation quotidienne du chatbot : l’utilisateur peut envoyer l’image d’un objet afin de l’identifier, mais aussi de connaître ses usages et applications, son mode d’emploi, et de récolter une liste d’autres objets en lien avec celui-ci.
Par exemple, si vous envoyez une photo d’une râpe à légumes, il va l’identifier, vous expliquer qu’elle sert à râper des légumes, vous montrer les bons gestes à effectuer pour s’en servir correctement, et enfin ouvrir les propositions de contenus annexes sur d’autres ustensiles de cuisine.
En scannant une image ou en envoyant une photographie à l’application, celle-ci peut également vous fournir un résumé du visuel, rédiger une description précise (ce qui est un véritable atout en matière d’accessibilité de votre site internet pour des personnes déficientes visuelles, par exemple), ou encore rédiger une analyse critique d’un tableau.
Mais l’interprétation des entrées visuelles ne se limite pas à ses capacités d’identification d’un objet ou d’un dessin. En soumettant un croquis assez sommaire au logiciel, celui-ci a la capacité de le transformer en site internet prêt à l’emploi !
Comme nous pouvons le voir sur la vidéo ci-dessous, l’ingénieur dessine les fonctionnalités qu’il souhaite voir sur son site de blagues, à savoir une entête, une première devinette, un bouton pour dévoiler la réponse, une seconde devinette avec un second bouton, ainsi que les crédits du site. Un site certes sommaire est alors généré avec le code correspondant.
Bien que le résultat soit encore loin d’un site avec une expérience utilisateur optimale, on ne peut qu’imaginer les applications possibles d’un tel outil dans les années à venir : si cette IA ne peut pas remplacer un développeur (du moins pour plusieurs années), elle peut lui permettre un gain de temps plutôt conséquent sur certaines tâches plus ou moins complexes.
Chat GPT 4 est plus intelligente que la version antérieure en gardant quelques uns de ses défauts
Pour tenter de quantifier les “capacités intellectuelles” de l’application, ses fondateurs mettent en avant quelques chiffres, tels que : “GPT-4 est 82 % moins susceptible de répondre à des demandes de contenu non autorisé et 40 % plus susceptible de produire des réponses factuelles que GPT-3.5 lors de nos évaluations internes.”
Ces statistiques, fruits de six mois de travail, ne sont pas forcément compréhensibles pour le grand public dans l’utilisation quotidienne du chat. Cette mise à jour se traduit par une capacité renforcée à écrire du contenu créatif, comme des chansons, des textes à la manière de, ou encore des résumés de dessins animés où chaque phrase commence par une lettre différente de l’alphabet.
La version 4 est également une meilleure étudiante ! Les ingénieurs d’OpenAI ont fait passer l’examen du barreau à cette nouvelle version, qui a été classée dans les 10 % des meilleurs résultats. La version précédente, elle, était classée dans les 10 % des résultats les plus mauvais. D’autres examens, en biologie par exemple, ont également été passés avec succès.
Néanmoins, les mathématiques appliquées restent un domaine où les résultats sont peu concluants, avec de nombreuses erreurs dans la copie rendue par l’IA.
Chat GPT 4 a également une meilleure capacité mémorielle lors de ses échanges avec l’utilisateur, ce qui lui permet d’interagir de manière plus conséquente avec le même internaute et de générer un contenu plus long. Sa capacité passe de 3 000 mots générés en V3.5 à 25 000 mots générés dans sa nouvelle itération.
Enfin, en plus des autres fonctionnalités techniques telles que la création d’une extension sur Chrome ou la possibilité de générer un petit jeu vidéo, ses nouvelles fonctionnalités sont également déployées dans le secteur de l’apprentissage des langues avec la société Duolingo, qui propose désormais un mode “roleplay” générant des conversations du quotidien en dialoguant avec un avatar virtuel.
Payant, moins “open” que prévu, Chat GPT 4 est loin d’être révolutionnaire !
La dernière version du projet phare d’OpenAI présente des nouveautés plutôt impressionnantes pour le grand public et continue de générer de nouveaux usages.
L’avancée majeure de cette version est la prise en charge des images, qui vient concurrencer la “Lens” de Google avec ses nouvelles fonctionnalités. De plus, la capacité de traduire les images en mots, en contenu argumenté ou en code d’un site web est également une grande avancée.
Un autre aspect qui peut être source d’inquiétude est que les chercheurs n’ont pas accès à l’architecture, aux ressources ou au matériel utilisés lors de la création de cette nouvelle version, ce qui rompt avec la philosophie initiale d’OpenAI : apporter du bien commun à l’humanité. Ce changement s’explique par les coûts colossaux que demande la mise à jour de l’intelligence artificielle, la concurrence mondiale accrue avec l’annonce de Baidu de la sortie de sa propre intelligence conversationnelle et les potentielles applications dans de nombreux secteurs marchands.
Cependant, la principale limite de cette nouvelle version est que l’IA n’apprend toujours pas de ses échanges avec les internautes et son contenu s’arrête en septembre 2021. OpenAI avertit que “Malgré ses capacités, GPT-4 a des limites similaires à celles des modèles GPT précédents”. “Plus important encore, il n’est toujours pas totalement fiable – il imagine des faits et produit des erreurs de raisonnement.” De plus, “GPT-4 présente des risques similaires à ceux des modèles précédents, tels que la génération de conseils nuisibles, de code bogué ou des informations inexactes”.
L’engouement autour de cette technologie est à l’image de la communication sur Internet : une fois l’annonce et les quelques exemples présentés à la presse passés, comment traduire cela dans un usage quotidien tout en prenant en compte les coûts de développement, le coût environnemental ainsi que le respect des données personnelles ? Cela pose des questions importantes sur la manière dont nous pouvons tirer parti de l’IA de manière éthique et responsable.
Sans oublier que pour l’instant l’accès à la V4 est réservé aux membres qui payent un abonnement de 20$ par mois, un tarif certes contenu mais qui devrait refroidir les ardeurs de l’utilisateur lambda.