Il y a peu de temps, je vous ai proposé un nouvel article sur le développement de l’IA dans notre quotidien, mettant en avant de nombreux acteurs connus tels que Bard de Google, ChatGPT, Midjourney, mais aussi des outils utilisés dans Canva qui requièrent l’IA.
Mais ce 6 décembre 2023, en plus d’être la Saint-Nicolas, a également été marqué par une grande annonce de la part de la firme de Mountain View : le lancement d’une nouvelle Intelligence Artificielle menée à bien pour concurrencer de près ChatGPT : Gemini.
Sundar Pichai, le grand patron de Google et d’Alphabet, n’a pas fini d’étonner la sphère Tech en proposant une IA maintenant fonctionnelle, qui sera pleinement opérationnelle dès 2024, comme un cadeau auquel personne ne s’attendait. Faisons le point avec vous sur cette annonce d’IA qui n’a pas fini de faire parler d’elle dans les prochaines semaines.
Gemini, la nouvelle IA de Google prévue pour surpasser le travail titanesque d’Open AI avec Chat GPT
Cet après-midi du 6 décembre, Google a posté sur Twitter, ou plutôt sur X, l’annonce qui a fait l’effet d’une bombe : le développement d’une nouvelle intelligence artificielle, baptisée Gemini, révolutionnaire. Là où Google aime mettre le paquet, c’est que cette annonce s’est faite en grande pompe.
L’annonce de la firme de Mountain View a été diffusée sur les plus grands réseaux sociaux du monde
C’est le patron de la firme lui-même qui a annoncé cette nouvelle sur son compte Twitter, où l’information a également été relayée sur Google et le blog officiel, avec une note spéciale du PDG :
“Chaque évolution technologique est une opportunité de faire progresser la découverte scientifique, d’accélérer le progrès humain et d’améliorer nos vies. Je crois que la transition que nous vivons actuellement avec l’intelligence artificielle sera la plus profonde de notre existence, bien plus importante que le passage au mobile ou au web qui l’a précédée.
L’intelligence artificielle a le potentiel de créer des opportunités, du quotidien à l’extraordinaire, pour les gens du monde entier. Elle apportera de nouvelles vagues d’innovation et de progrès économique, et stimulera la connaissance, l’apprentissage, la créativité et la productivité à une échelle jamais vue auparavant. (…)
Maintenant, nous franchissons une nouvelle étape dans notre parcours avec Gemini, notre modèle le plus performant et le plus général à ce jour, avec des performances de pointe sur de nombreux benchmarks leaders. Notre première version, Gemini 1.0, est optimisée pour différentes tailles : Ultra, Pro et Nano. Ce sont les premiers modèles de l’ère Gemini et la première concrétisation de la vision que nous avions lorsque nous avons créé Google DeepMind plus tôt cette année.
Cette nouvelle ère de modèles représente l’un des plus grands efforts scientifiques et d’ingénierie que nous ayons entrepris en tant qu’entreprise. Je suis vraiment enthousiaste pour ce qui nous attend et pour les opportunités que Gemini débloquera pour les personnes du monde entier.” Sundar Pichai, patron de Google et sa maison mère.
Une course à l’IA qui devient une véritable compétition : Google veut détrôner OpenAI
La course à l’intelligence artificielle s’accélère, avec Google dévoilant son tout nouveau modèle IA puissant, Gemini. Selon la société basée en Californie, cette intelligence artificielle surpasse la référence GPT-4 dans de nombreux tests. Une version plus légère a déjà été intégrée à l’assistant intelligent Bard et au smartphone Pixel 8 Pro de Google.
Attention, il faudra être un peu patient en Europe, ces nouvelles technologies ne sont pas encore disponibles (RGPD quand tu nous tiens !). Il faudra attendre début 2024 pour voir si Gemini Ultra, la version la plus puissante, peut vraiment rivaliser avec OpenAI. En se basant sur les capacités présentées dans une vidéo, si Google n’a pas triché dans la réalisation, il semble que les promesses pourraient être bien fondées.
Une vidéo de présentation pour mettre en avant la performance de l’IA Gemini
Pendant une vidéo d’environ 6 minutes, on met en démonstration les capacités de l’IA. Un utilisateur montre des objets, des dessins et des vidéos. Le système d’IA explique à voix haute ce qu’il “voit”, reconnaît les objets, joue de la musique et répond à des questions qui nécessitent un peu de réflexion, en expliquant comment il a pris sa décision.
Ainsi, dans une présentation à la presse, Gemini a fait la démonstration de ses capacités de raisonnement sophistiquées. Dans une vidéo, on voit un utilisateur lui montrer des objets, des dessins et des vidéos. Le système d’IA commente à l’oral ce qu’il « voit », identifie les objets, joue de la musique et répond à des questions requérant un certain degré d’analyse, en se justifiant.
Dans la vidéo, on voit en action tout ce dont l’IA est disposée à faire avec très peu de contexte.
- L’IA révolutionne le temps de réponse : il peut donner des informations quasiment en temps reél avec sa reconnaissance parfaite des objets. Par exemple, face à l’image d’un canard en plastique, Gemini est capable d’en déduire la matière et donc qu’il flotterait si on le mettait dans l’eau
- Google brise les barrières linguistiques avec un enseignement des langues et une traduction irréprochable
- La reconnaissance audiovisuelle : il reconnait la référence à Matrix simplement en voyant une personne évitant des balles au ralenti.
- Reconnaissance musicale : en voyant visuellement une batterie, il sait assimiler un type de musique bien spécifique à proposer à son utilisateur
- Créativité : la personne peut se permettre de jouer avec l’IA, une progression impensable auparavant. On est loin du jeu Solitaire sous Microsoft !
Le lancement de l’IA nouvelle génération de Google, un timing adéquat pour contrer ChatGPT ou simplement pour expliquer son retard ?
Google, pressé par le temps accumule du retard et piétine avec Bard
C’est incontestable, la bataille OpenAI/Google est un peu comme parler de la concurrence entre Elon Musk et Mark Zuckerberg, sur un autre terrain quoique, les réseaux sociaux nous prouvent maintes fois que l’IA est bien leur sujet de prédilection.
D’ailleurs, en termes d’IA, Musk nous a annoncé fièrement il y a peu de temps travailler sur une IA surpuissante qu’il aurait appelée Grok, un nom toujours étrange, ce qui ne nous surprend plus de sa part quand on pense aux noms donnés à ses enfants…
En cette fin d’année 2023, on peut faire un constat assez simple sur le positionnement de Google. Il est encore assez compliqué pour Mountain View de rivaliser avec OpenAI et ChatGPT dans le monde de l’intelligence artificielle. Son IA Bard, développée avec beaucoup de retard, a pointé le bout du nez en mai et surtout a prouvé en pleine présentation qu’elle fournissait des erreurs, affaiblissant ainsi sa promotion.
Le nouvel assistant de Google fait “à peu près la même chose” que ChatGPT, mais il manque quelque chose… Cela ne satisfait pas Google, qui veut retrouver sa position de leader. Peut-être que le projet de Google DeepMind (Google DeepMind est une entreprise spécialisée dans l’intelligence artificielle appartenant à Google) sera l’IA qui leur permettra de reprendre le devant de la scène.
Un modèle multimodal doté de trois tailles d’IA, qui le rend plus performant
D’après le moteur de recherche, cette IA est le résultat d’un énorme effort scientifique et technique, l’un des plus grands depuis sa création. Il a été créé par une nouvelle équipe spéciale dédiée à l’intelligence artificielle, qui réunit les équipes de DeepMind et américain Google Brain.
Le tout nouveau modèle de Google est disponible en trois tailles différentes : Ultra, pour les tâches les plus compliquées, Pro, pour la plupart des demandes, et Nano, pour les tâches “embarquées”, c’est-à-dire celles réalisées directement sur un appareil, sans avoir besoin du cloud.
En détail, Gemini Pro est maintenant disponible dans Bard, le chatbot de Google lancé en juillet en France. La version Nano de Gemini, elle, sera utilisée dans le smartphone Pixel 8 avec Android 14. Il apportera des fonctionnalités comme le résumé d’enregistrement par exemple.
Enfin, Google prévoit d’intégrer Gemini dans d’autres services comme Search, Ads et Chrome dans les mois à venir.
Pour le moment, gardons en tête que cette annonce vient de voir le jour, nous n’avons à présent qu’une vidéo de présentation à l’actif de Google. Mais pour le coup, cette fois Google frappe fort et prévoit une sacrée avancée en termes d’IA. À ce sujet en avance, je suis toujours à l’affût des dernières tendances, et davantage tenue sur l’intelligence artificielle.
Je suis assez impatiente de découvrir prochainement Threads, le réseau social de Méta, pas encore disponible en France et encore plus de nouvelles de Grok avec Elon Musk. D’ici là, restez connecté et suivez mes actualités sur le blog et sur les réseaux sociaux comme LinkedIn. 🙂