Skip to content
Tecnologies Homes

Tecnologies Homes

Primary Menu
  • commencer
  • Contact
  • news
  • Politique de Confidentialité
  • Home
  • news
  • Google Gemini: Découvrez tout sur les applications et les modèles de l’IA générative
  • news

Google Gemini: Découvrez tout sur les applications et les modèles de l’IA générative

Home's Editor février 27, 2025
google-bard-gemini-v2

Google cherche à faire sensation avec Gemini, son ensemble phare de modèles, applications et services d’IA générative. Mais qu’est-ce que Gemini ? Comment pouvez-vous l’utiliser ? Et comment se compare-t-il à d’autres outils d’IA générative tels que ChatGPT d’OpenAI, Llama de Meta et Copilot de Microsoft ?

Pour faciliter le suivi des derniers développements de Gemini, nous avons préparé ce guide pratique, que nous mettrons à jour à mesure que de nouveaux modèles Gemini, fonctionnalités et actualités sur les projets de Google pour Gemini seront publiés.

Qu’est-ce que Gemini ?

Gemini est la famille de modèles d’IA générative de nouvelle génération longtemps promise par Google. Développé par les laboratoires de recherche en IA de Google DeepMind et Google Research, il se décline en plusieurs versions :

– Gemini Ultra, un modèle très grand.

– Gemini Pro, un grand modèle – bien que plus petit que Ultra. La dernière version, Gemini 2.0 Pro, est le fleuron actuel de Google.

– Gemini Flash, une version plus rapide, “développée” de Pro.

– Gemini Flash-Lite, une version légèrement plus petite et plus rapide de Gemini Flash.

– Gemini Flash Thinking, un modèle avec des capacités de “raisonnement”.

– Gemini Nano, deux petits modèles : Nano-1 et le légèrement plus performant Nano-2, destiné à fonctionner hors ligne.

Tous les modèles Gemini ont été formés pour être nativement multimodaux – c’est-à-dire capables de travailler avec et d’analyser plus que du texte. Google affirme qu’ils ont été pré-entraînés et affinés sur une variété de données audio, images et vidéos publiques, propriétaires et sous licence ; un ensemble de bases de code ; et du texte dans différentes langues.

Cela distingue Gemini de modèles tels que LaMDA de Google, qui a été formé exclusivement sur des données textuelles. LaMDA ne peut pas comprendre ou générer autre chose que du texte (par exemple, des essais, des e-mails, etc.), mais ce n’est pas nécessairement le cas avec les modèles Gemini. Par exemple, les dernières versions de Gemini Flash et Gemini Pro peuvent générer nativement des images et de l’audio en plus du texte.

Nous noterons ici que l’éthique et la légalité de la formation de modèles sur des données publiques, parfois sans la connaissance ou le consentement des propriétaires des données, sont floues. Google a une politique d’indemnisation en matière d’IA pour protéger certains clients de Google Cloud contre les poursuites judiciaires s’ils y sont confrontés, mais cette politique comporte des exceptions. Procédez avec prudence – en particulier si vous avez l’intention d’utiliser Gemini à des fins commerciales.

Quelle est la différence entre les applications Gemini et les modèles Gemini ?

Gemini est distinct des applications Gemini sur le Web et mobile (anciennement Bard). Les applications Gemini sont des clients qui se connectent à divers modèles Gemini et ajoutent une interface de chatbot. Pensez à eux comme des interfaces frontales pour l’IA générative de Google, analogues à ChatGPT et à la famille d’applications Claude d’Anthropic.

Gemini sur le web se trouve ici. Sur Android, l’application Gemini remplace l’application Google Assistant existante. Et sur iOS, les applications Google et Google Search servent de clients Gemini pour cette plateforme.

Sur Android, les utilisateurs peuvent faire apparaître un superposition Gemini pour poser des questions sur ce qui s’affiche à l’écran (par exemple, une vidéo YouTube). Appuyer longuement sur le bouton d’alimentation d’un smartphone compatible ou dire “Hey Google” invoque la superposition.

Les applications Gemini peuvent accepter des images ainsi que des commandes vocales et du texte – y compris des fichiers tels que des PDF, téléchargés ou importés depuis Google Drive – et générer des images. Comme on pouvait s’y attendre, les conversations avec les applications Gemini sur mobile se poursuivent sur Gemini sur le web et vice versa si vous êtes connecté au même compte Google aux deux endroits.

Gemini Avancé

Les applications Gemini ne sont pas le seul moyen de recruter l’aide des modèles Gemini pour des tâches. Lentement mais sûrement, des fonctionnalités imprégnées de Gemini font leur chemin dans des applications et services Google de base comme Gmail et Google Docs.

Pour profiter de la plupart de ces fonctionnalités, vous aurez besoin du Plan Premium IA Google One. Techniquement une partie de Google One, le Plan Premium IA coûte 20 $ par mois et donne accès à Gemini dans les applications Google Workspace comme Docs, Maps, Slides, Sheets, Drive et Meet. Il active également ce que Google appelle Gemini Avancé, qui apporte les modèles Gemini plus sophistiqués aux applications Gemini.

Les utilisateurs de Gemini Avancé ont parfois des extras, comme un accès prioritaire aux nouvelles fonctionnalités et modèles ; la possibilité d’exécuter et de modifier du code Python directement dans Gemini ; et des limites accrues pour NotebookLM, l’outil de Google qui transforme les PDF en podcasts générés par IA. Récemment, Gemini Avancé a obtenu une fonction de mémoire qui stocke les préférences des utilisateurs et permet à Gemini de se référer à d’anciennes conversations comme contexte pour les discussions en cours.

Une des exclusivités les plus captivantes de Gemini Avancé, Deep Research, tire parti des modèles Gemini avec un “raisonnement avancé” pour créer des synthèses détaillées. En réponse à une instruction (par exemple, “Comment devrais-je redécorer ma cuisine ?”), Deep Research élabore un plan de recherche en plusieurs étapes et explore le Web pour élaborer une réponse complète.

Gemini dans Gmail, Docs, Chrome, les outils de développement, et plus

Dans Gmail, Gemini se trouve dans un volet latéral qui peut écrire des e-mails et résumer les fils de messages. Vous trouverez le même volet dans Docs, où il aide à écrire et à affiner le contenu et à imaginer de nouvelles idées. Gemini dans Slides génère des diapositives et des images personnalisées. Et Gemini dans Google Sheets suit et organise les données, créant des tableaux et des formules.

Gemini est présent dans Google Maps, où il peut agréger les avis sur les entreprises locales et offrir des recommandations sur la façon de passer une journée à visiter une ville étrangère. La portée du chatbot s’étend également à Drive, où il peut résumer les fichiers et dossiers et donner des informations rapides sur un projet.

Gemini est récemment arrivé dans le navigateur Chrome de Google sous la forme d’un outil d’écriture IA. Vous pouvez l’utiliser pour rédiger quelque chose de complètement nouveau ou réécrire du texte existant ; Google dit qu’il tiendra compte de la page web sur laquelle vous vous trouvez pour faire des recommandations.

Ailleurs, vous trouverez des indices de Gemini dans les produits de base de données de Google, les outils de sécurité cloud et les plateformes de développement d’applications (y compris Firebase et Project IDX), ainsi que dans des applications comme Google Photos (où Gemini gère les requêtes de recherche en langage naturel), YouTube (où il aide à imaginer des idées de vidéos) et Meet (où il traduit les sous-titres).

Code Assist (anciennement Duet AI for Developers), la suite d’outils d’assistance alimentée par l’IA de Google pour l’autocomplétion et la génération de code, délègue une grande partie du travail de calcul à Gemini. Les produits de sécurité de Google soutenus par Gemini, comme Gemini in Threat Intelligence, qui peut analyser de grandes parties de code potentiellement malveillant et permettre aux utilisateurs de rechercher en langage naturel des menaces en cours ou des indicateurs de compromission.

Extensions Gemini et Gems

Les utilisateurs de Gemini Avancé peuvent créer des Gems, des chatbots personnalisés sur bureau et mobile alimentés par des modèles Gemini. Les Gems peuvent être générés à partir de descriptions en langage naturel – par exemple, “Tu es mon coach de course. Donne-moi un plan de course quotidien” – et partagés avec d’autres utilisateurs ou conservés privés.

Les applications Gemini peuvent se connecter aux services Google via ce que Google appelle des “extensions Gemini”. Gemini s’intègre à Drive, Gmail, YouTube et d’autres pour répondre à des requêtes telles que “Pourrais-tu résumer mes trois derniers e-mails ?”.

Gemini Live pour des chats vocaux approfondis

Imagem destacada

Une expérience appelée Gemini Live permet aux utilisateurs d’avoir des chats vocaux “approfondis” avec Gemini. Il est disponible dans les applications Gemini sur mobile et les Pixel Buds Pro 2, où il peut être utilisé même lorsque votre téléphone est verrouillé.

Avec Gemini Live activé, vous pouvez interrompre Gemini pendant que le chatbot parle pour poser une question de clarification, et il s’adaptera à vos schémas de parole en temps réel. Live est également conçu pour servir de coach virtuel, aidant à répéter pour des événements, à imaginer des idées, etc. Par exemple, Live peut suggérer quels compétences mettre en avant lors d’un prochain entretien d’embauche et donner des conseils pour la prise de parole en public.

Gemini pour les adolescents

Google propose une expérience de Gemini axée sur les adolescents pour les étudiants.

Le Gemini axé sur les adolescents propose des “politiques et des garanties supplémentaires”, y compris un processus d’intégration sur mesure et un guide de littératie en IA. Sinon, il est presque identique à l’expérience Gemini standard, jusqu’à la fonction “double vérification” qui recherche à travers le Web pour voir si les réponses de Gemini sont correctes.

Que peuvent faire les modèles Gemini ?

Étant donné que les modèles Gemini sont multimodaux, ils peuvent effectuer une gamme de tâches multimodales, de la transcription de la parole au sous-titrage d’images et de vidéos en temps réel. Bon nombre de ces capacités ont atteint le stade du produit, et Google promet beaucoup plus dans un avenir proche.

Bien sûr, Google n’apporte aucune solution à certains des problèmes sous-jacents de la technologie d’IA générative aujourd’hui, comme ses biais encodés et sa propension à inventer des choses (c’est-à-dire halluciner). Ni ses concurrents, mais c’est quelque chose à garder à l’esprit lors de la réflexion sur l’utilisation ou le paiement de Gemini.

Capacités de Gemini Pro

Google affirme que son dernier modèle Pro, Gemini 2.0 Pro, est son meilleur modèle pour la codage et les instructions complexes. Le 2.0 Pro surpasse son prédécesseur, Gemini 1.5 Pro, dans des mesures de référence mesurant la programmation, le raisonnement, les mathématiques et la précision factuelle.

Sur la plateforme Vertex AI de Google, les développeurs peuvent personnaliser Gemini Pro pour des contextes et des cas d’utilisation spécifiques via un processus de réglage ou de “mise à la terre”. Par exemple, Pro (avec d’autres modèles Gemini) peut être instruit d’utiliser des données de fournisseurs tiers comme Moody’s, Thomson Reuters, ZoomInfo et MSCI, ou de puiser des informations dans des ensembles de données d’entreprise ou dans Google Search au lieu de sa banque de connaissances plus large. Gemini Pro peut également être connecté à des API externes tierces pour effectuer des actions particulières, comme automatiser un flux de travail en back-office.

La plateforme AI Studio de Google propose des modèles de création d’instructions structurées avec Pro. Les développeurs peuvent contrôler la plage créative du modèle et fournir des exemples pour donner des instructions de ton et de style – et ajuster également les paramètres de sécurité de Pro.

Gemini Flash est léger, tandis que Gemini Flash Thinking ajoute du raisonnement

Gemini 2.0 Flash, qui peut utiliser des outils comme Google Search et interagir avec des API externes, surpasse certains des modèles plus grands de Gemini 1.5 dans des mesures de référence mesurant la programmation et l’analyse d’images. Issue de Gemini Pro, Flash est petit et efficace – conçu pour des charges de travail génératives étroites et fréquentes.

Google affirme que Flash est particulièrement adapté aux tâches telles que la résumé et les applications de chat, ainsi que le sous-titrage d’images et de vidéos et l’extraction de données dans de longs documents et des tableaux. Pendant ce temps, Gemini 2.0 Flash-Lite, une version plus compacte de Flash, surpasse Gemini 1.5 Flash mais fonctionne au même prix et à la même vitesse, selon Google.

L’année dernière, Google a lancé une version “de réflexion” de Gemini 2.0 Flash capable de “raisonner”. Le modèle IA prend quelques secondes pour revenir en arrière à travers un problème avant de donner une réponse, ce qui peut améliorer sa fiabilité.

Gemini Nano peut fonctionner sur votre téléphone

Gemini Nano est une version miniature de Gemini suffisamment efficace pour fonctionner directement sur (certains) appareils au lieu d’envoyer la tâche quelque part sur un serveur. Jusqu’à présent, Nano alimente quelques fonctionnalités des Pixel 8 Pro, Pixel 8, Pixel 9 Pro, Pixel 9 et Samsung Galaxy S24, y compris Résumer dans Recorder et Smart Reply dans Gboard.

L’application Recorder, qui permet aux utilisateurs d’appuyer sur un bouton pour enregistrer et transcrire l’audio, inclut un résumé alimenté par Gemini des conversations enregistrées, des interviews, des présentations et d’autres extraits audio. Les utilisateurs obtiennent des résumés même s’ils n’ont pas de signal ou de connexion Wi-Fi – et en un clin d’œil sur la confidentialité, aucune donnée ne quitte leur téléphone dans le processus.

Nano est également présent dans Gboard, le clavier de remplacement de Google. Là, il alimente Smart Reply, qui aide à suggérer la prochaine chose que vous voudrez dire lors d’une conversation dans une application de messagerie comme WhatsApp.

Une future version d’Android utilisera Nano pour alerter les utilisateurs sur les tentatives d’arnaque lors d’appels. La nouvelle application météo des téléphones Pixel utilise Gemini Nano pour générer des rapports météorologiques personnalisés. Et TalkBack, le service d’accessibilité de Google, utilise Nano pour créer des descriptions auditives des objets pour les utilisateurs malvoyants et aveugles.

Gemini Ultra, MIA pour le moment

Nous n’avons pas vu grand-chose de Gemini Ultra ces derniers mois. Le modèle n’est pas disponible dans les applications Gemini, et il n’est pas répertorié sur la page de tarification de l’API Gemini de Google. Cependant, cela ne signifie pas que Google ne ramènera pas Ultra à un moment donné à l’avenir.

Combien coûtent les modèles Gemini ?

Gemini 1.5 Pro, 1.5 Flash, 2.0 Flash et 2.0 Flash-Lite sont disponibles via l’API Gemini de Google pour la création d’applications et de services. C’est à la consommation. Voici les prix de base – sans les ajouts – en février 225 :

– Gemini 1.5 Pro : 1,25 $ par 1 million de jetons d’entrée (pour des instructions jusqu’à 128K jetons) ou 2,50 $ par 1 million de jetons d’entrée (pour des instructions plus longues que 128K jetons) ; 5 $ par 1 million de jetons de sortie (pour des instructions jusqu’à 128K jetons) ou 10 $ par 1 million de jetons de sortie (pour des instructions plus longues que 128K jetons).

– Gemini 1.5 Flash : 7,5 cents par 1 million de jetons d’entrée (pour des instructions jusqu’à 128K jetons), 15 cents par 1 million de jetons d’entrée (pour des instructions plus longues que 128K jetons), 30 cents par 1 million de jetons de sortie (pour des instructions jusqu’à 128K jetons), 60 cents par 1 million de jetons de sortie (pour des instructions plus longues que 128K jetons).

– Gemini 2.0 Flash : 10 cents par 1 million de jetons d’entrée, 40 cents par 1 million de jetons de sortie. Pour l’audio, 70 cents par 1 million de jetons d’entrée.

– Gemini 2.0 Flash-Lite : 7,5 cents par 1 million de jetons d’entrée, 30 cents par 1 million de jetons de sortie.

Les jetons sont des sous-unités de données brutes, comme les syllabes “fan”, “tas” et “tic” dans le mot “fantastique” ; 1 million de jetons équivaut à environ 750 000 mots. L’entrée fait référence aux jetons alimentés dans le modèle, tandis que la sortie fait référence aux jetons générés par le modèle.

La tarification du 2.0 Pro n’a pas encore été annoncée, et Nano est encore en accès anticipé.

Gemini arrivera-t-il sur iPhone ?

C’est possible. Apple a déclaré qu’elle était en discussions pour utiliser Gemini et d’autres modèles tiers pour un certain nombre de fonctionnalités de sa suite Apple Intelligence. Après une présentation.

Continue Reading

Previous: Amazon Alexa+ : l’assistant ultime pour lire et résumer vos documents longs
Next: Étude: Les modèles d’IA formés sur du code non sécurisé deviennent toxiques

Related News

GettyImages-1247366993
  • news

Waymo lance son service de robotaxis dans toute la Silicon Valley

Home's Editor août 4, 2025
GettyImages-1227124564
  • news

Jio annonce un accord pour lancer Starlink en Inde, suivant de près un partenariat avec Airtel!

Home's Editor juillet 29, 2025
GettyImages-1292884888
  • news

Dapr prend en charge les agents d’IA : une révolution pour le runtime de microservices

Home's Editor juillet 21, 2025

Liste des publications

Waymo lance son service de robotaxis dans toute la Silicon Valley GettyImages-1247366993
  • news

Waymo lance son service de robotaxis dans toute la Silicon Valley

août 4, 2025
Jio annonce un accord pour lancer Starlink en Inde, suivant de près un partenariat avec Airtel! GettyImages-1227124564
  • news

Jio annonce un accord pour lancer Starlink en Inde, suivant de près un partenariat avec Airtel!

juillet 29, 2025
Dapr prend en charge les agents d’IA : une révolution pour le runtime de microservices GettyImages-1292884888
  • news

Dapr prend en charge les agents d’IA : une révolution pour le runtime de microservices

juillet 21, 2025
Votez: Contribuez à façonner l’agenda TechCrunch All Stage Early-Stage-Roundtable-Sessions-2
  • news

Votez: Contribuez à façonner l’agenda TechCrunch All Stage

juin 19, 2025
May Mobility lancera des robotaxis sur la plateforme Uber au Texas cette année! May_Uber-copy
  • news

May Mobility lancera des robotaxis sur la plateforme Uber au Texas cette année!

juin 13, 2025
Un chercheur européen en intelligence artificielle lève 13M$ pour atteindre le « saint graal » des modèles SpAItial-Co-founders
  • news

Un chercheur européen en intelligence artificielle lève 13M$ pour atteindre le « saint graal » des modèles

juin 9, 2025
Copyright © All rights reserved. | MoreNews by AF themes.