Skip to content
Tecnologies Homes

Tecnologies Homes

Primary Menu
  • commencer
  • Contact
  • news
  • Politique de Confidentialité
  • Home
  • news
  • Google lance le « caching implicite » pour des modèles d’IA moins chers
  • news

Google lance le « caching implicite » pour des modèles d’IA moins chers

Home's Editor mai 8, 2025
GettyImages-2169339854

Google a introduit une nouvelle fonctionnalité dans son API Gemini qui, selon la société, rendra ses derniers modèles d’IA moins chers pour les développeurs tiers. Cette fonctionnalité, appelée « mise en cache implicite », peut offrir jusqu’à 75 % d’économies sur le « contexte répétitif » transmis aux modèles via l’API Gemini. Elle est compatible avec les modèles Google Gemini 2.5 Pro et 2.5 Flash.

Cette annonce devrait être une bonne nouvelle pour les développeurs alors que les coûts d’utilisation des modèles de pointe ne cessent d’augmenter.

Imagem destacada

La mise en cache est une pratique largement adoptée dans l’industrie de l’IA, permettant de réduire les exigences en matière de calcul et de coûts en réutilisant les données fréquemment consultées ou précalculées à partir des modèles. Google proposait déjà la mise en cache des instructions des modèles, mais seulement de manière explicite, nécessitant une intervention manuelle des développeurs. Face aux plaintes des développeurs concernant les coûts élevés, l’entreprise a introduit la mise en cache implicite, qui est automatique pour les modèles Gemini 2.5.

Lorsqu’une demande partage un préfixe commun avec une demande précédente, elle est éligible pour un hit de cache, permettant des économies significatives. Il est recommandé aux développeurs de conserver le contexte répétitif au début des demandes pour augmenter les chances de réussite des hits de cache implicites. Google n’a cependant pas fourni de vérification tierce de ces économies automatiques. Les premiers utilisateurs devront donc tester cette nouvelle fonctionnalité pour en mesurer l’efficacité.

Continue Reading

Previous: Tesla: Les « Robotaxis » et « Cybercabs » en difficulté avant leur lancement en juin
Next: Startups Hebdo: Diverses voies vers la liquidité

Related News

GettyImages-1247366993
  • news

Waymo lance son service de robotaxis dans toute la Silicon Valley

Home's Editor août 4, 2025
GettyImages-1227124564
  • news

Jio annonce un accord pour lancer Starlink en Inde, suivant de près un partenariat avec Airtel!

Home's Editor juillet 29, 2025
GettyImages-1292884888
  • news

Dapr prend en charge les agents d’IA : une révolution pour le runtime de microservices

Home's Editor juillet 21, 2025

Liste des publications

Waymo lance son service de robotaxis dans toute la Silicon Valley GettyImages-1247366993
  • news

Waymo lance son service de robotaxis dans toute la Silicon Valley

août 4, 2025
Jio annonce un accord pour lancer Starlink en Inde, suivant de près un partenariat avec Airtel! GettyImages-1227124564
  • news

Jio annonce un accord pour lancer Starlink en Inde, suivant de près un partenariat avec Airtel!

juillet 29, 2025
Dapr prend en charge les agents d’IA : une révolution pour le runtime de microservices GettyImages-1292884888
  • news

Dapr prend en charge les agents d’IA : une révolution pour le runtime de microservices

juillet 21, 2025
Votez: Contribuez à façonner l’agenda TechCrunch All Stage Early-Stage-Roundtable-Sessions-2
  • news

Votez: Contribuez à façonner l’agenda TechCrunch All Stage

juin 19, 2025
May Mobility lancera des robotaxis sur la plateforme Uber au Texas cette année! May_Uber-copy
  • news

May Mobility lancera des robotaxis sur la plateforme Uber au Texas cette année!

juin 13, 2025
Un chercheur européen en intelligence artificielle lève 13M$ pour atteindre le « saint graal » des modèles SpAItial-Co-founders
  • news

Un chercheur européen en intelligence artificielle lève 13M$ pour atteindre le « saint graal » des modèles

juin 9, 2025
Copyright © All rights reserved. | MoreNews by AF themes.