Skip to content
Tecnologies Homes

Tecnologies Homes

Primary Menu
  • commencer
  • Contact
  • news
  • Politique de Confidentialité
  • Home
  • news
  • Les nouveaux modèles d’IA d’OpenAI renforcent la sécurité contre les risques biologiques
  • news

Les nouveaux modèles d’IA d’OpenAI renforcent la sécurité contre les risques biologiques

Home's Editor avril 16, 2025
ChatGPT AI Photo Illustration

The ChatGPT logo appears on a smartphone screen in this illustration photo in Reno, United States, on January 3, 2025. (Photo Illustration by Jaque Silva/NurPhoto via Getty Images)

OpenAI a annoncé le déploiement d’un nouveau système de surveillance pour ses derniers modèles d’IA de raisonnement, o3 et o4-mini, afin de gérer les prompts liés aux menaces biologiques et chimiques. Ce système a pour objectif d’empêcher les modèles de fournir des conseils pouvant instruire quelqu’un sur la mise en œuvre d’attaques potentiellement dangereuses, selon le rapport sur la sécurité d’OpenAI.

O3 et o4-mini représentent une avancée significative par rapport aux modèles précédents d’OpenAI, affirme l’entreprise, ce qui implique de nouveaux risques entre les mains de personnes mal intentionnées. Selon les benchmarks internes d’OpenAI, o3 est plus compétent pour répondre à des questions concernant la création de certains types de menaces biologiques en particulier. C’est pourquoi – et pour atténuer d’autres risques – OpenAI a mis en place ce nouveau système de surveillance, décrit comme un « moniteur de raisonnement axé sur la sécurité ».

Ce moniteur, spécialement formé pour analyser les politiques de contenu d’OpenAI, fonctionne en parallèle avec o3 et o4-mini. Son rôle est d’identifier les prompts liés aux risques biologiques et chimiques, et d’instruire les modèles à ne pas fournir de conseils sur ces sujets.

Afin de créer une base solide, OpenAI a engagé des équipes rouges pendant environ 1 000 heures pour repérer les conversations « non sécurisées » liées aux risques biologiques de o3 et o4-mini. Lors d’un test simulant la « logique de blocage » de son moniteur de sécurité, les modèles ont refusé de répondre aux prompts risqués 98,7% du temps, selon OpenAI.

Imagem destacada

OpenAI reconnaît que ce test n’a pas pris en compte les personnes qui pourraient essayer de nouveaux prompts après avoir été bloquées par le moniteur, c’est pourquoi l’entreprise affirme qu’elle continuera à s’appuyer en partie sur une surveillance humaine.

Selon OpenAI, o3 et o4-mini ne représentent pas un « risque élevé » en ce qui concerne les risques biologiques. Cependant, par rapport à o1 et GPT-4, OpenAI affirme que les premières versions de o3 et o4-mini se sont révélées plus utiles pour répondre à des questions sur le développement d’armes biologiques.

Chart from o3 and o4-mini’s system card (Screenshot: OpenAI)

[[IMG::Imagem destacada]]

Continue Reading

Previous: Deck lèche $12M pour « Plaid-ifier » n’importe quel site web en utilisant l’IA – « Deck arrecada $12M para « Plaid-ificar » qualquer site usando IA
Next: Interdiction en Chine : constructeurs automobiles ne peuvent plus utiliser le terme « conduite autonome » dans leurs publicités

Related News

GettyImages-1247366993
  • news

Waymo lance son service de robotaxis dans toute la Silicon Valley

Home's Editor août 4, 2025
GettyImages-1227124564
  • news

Jio annonce un accord pour lancer Starlink en Inde, suivant de près un partenariat avec Airtel!

Home's Editor juillet 29, 2025
GettyImages-1292884888
  • news

Dapr prend en charge les agents d’IA : une révolution pour le runtime de microservices

Home's Editor juillet 21, 2025

Liste des publications

Waymo lance son service de robotaxis dans toute la Silicon Valley GettyImages-1247366993
  • news

Waymo lance son service de robotaxis dans toute la Silicon Valley

août 4, 2025
Jio annonce un accord pour lancer Starlink en Inde, suivant de près un partenariat avec Airtel! GettyImages-1227124564
  • news

Jio annonce un accord pour lancer Starlink en Inde, suivant de près un partenariat avec Airtel!

juillet 29, 2025
Dapr prend en charge les agents d’IA : une révolution pour le runtime de microservices GettyImages-1292884888
  • news

Dapr prend en charge les agents d’IA : une révolution pour le runtime de microservices

juillet 21, 2025
Votez: Contribuez à façonner l’agenda TechCrunch All Stage Early-Stage-Roundtable-Sessions-2
  • news

Votez: Contribuez à façonner l’agenda TechCrunch All Stage

juin 19, 2025
May Mobility lancera des robotaxis sur la plateforme Uber au Texas cette année! May_Uber-copy
  • news

May Mobility lancera des robotaxis sur la plateforme Uber au Texas cette année!

juin 13, 2025
Un chercheur européen en intelligence artificielle lève 13M$ pour atteindre le « saint graal » des modèles SpAItial-Co-founders
  • news

Un chercheur européen en intelligence artificielle lève 13M$ pour atteindre le « saint graal » des modèles

juin 9, 2025
Copyright © All rights reserved. | MoreNews by AF themes.