L’innovation la plus importante du modèle est la capacité intégrée d’utiliser directement des logiciels, des sites Web et des outils numériques. En d’autres termes, le système peut désormais agir comme un assistant travaillant au sein des applications.
Le but de la mise à jour est de se concentrer sur l’automatisation de tâches complexes plutôt que sur le chat par rapport aux versions précédentes. Il inclut également des améliorations significatives dans le raisonnement, l’écriture de code et la gestion de documents longs.
Voici cinq éléments clés qui ont vraiment changé par rapport aux versions précédentes :
1. Un modèle pouvant utiliser directement l’ordinateur
La plus grande innovation est la fonctionnalité appelée « utilisation de l’ordinateur ». GPT-5.4 est le premier modèle polyvalent d’OpenAI conçu pour contrôler nativement l’ordinateur.
Modèle:
Capable d’écrire du code qui interagit avec des programmes et des sites Web
Capable d’utiliser des bibliothèques d’automatisation
Peut créer des commandes de souris et de clavier basées sur des captures d’écran
En d’autres termes, il explique non seulement ce qui doit être fait, mais peut également effectuer des opérations directement au sein des applications et des interfaces.
2. Conçu pour créer des agents d’IA autonomes
OpenAI identifie GPT-5.4 comme le modèle le plus approprié spécifiquement pour le développement d’agents d’IA.
Un agent IA :
Peut ouvrir un site Web
peut rechercher des informations
Peut remplir le formulaire
Peut effectuer des tâches en plusieurs étapes à l’aide de différents outils
Cette approche vise à transformer l’intelligence artificielle d’un simple chatbot en un moteur opérationnel fonctionnant dans différents systèmes numériques.
3. Intégration plus forte avec les outils et les API
Une autre différence importante dans GPT-5.4 est que l’intégration avec des outils et des API externes a été améliorée.
Le modèle peut désormais effectuer des appels API et utiliser les outils avec plus de précision et d’efficacité pendant la mission. Ainsi, il peut réaliser des tâches complexes sans intervention manuelle en regroupant différents services tels que des navigateurs, des bases de données et des logiciels d’entreprise.
4. Beaucoup plus puissant pour travailler avec des documents complexes
Le modèle est également optimisé pour analyser des textes longs et structurés. Il fait preuve de hautes performances notamment dans les documents complexes tels que les contrats ou les documents juridiques.
Lors des tests d’analyse juridique et documentaire, GPT-5.4 a obtenu des scores élevés pour le maintien de l’exactitude et de l’intégrité structurelle des textes longs.
Par conséquent, le modèle est conçu pour des scénarios d’utilisation professionnelle plutôt que pour un simple chat.
5. Version « Réflexion » pour un raisonnement avancé
Outre le modèle de base, une version appelée GPT-5.4 Thinking a également été introduite.
Cette version se concentre spécifiquement sur des domaines tels que les tâches qui nécessitent plus de raisonnement, de planification et d’analyse de problèmes complexes.
Il comprend également de nouvelles mesures de sécurité afin de pouvoir être utilisé notamment dans des domaines sensibles tels que la cybersécurité.
Alors que le modèle Thinking sera proposé aux utilisateurs Plus, Team et Pro, la version Pro, qui comprend des fonctionnalités plus avancées, sera disponible uniquement pour les abonnés Pro et Enterprise. Les utilisateurs gratuits n’ont pas accès à cette nouvelle version à ce stade.
