Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Pricing
Podcast Image

Choses à Savoir TECH

o3 d’Open AI atteint le niveau de l’intelligence humaine ?

08 Jan 2025

Description

Le système O3 d’OpenAI, futur moteur de ChatGPT, a marqué un tournant majeur dans la recherche en intelligence artificielle. Il a récemment obtenu un score de 85 % au test ARC-AGI, un benchmark de référence conçu pour évaluer la capacité des systèmes d’IA à généraliser et s’adapter à de nouvelles situations. Ce résultat, égal à la moyenne humaine, surpasse nettement les 55 % obtenus par les IA précédentes. Une avancée qui alimente les espoirs d’approcher l’intelligence artificielle générale (AGI). Le test ARC-AGI, développé par le chercheur français François Chollet, évalue l'efficacité d’échantillonnage : la capacité à résoudre des problèmes inédits à partir de quelques exemples. Concrètement, il s’agit pour l’IA d’analyser des transformations appliquées à des grilles carrées, à partir de trois exemples, avant de généraliser une règle pour résoudre un cas supplémentaire. O3 a impressionné en démontrant une aptitude à identifier des règles simples et généralisables. Selon certains experts, le système pourrait fonctionner par « chaînes de pensée », testant différentes étapes pour résoudre les problèmes avant de sélectionner la meilleure. Une méthode proche de celle d’AlphaGo, l’IA de Google qui a battu le champion du monde de Go. Mais cet enthousiasme s’accompagne de prudence. OpenAI reste discrète sur les détails techniques et les capacités réelles d’O3, limitant ses communications à quelques tests préliminaires. Des experts craignent que cette performance soit le fruit d’une optimisation spécifique au test ARC-AGI, plutôt qu’une véritable capacité de généralisation applicable à d’autres contextes.  Pour trancher, des évaluations plus vastes seront nécessaires. Si O3 démontre une adaptabilité humaine dans divers domaines, les répercussions pourraient être révolutionnaires, ouvrant la voie à des IA auto-améliorantes avec des impacts sociétaux majeurs. Reste à voir si cette promesse deviendra réalité. Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Audio
Featured in this Episode

No persons identified in this episode.

Transcription

This episode hasn't been transcribed yet

Help us prioritize this episode for transcription by upvoting it.

0 upvotes
🗳️ Sign in to Upvote

Popular episodes get transcribed faster

Comments

There are no comments yet.

Please log in to write the first comment.