Une avancée scientifique : l'IA Mythos résout 30 % des problèmes insolubles pour les humains

Claude, un chercheur de l'entreprise Anthropic, a récemment testé les capacités de ses modèles d'IA, notamment Claude Mythos et Claude Opus, dans le domaine de la bio-informatique. Les résultats de cette étude sont impressionnants : Mythos a réussi à résoudre des problèmes complexes que même des experts humains n'ont pas pu élucider.
Une IA générative aux compétences multiples
Claude Mythos, une intelligence artificielle développée par Anthropic, ne cesse de susciter l'intérêt. Bien que les discussions autour de ses compétences en cybersécurité aient dominé les médias, il est essentiel de rappeler que Mythos est également une IA générative à usage général, capable d'apporter des solutions dans divers domaines, y compris la science.
Le défi de la bio-informatique
La bio-informatique combine l'informatique, les mathématiques et la statistique pour résoudre des problèmes biologiques. Pour évaluer les performances de ses modèles d'IA dans ce domaine, Anthropic a mis en place un nouveau benchmark, le BioMysteryBench, composé de 99 questions complexes. Ces questions, souvent jugées difficiles voire impossibles à résoudre, sont vérifiables, ce qui les rend encore plus intéressantes pour l'évaluation des modèles d'IA.
Des résultats impressionnants
Parmi les 99 questions, un panel d'experts a réussi à répondre à 73 d'entre elles. Claude Mythos a affiché un taux de réussite de 82,6 % pour les problèmes solvables par des humains. En comparaison, Claude Opus 4.7, le modèle déjà disponible pour le grand public, a obtenu un taux de 78,9 %.
Ce qui est encore plus remarquable, c'est que Mythos a également réussi à répondre à 30 % des 23 questions que les experts n'ont pas pu résoudre. Claude Mythos a donc atteint un taux de bonnes réponses de 29,6 %, tandis que Claude Opus 4.7 a obtenu un taux de 27 %.
Une intelligence artificielle aux méthodes innovantes
La capacité de Claude Mythos à résoudre des problèmes que les experts ont jugés insolubles s'explique en partie par une caractéristique unique de l'intelligence artificielle : sa vaste base de connaissances. Comme le souligne le laboratoire d'IA, « la vaste base de connaissances sous-jacente de Claude contient des informations sur la biologie structurale, les profils moléculaires et les méta-analyses issues de centaines de milliers d'articles ». Contrairement aux humains, qui doivent réaliser des méta-analyses ou combiner plusieurs bases de données, Mythos est capable d'accéder à ces informations en un instant.
En outre, l'IA est capable de développer de nouvelles techniques pour résoudre des problèmes, offrant ainsi aux scientifiques de nouvelles perspectives. Lorsque Claude n'est pas sûr d'une réponse, il combine plusieurs méthodes et intègre des éléments de preuve provenant de ces différentes approches pour arriver à une conclusion.
Des enjeux de cybersécurité à prendre en compte
Actuellement, la sortie de Claude Mythos est restreinte, excepté pour quelques organisations, en raison des préoccupations liées à la cybersécurité. En effet, les compétences en cybersécurité de Mythos pourraient être détournées par des individus malintentionnés pour découvrir et exploiter de nouvelles vulnérabilités, plutôt que de les signaler.
À titre d'exemple, en utilisant Mythos, Mozilla a réussi à identifier 271 failles de sécurité sur Firefox, qu'il a ensuite corrigées par le biais d'une mise à jour du navigateur. Cela souligne l'importance de gérer les risques associés à l'utilisation de l'IA dans ce domaine.
Des perspectives futures prometteuses
Malgré ces défis, cette étude rappelle que Mythos possède également un potentiel considérable dans d'autres secteurs et pourrait contribuer à des avancées majeures pour l'humanité, à condition que les risques en cybersécurité soient maîtrisés. Anthropic a déjà montré quelques exemples des compétences de Mythos en matière de codage, de raisonnement et de raisonnement visuel, lors du lancement du modèle Opus 4.7.
Anthropic envisage de rendre Claude Mythos accessible au public dès qu'il aura réussi à atténuer les risques en matière de cybersécurité. Les mesures de sécurité en cours d'évaluation pour Claude Mythos sont actuellement testées sur Claude Opus 4.7.
Conclusion
L'annonce de Claude Mythos a suscité un véritable engouement, notamment en raison de ses compétences en cybersécurité. Cependant, la dernière étude d'Anthropic recentre le débat en soulignant que ce modèle d'intelligence artificielle pourrait avoir des applications significatives dans le domaine scientifique, ouvrant ainsi la voie à de potentielles découvertes révolutionnaires.
Pour rester informé des dernières actualités, suivez-nous sur Google Actualités et WhatsApp. Abonnez-vous à notre newsletter pour recevoir chaque matin un résumé de l'actualité technologique.

SpaceX envisage des ports spatiaux mondiaux pour soutenir ses ambitions de lancement de Starship avant son introduction en bourse





