Une avancée scientifique : l'IA Mythos résout 30 % des problèmes insolubles pour les humains

Claude, un chercheur de l'entreprise Anthropic, a récemment testé les capacités de ses modèles d'IA, notamment Claude Mythos et Claude Opus, dans le domaine de la bio-informatique. Les résultats de cette étude sont impressionnants : Mythos a réussi à résoudre des problèmes complexes que même des experts humains n'ont pas pu élucider.

Une IA générative aux compétences multiples

Claude Mythos, une intelligence artificielle développée par Anthropic, ne cesse de susciter l'intérêt. Bien que les discussions autour de ses compétences en cybersécurité aient dominé les médias, il est essentiel de rappeler que Mythos est également une IA générative à usage général, capable d'apporter des solutions dans divers domaines, y compris la science.

Le défi de la bio-informatique

La bio-informatique combine l'informatique, les mathématiques et la statistique pour résoudre des problèmes biologiques. Pour évaluer les performances de ses modèles d'IA dans ce domaine, Anthropic a mis en place un nouveau benchmark, le BioMysteryBench, composé de 99 questions complexes. Ces questions, souvent jugées difficiles voire impossibles à résoudre, sont vérifiables, ce qui les rend encore plus intéressantes pour l'évaluation des modèles d'IA.

Des résultats impressionnants

Parmi les 99 questions, un panel d'experts a réussi à répondre à 73 d'entre elles. Claude Mythos a affiché un taux de réussite de 82,6 % pour les problèmes solvables par des humains. En comparaison, Claude Opus 4.7, le modèle déjà disponible pour le grand public, a obtenu un taux de 78,9 %.

L&T Technology Services et Assai Software : Une alliance pour révolutionner l'intelligence d'ingénierie grâce au jumeau numérique

Ce qui est encore plus remarquable, c'est que Mythos a également réussi à répondre à 30 % des 23 questions que les experts n'ont pas pu résoudre. Claude Mythos a donc atteint un taux de bonnes réponses de 29,6 %, tandis que Claude Opus 4.7 a obtenu un taux de 27 %.

Une intelligence artificielle aux méthodes innovantes

La capacité de Claude Mythos à résoudre des problèmes que les experts ont jugés insolubles s'explique en partie par une caractéristique unique de l'intelligence artificielle : sa vaste base de connaissances. Comme le souligne le laboratoire d'IA, « la vaste base de connaissances sous-jacente de Claude contient des informations sur la biologie structurale, les profils moléculaires et les méta-analyses issues de centaines de milliers d'articles ». Contrairement aux humains, qui doivent réaliser des méta-analyses ou combiner plusieurs bases de données, Mythos est capable d'accéder à ces informations en un instant.

En outre, l'IA est capable de développer de nouvelles techniques pour résoudre des problèmes, offrant ainsi aux scientifiques de nouvelles perspectives. Lorsque Claude n'est pas sûr d'une réponse, il combine plusieurs méthodes et intègre des éléments de preuve provenant de ces différentes approches pour arriver à une conclusion.

L&T Technology Services et Assai Software unissent leurs forces pour faire avancer l'intelligence d'ingénierie avec le jumeau numérique

Des enjeux de cybersécurité à prendre en compte

Actuellement, la sortie de Claude Mythos est restreinte, excepté pour quelques organisations, en raison des préoccupations liées à la cybersécurité. En effet, les compétences en cybersécurité de Mythos pourraient être détournées par des individus malintentionnés pour découvrir et exploiter de nouvelles vulnérabilités, plutôt que de les signaler.

À titre d'exemple, en utilisant Mythos, Mozilla a réussi à identifier 271 failles de sécurité sur Firefox, qu'il a ensuite corrigées par le biais d'une mise à jour du navigateur. Cela souligne l'importance de gérer les risques associés à l'utilisation de l'IA dans ce domaine.

Des perspectives futures prometteuses

Malgré ces défis, cette étude rappelle que Mythos possède également un potentiel considérable dans d'autres secteurs et pourrait contribuer à des avancées majeures pour l'humanité, à condition que les risques en cybersécurité soient maîtrisés. Anthropic a déjà montré quelques exemples des compétences de Mythos en matière de codage, de raisonnement et de raisonnement visuel, lors du lancement du modèle Opus 4.7.

La méga-fusée Starship V3 de SpaceX a enfin une date de lancement : découvrez quand elle décollera

Anthropic envisage de rendre Claude Mythos accessible au public dès qu'il aura réussi à atténuer les risques en matière de cybersécurité. Les mesures de sécurité en cours d'évaluation pour Claude Mythos sont actuellement testées sur Claude Opus 4.7.

Conclusion

L'annonce de Claude Mythos a suscité un véritable engouement, notamment en raison de ses compétences en cybersécurité. Cependant, la dernière étude d'Anthropic recentre le débat en soulignant que ce modèle d'intelligence artificielle pourrait avoir des applications significatives dans le domaine scientifique, ouvrant ainsi la voie à de potentielles découvertes révolutionnaires.

Pour rester informé des dernières actualités, suivez-nous sur Google Actualités et WhatsApp. Abonnez-vous à notre newsletter pour recevoir chaque matin un résumé de l'actualité technologique.

Une avancée scientifique : l'IA Mythos résout 30 % des problèmes insolubles pour les humains

Une IA générative aux compétences multiples

Le défi de la bio-informatique

Des résultats impressionnants

Une intelligence artificielle aux méthodes innovantes

Des enjeux de cybersécurité à prendre en compte

Des perspectives futures prometteuses

Conclusion

SpaceX envisage des ports spatiaux mondiaux pour soutenir ses ambitions de lancement de Starship avant son introduction en bourse

Les républicains de Caroline du Sud défient les exigences de Trump sur le redécoupage électoral

Victoire du GOP : la Cour suprême du Missouri valide un nouveau redécoupage électoral

Démantèlement d'un important réseau de falsification palestinien en Cisjordanie par Tsahal et la police israélienne

La police de Columbus inculpe dix mineurs et une femme dans une affaire de crime organisé

Trump envisage sérieusement de faire du Venezuela et de ses 40 trillions de dollars de pétrole une partie permanente des États-Unis

L'Iran saisit des biens d'un ancien footballeur, qualifié de « traître » par le régime