Anthropic dévoile le modèle d'IA Claude Mythos pour la recherche en sécurité
Anthropic a annoncé le projet Glasswing le 8 avril 2026, marquant la première initiative de cybersécurité dédiée de l'entreprise. Le projet se concentre sur Claude Mythos, un modèle d'IA de pointe spécialisé conçu spécifiquement pour la détection de vulnérabilités et la recherche en sécurité. Cela représente un changement significatif pour Anthropic, qui s'est principalement concentré sur la sécurité et la recherche en IA à usage général depuis sa fondation.
Le modèle Claude Mythos diffère sensiblement de la famille existante de modèles Claude d'Anthropic. Alors que les itérations précédentes de Claude étaient conçues pour des tâches générales d'IA conversationnelle et de raisonnement, Mythos intègre une formation spécialisée sur des ensembles de données de sécurité, des bases de données de vulnérabilités et des modèles d'exploitation. Le modèle peut analyser des dépôts de code, des configurations réseau et des architectures système pour identifier des faiblesses de sécurité potentielles que les outils de balayage traditionnels pourraient manquer.
Le développement du projet Glasswing a commencé fin 2025, selon des sources de l'industrie familières avec l'initiative. Le projet représente la réponse d'Anthropic à la demande croissante des clients d'entreprise pour des solutions de sécurité alimentées par l'IA. Le calendrier coïncide avec une pression réglementaire accrue sur les entreprises d'IA pour démontrer des avantages concrets pour la protection des infrastructures critiques.
L'initiative s'appuie sur le cadre d'IA constitutionnelle d'Anthropic, garantissant que le modèle de sécurité fonctionne dans des limites éthiques définies. Cette approche empêche l'IA de générer du code d'exploitation réel tout en maintenant sa capacité à identifier et décrire les vulnérabilités. Le modèle subit des exercices continus de red-teaming pour prévenir les abus tout en maximisant ses capacités défensives.
L'entrée d'Anthropic dans l'IA de cybersécurité représente une expansion stratégique au-delà de l'IA conversationnelle. L'entreprise a investi massivement dans la recherche sur la sécurité, ce qui la positionne bien pour développer des modèles axés sur la sécurité qui équilibrent efficacité et déploiement responsable. Le modèle Claude Mythos intègre les leçons tirées de la recherche précédente sur la sécurité de l'IA, y compris des techniques pour prévenir la manipulation adversariale et assurer une évaluation fiable des vulnérabilités.
Partenaires d'entreprise et impact sur l'industrie de la sécurité
Le déploiement initial du projet Glasswing cible un groupe soigneusement sélectionné d'entreprises technologiques et de sécurité. Amazon Web Services mène le partenariat, utilisant Claude Mythos pour améliorer ses capacités de balayage de sécurité existantes à travers l'infrastructure cloud. La participation d'Apple se concentre sur la recherche en sécurité iOS et macOS, en particulier pour identifier les vulnérabilités dans les composants système et les applications tierces distribuées via l'App Store.
L'implication de Broadcom se concentre sur la sécurité des semi-conducteurs et des équipements de réseau, des domaines où les scanners de vulnérabilités traditionnels ont souvent du mal avec l'analyse des micrologiciels et des systèmes embarqués. Cisco apporte son expertise en infrastructure réseau, utilisant Claude Mythos pour analyser les protocoles de routage, les configurations de commutation et les postures de sécurité des réseaux d'entreprise. La participation de CrowdStrike ajoute des capacités de détection et de réponse aux points de terminaison, intégrant la découverte de vulnérabilités alimentée par l'IA avec des opérations de chasse aux menaces en temps réel.
Le déploiement en avant-première affecte les organisations gérant des infrastructures à grande échelle et des écosystèmes logiciels complexes. Ces partenaires représentent des millions de clients d'entreprise qui pourraient bénéficier de capacités améliorées de détection des vulnérabilités. L'initiative impacte particulièrement les entreprises aux prises avec la complexité croissante des piles logicielles modernes, où les examens de sécurité manuels deviennent de plus en plus impraticables.
Les chercheurs en sécurité et les entreprises de tests de pénétration font face à une perturbation potentielle de la découverte de vulnérabilités alimentée par l'IA. Bien que Claude Mythos vise à augmenter plutôt qu'à remplacer l'expertise humaine, sa capacité à analyser de vastes bases de code et des fichiers de configuration pourrait accélérer considérablement les évaluations de sécurité. Ce développement pourrait nécessiter que les professionnels de la sécurité adaptent leurs méthodologies et se concentrent davantage sur l'analyse stratégique plutôt que sur la chasse aux vulnérabilités de routine.
Mise en œuvre technique et mesures de sécurité
Le projet Glasswing fonctionne via des points de terminaison API sécurisés auxquels les organisations partenaires accèdent via des connexions cryptées. Le modèle Claude Mythos fonctionne sur l'infrastructure dédiée d'Anthropic, garantissant que le code sensible et les données de configuration ne quittent jamais les environnements contrôlés. Les partenaires soumettent des demandes d'analyse via une interface spécialisée qui assainit les entrées et enregistre toutes les interactions à des fins d'audit.
La mise en œuvre comprend plusieurs couches de sécurité pour prévenir les abus. Claude Mythos ne peut pas générer de code d'exploitation fonctionnel ni fournir d'instructions d'attaque étape par étape. Au lieu de cela, il identifie des modèles de vulnérabilité et fournit des conseils de remédiation alignés sur les meilleures pratiques de l'industrie. Les sorties du modèle subissent un filtrage automatisé pour supprimer les informations potentiellement dangereuses tout en préservant des informations de sécurité exploitables.
Les organisations intéressées par l'accès au projet Glasswing doivent subir un processus de vérification rigoureux. Anthropic exige des évaluations de sécurité détaillées, des vérifications des antécédents pour le personnel clé et des accords signés régissant l'utilisation des renseignements de sécurité générés par l'IA. L'entreprise maintient des contrôles stricts sur l'accès au modèle, avec la capacité de révoquer immédiatement les autorisations en cas de détection d'abus.
L'architecture technique intègre des techniques de confidentialité différentielle pour protéger les informations sensibles des données d'entraînement. Claude Mythos apprend à partir de modèles de vulnérabilité agrégés sans conserver de détails spécifiques sur les systèmes ou organisations individuels. Cette approche permet une recherche efficace en sécurité tout en maintenant la confidentialité pour tous les participants au programme.
Anthropic prévoit d'étendre progressivement l'accès au projet Glasswing tout au long de 2026, avec des partenaires supplémentaires rejoignant l'initiative après avoir démontré des contrôles de sécurité appropriés et des cas d'utilisation. L'entreprise souligne que Claude Mythos représente un outil défensif conçu pour renforcer la cybersécurité plutôt que pour permettre des capacités offensives. Tous les participants doivent accepter de partager des données de vulnérabilité anonymisées pour améliorer l'efficacité du modèle dans l'ensemble de la communauté de la sécurité.




