2025-03-03 04:00 PM UTC+9:00

Claude 3.7 Sonet est disponible : ChatGPT est maintenant au revoir !

vvd.im/claude-37-sonet
Liste
https://vvd.im/claude-37-sonet
Anthropic a publié Claude Sonnet 3.7, le modèle d’IA le plus récent et le plus avancé à ce jour.

Cette nouvelle version introduit des fonctionnalités révolutionnaires qui améliorent les capacités d’inférence, la maîtrise du codage et l’interaction avec l’utilisateur.
Avec l’inférence hybride, le support amélioré du développement logiciel et les outils de ligne de commande pour les agents de codage, Claude Sonet 3.7 redéfinira les flux de travail assistés par l’IA.
Claude 3.7 Sonet est disponible : ChatGPT est maintenant au revoir !

Claude 3.7 Sonet a été publié le 25 février 2025.

Claude 3.7 Sonnet est maintenant disponible pour tous les clients ayant un plan Copilot payant. Ce nouveau modèle Sonnet supporte à la fois les modes pensant et non pensant de Copilot. Les tests initiaux ont montré des améliorations particulièrement fortes dans les scénarios d’agents.
Dans notre évaluation interne sur GitHub, le modèle a montré des améliorations par rapport aux modèles précédents dans sa capacité à suivre des instructions, à décomposer des tâches complexes, et à construire de nouvelles revues humaines (UI).

Nous avons passé des mois à utiliser Sonnet 3.5 et 3.6 pour améliorer le code de plusieurs projets basés sur Java et JavaScript, et la 3.7 a immédiatement fourni un code plus beau, plus moderne et amélioré.

Les réponses de 3.7 nous ont guidé à travers la structure des dossiers, l’installation des dépendances, la configuration initiale du projet, et comment créer des bibliothèques, et ensuite cela fonctionne avec chacune de nos pages JSX, chacune avec des milliers de lignes de code, et cela fonctionne sans bugs ou problèmes de référence ou de bibliothèque.

Si vous n’êtes pas développeur, n’ayez crainte, il vous faut maintenant moins de 3 minutes pour créer un beau site web avec les CSS appropriés, des animations, des couleurs et une interface utilisateur moderne.

Cet article a été réécrit à partir d’un article publié à l’origine sur le site Anthropic.

Pour lire l’article précédent sur "ChatGPT vs Claude", cliquez ici.

 

Code Claude

Claude 3.7 Sonnet est un grand pas en avant, en particulier pour le codage et le développement web frontal. Avec ce modèle, nous introduisons également Claude Code, un outil en ligne de commande pour les agents de codage. Claude Code est disponible en avant-première de recherche limitée et permet aux développeurs de déléguer des tâches d’ingénierie importantes à Claude directement à partir du terminal. Claude Code est disponible en avant-première de recherche limitée et permet aux développeurs de déléguer des tâches d’ingénierie importantes à Claude directement à partir du terminal.

Claude 3.7 Sonnet est maintenant disponible sur tous les plans Claude - Free, Pro, Team, et Enterprise - et sur Anthropic API, Amazon Bedrock, et Vertex AI sur Google Cloud. Les modes de réflexion étendus sont disponibles sur tous les plans à l’exception du plan Claude gratuit.

Pour les modes de réflexion standard et étendu, le prix de Claude 3.7 Sonnet est le même que celui des versions précédentes : 3$ pour 1 million de jetons d’entrée et 15$ pour 1 million de jetons de sortie (y compris les jetons d’incident).

Claude 3.7 Sonnet : le raisonnement aux frontières rendu pratique

Claude a développé Claude 3.7 Sonnet avec une philosophie différente de celle des autres modèles d’inférence sur le marché : tout comme les humains utilisent un cerveau pour les réactions rapides et un autre pour la contemplation profonde, nous pensons que l’inférence devrait être une caractéristique intégrée du modèle Frontier, plutôt qu’un modèle complètement séparé. Cette approche intégrée fournit une expérience plus transparente pour les utilisateurs.

Claude 3.7 Sonnet met en oeuvre cette philosophie de plusieurs façons.

  • Tout d’abord, Claude 3.7 Sonnet a la fonctionnalité d’un LLM normal et d’un modèle d’inférence. Vous pouvez choisir quand vous voulez que le modèle réponde normalement et quand vous voulez qu’il réfléchisse plus longtemps avant de répondre. En mode standard, Claude 3.7 Sonnet est une version améliorée de Claude 3.5 Sonnet. En mode de réflexion étendue, vous pouvez obtenir de meilleurs résultats en mathématiques, en physique, en suivant des instructions, en codage et dans beaucoup d’autres tâches parce que vous réfléchissez avant de répondre. En général, les modèles fonctionnent de la même manière dans les deux modes.
     
  • Deuxièmement, lors de l’utilisation de Claude 3.7 Sonnet via l’API, les utilisateurs peuvent contrôler le budget de leur réflexion : Ils peuvent demander à Claude de ne pas dépasser N jetons, où N peut être n’importe quelle valeur jusqu’à la limite de 128 000 jetons. Cela vous permet d’échanger la vitesse et le coût contre la qualité des réponses.
     
  • Troisièmement, en développant le modèle d’inférence, nous n’avons pas optimisé autant pour les questions de concours de mathématiques et d’informatique, mais nous nous sommes concentrés sur des tâches du monde réel qui reflètent mieux la façon dont les entreprises utilisent réellement les LLM.

    Les tests initiaux ont montré que les compétences de Claude en matière de codage étaient généralement bonnes. Cursor a confirmé que Claude était une fois de plus au sommet de son art dans les tâches de codage du monde réel, montrant une amélioration significative dans des domaines allant de la manipulation de bases de code complexes à l’utilisation d’outils avancés. Cognition l’a trouvé bien supérieur à tout autre modèle en termes de planification des changements de code et de gestion des mises à jour de la pile complète ; Vercel a souligné la précision supérieure de Claude pour les flux de travail complexes des agents ; et Replit a déployé Claude avec succès là où d’autres modèles ont échoué, en construisant des applications web et des tableaux de bord sophistiqués à partir de zéro. Dans l’évaluation de Canva, Claude a constamment produit du code prêt à la production avec un grand flair en matière de conception et une réduction considérable des erreurs.

Vérifié par SWE-bench

Claude 3.7 Sonnet a atteint des performances de pointe dans SWE-bench Verified, qui évalue la capacité des modèles d’IA à résoudre des problèmes logiciels réels.

Banc TAU

Claude 3.7 Sonnet atteint des performances de pointe sur TAU-bench, un cadre pour tester des agents d’intelligence artificielle sur des tâches complexes du monde réel avec l’interaction de l’utilisateur et de l’outil.

Claude 3.7 Sonnet

Claude 3.7 Sonnet excelle dans le suivi des instructions, le raisonnement général, les capacités multimodales et le codage d’agents, tandis que la pensée étendue offre des gains notables en mathématiques et en sciences. Au-delà des repères traditionnels, il a surpassé tous les modèles précédents dans le playtest des jeux Pokémon.

Le code Claude

Depuis juin 2024, Sonnet est devenu le modèle préféré des développeurs du monde entier. Pour donner encore plus de pouvoir aux développeurs, nous avons publié Claude Code, notre premier outil de codage d’agent, en tant qu’avant-première de recherche limitée.
Claude Code est un outil de collaboration active qui vous permet de rechercher et de lire du code, d’éditer des fichiers, d’écrire et d’exécuter des tests, de livrer et de pousser du code sur GitHub, et d’utiliser des outils de ligne de commande.

Claude Code est un produit précoce, mais il deviendra indispensable, en particulier pour le développement piloté par les tests, le débogage de problèmes complexes et le remaniement à grande échelle.

Lors des premiers tests, Claude Code a permis de réduire le temps de développement et les frais généraux en réalisant en une seule fois des tâches qui nécessiteraient normalement 45 minutes ou plus de travail manuel.
Dans les semaines à venir, ils continueront à apporter des améliorations basées sur l’utilisation (en améliorant la fiabilité des appels d’outils, en ajoutant un support pour les commandes de longue durée, en améliorant le rendu dans l’application, et en développant leur propre compréhension des capacités de Claude).

L’objectif de Claude avec Claude Code est de mieux comprendre comment les développeurs utilisent Claude pour coder, ce qui permettra d’améliorer le modèle à l’avenir.

Disponibilité et prix

Pour les développeurs qui cherchent à construire des solutions d’IA personnalisées en utilisant Claude 3.7 Sonnet, il est disponible sur Anthropic API, Amazon Bedrock, et Vertex AI sur Google Cloud.

Pour les utilisateurs professionnels et les consommateurs qui souhaitent collaborer avec Claude 3.7 Sonnet à travers une expérience de chat simple, Claude 3.7 Sonnet est disponible sur Claude.ai pour tous les utilisateurs sur le web, iOS, et Android.

Le prix de Claude 3.7 Sonnet commence à 3 $ pour 1 million de jetons d’entrée et 15 $ pour 1 million de jetons de sortie, avec des économies allant jusqu’à 90 % avec la mise en cache instantanée et 50 % avec le traitement par lots. Voir notre page de tarification pour plus de détails.

Travailler sur votre base de code avec Claude

Nous avons également amélioré l’expérience de codage sur Claude.ai : l’intégration de GitHub est maintenant disponible sur tous les plans Claude. Les développeurs peuvent connecter leurs dépôts de code directement à Claude.

Claude 3.7 Sonnet est le meilleur modèle de codage jamais développé. En approfondissant sa compréhension des projets personnels, professionnels et open source, il deviendra un partenaire encore plus fort dans la correction des bugs, le développement des fonctionnalités et la documentation de vos projets GitHub les plus importants.

Développement responsable

Claude a travaillé avec des experts externes pour mener des tests et des évaluations approfondis de Claude 3.7 Sonnet afin de s’assurer qu’il répond aux normes de sécurité, de sûreté et de fiabilité. Claude 3.7 Sonnet fait également une distinction plus fine entre les demandes nuisibles et inoffensives, ce qui se traduit par 45% de rejets inutiles en moins que les versions précédentes. Claude 3.7 Sonnet fait également une distinction plus fine entre les demandes nuisibles et inoffensives, ce qui se traduit par 45% de rejets inutiles en moins que les versions précédentes.

La carte du système couvre les nouveaux résultats de sécurité dans plusieurs catégories et fournit une analyse détaillée de l’évaluation de la politique de mise à l’échelle responsable que d’autres laboratoires d’IA et chercheurs peuvent appliquer à leur travail. La carte aborde également les nouveaux risques associés à l’utilisation de l’ordinateur, en particulier les attaques par injection rapide, et décrit comment nous avons évalué ces vulnérabilités et formé Claude pour résister à ces attaques et les atténuer. Nous étudions également les avantages potentiels des modèles d’inférence en matière de sécurité, à savoir la capacité de comprendre comment un modèle prend des décisions et si son raisonnement est réellement digne de confiance et fiable.

Regarder vers l’avenir

Claude 3.7 Sonet et Claude franchissent une étape importante vers des systèmes d’IA capables d’augmenter véritablement les capacités humaines. Grâce à leur capacité à réfléchir en profondeur, à travailler de manière autonome et à collaborer efficacement, ils nous rapprochent d’un avenir où l’IA enrichira et élargira ce que l’homme peut accomplir.

L'avenir de Claude AI

Je suis impatient d’explorer ces nouvelles capacités et de voir ce que nous pouvons créer avec elles. Claude est toujours à la recherche de commentaires de la part desutilisateurs afin de continuer à améliorer et à faire évoluer le modèle.

Je vous remercie de votre attention.

Liste


JaeDeok Park
Responsable qualité
JaeDeok Park est responsable qualité chez Vivoldi, où il s'efforce de résoudre les problèmes des utilisateurs et d'offrir un service irréprochable.
Pendant son temps libre, il aime lire et faire du shopping, même si ce n'est qu'occasionnellement.