Anthropic reforza a posición de Claude como modelo de IA para programar

xoves, 22 de maio do 2025 Redacción

Anthropic presentou oficialmente Claude 4, unha nova xeración de modelos de IA composta por Claude Opus 4 e Claude Sonnet 4, pensada para ofrecer avances substanciais en tarefas de programación, razoamento complexo e creación de axentes autónomos. Estes modelos representan un salto cualitativo respecto ás versións anteriores, tanto no plano técnico coma nas súas aplicacións prácticas, e están dispoñibles xa a través da API de Anthropic, Amazon Bedrock e Vertex AI de Google Cloud.
Claude Opus 4 preséntase como o modelo máis potente creado ata a data pola compañía, e tamén como o mellor do mundo en programación. Consegue puntuacións récord no benchmark SWE-bench (72,5 %) e Terminal-bench (43,2 %), demostrando unha capacidade sen precedentes para manter un rendemento sostido en tarefas longas que requiren miles de pasos e horas de execución continua. Empresas como Cursor, Replit ou Block coinciden en cualificalo como unha ferramenta revolucionaria, capaz de mellorar a calidade do código mentres resolve problemas complexos en múltiples ficheiros. Rakuten validou as súas capacidades cunha refactorización aberta que durou sete horas sen interrupcións, mentres que Cognition destaca a súa capacidade para resolver desafíos críticos que modelos anteriores non eran quen de abordar.
Claude Sonnet 4, aínda que non alcanza o nivel de Opus en todos os ámbitos, representa unha mellora notable fronte á versión 3.7. Obtivo unha puntuación de 72,7 % en SWE-bench e combina rendemento e eficiencia con alta capacidade de adaptación ás instrucións. GitHub anunciou que Sonnet 4 será o motor do novo axente de codificación de GitHub Copilot, mentres que compañías como Manus, iGent ou Sourcegraph salientan a súa capacidade para seguir indicacións complexas, navegar código de forma precisa e desenvolver aplicacións autónomas con múltiples funcións.
Unha das innovacións máis destacadas é a incorporación do chamado pensamento estendido con uso de ferramentas (aínda en fase beta), que permite ao modelo combinar o razoamento interno con accións externas, como empregar buscadores ou consultar ficheiros. Ademais, ambos modelos poden executar ferramentas en paralelo, melloran a memoria cando teñen acceso a ficheiros locais e son capaces de crear documentos de apoio que recollen información útil para manter a coherencia a longo prazo. No caso de Opus 4, isto tradúcese na capacidade de crear arquivos de memoria que actúan como guías internas, como demostrou nunha sesión de xogo en Pokémon Red, onde elaborou un Navigation Guide a partir das súas propias experiencias.
Claude 4 tamén incorpora resumos de pensamento que condensan os procesos mentais máis longos utilizando un modelo máis pequeno, aínda que esta función só se activa arredor do 5 % das veces. Para usuarios avanzados interesados en ver o fluxo completo de razoamento, Anthropic ofrece un modo para desenvolvedores que conserva todas as cadeas de pensamento sen resumir.
Xunto cos modelos, tamén se anunciou a dispoñibilidade xeral de Claude Code, a ferramenta para desenvolvedores que agora se integra con IDE como VS Code e JetBrains, permitindo editar directamente os ficheiros. Claude Code tamén pode executarse en segundo plano mediante GitHub Actions e conta cun SDK que facilita a creación de axentes propios baseados no mesmo núcleo. Un exemplo práctico é Claude Code para GitHub, que xa pode responder a comentarios en pull requests, solucionar erros de integración continua ou facer modificacións automáticas do código.