A minha experiência atual com agentes:
GPT-5: código complexo, direcionar para fazer menos leitura para não poluir o contexto
Opus 4.1: Desenvolvimento rápido em código menos complexo
GLM 4.5: Muito semelhante ao Sonnet 4.0, mas mais rápido; preferido se o Opus 4.1 acabar
Kimi K2: muito autónomo, perfeito para TDD simples