← El Pisuika Buscar · Todos los temas
Tema

SWE-bench

2 notas publicadas en El Pisuika sobre este tema.

Claude Fable 5 se restaura y registra 80.3% en SWE-bench Pro tras el levantamiento de controles de exportación

Codificación asistida · Anthropic

Fable 5 marca 80,3% en SWE-bench Pro: 22 puntos sobre GPT-5.5 y 26 sobre Gemini 3.1 Pro

Benchmarks · Modelos frontier