Esce Opus 4.8, un modello più onesto quando sbaglia

Esce Opus 4.8, un modello più onesto quando sbaglia
Articolo Precedente

precedente
Articolo Successivo

successivo
tomshw.it ECONOMIA

Anthropic ha rilasciato Claude Opus 4.8 il 28 maggio 2026, un aggiornamento incrementale del modello di punta che migliora sui benchmark in modo modesto ma misurabile e introduce un cambiamento meno appariscente ma più rilevante per chi lo usa in azienda: il modello dichiara apertamente quando non sa qualcosa, invece di produrre risposte sicure su basi inesistenti. Il salto sui benchmark di programmazione resta il dato che farà i titoli, con SWE-bench Verified che passa da 87,6 a 88,6 per cento e SWE-bench Pro che sale dal 64,3 al 69,2 per cento. (tomshw.it)