Esce Opus 4.8, un modello più onesto quando sbaglia
Articolo Precedente
Articolo Successivo
Approfondimenti:
Anthropic ha rilasciato Claude Opus 4.8 il 28 maggio 2026, un aggiornamento incrementale del modello di punta che migliora sui benchmark in modo modesto ma misurabile e introduce un cambiamento meno appariscente ma più rilevante per chi lo usa in azienda: il modello dichiara apertamente quando non sa qualcosa, invece di produrre risposte sicure su basi inesistenti. Il salto sui benchmark di programmazione resta il dato che farà i titoli, con SWE-bench Verified che passa da 87,6 a 88,6 per cento e SWE-bench Pro che sale dal 64,3 al 69,2 per cento. (tomshw.it)




