Esce Opus 4.8, un modello più onesto quando sbaglia

Approfondimenti:

1 maggio Morti sul lavoro Intelligenza artificiale Era Trump 2.0 Mondiali di calcio 2026

29/05/2026

ECONOMIA

Anthropic ha rilasciato Claude Opus 4.8 il 28 maggio 2026, un aggiornamento incrementale del modello di punta che migliora sui benchmark in modo modesto ma misurabile e introduce un cambiamento meno appariscente ma più rilevante per chi lo usa in azienda: il modello dichiara apertamente quando non sa qualcosa, invece di produrre risposte sicure su basi inesistenti. Il salto sui benchmark di programmazione resta il dato che farà i titoli, con SWE-bench Verified che passa da 87,6 a 88,6 per cento e SWE-bench Pro che sale dal 64,3 al 69,2 per cento. (tomshw.it)

Condividi | Mia Informazione | Note

Articolo Precedente

Articolo Successivo