L’offerta di Sonnet 5 punta a democratizzare l’autonomia operativa dei modelli

A febbraio 2026, con il rilascio di Sonnet 4.6, Anthropic aveva già dimostrato di saper mantenere un ciclo di aggiornamento serrato, nell’ordine dei quattro mesi. Quel modello era un solido esecutore, capace di tenere testa alla concorrenza. Ma nei giorni scorsi, con l’arrivo di Claude Sonnet 5, l’azienda ha spostato il baricentro del discorso: non più solo potenza bruta, ma un’agenticità quasi completa — la capacità di agire in autonomia, formulare piani, usare strumenti — offerta a un prezzo che fino a ieri era roba da modelli di fascia intermedia. Il comunicato ufficiale sintetizza la rotta con precisione: Sonnet 5 è costruito per essere il modello Sonnet più agentico mai realizzato, in grado di colmare il divario con il fratello maggiore Opus 4.8, ma a tariffe inferiori.

L’agenticità alla portata di tutti

Quando si parla di modelli “agentici” ci si riferisce a sistemi che non si limitano a rispondere a un prompt, ma che possono orchestrare sequenze di azioni: aprire un browser, interrogare un terminale, correggere il proprio output, iterare su un piano fino a raggiungere un obiettivo. Fino a pochi mesi fa, questo livello di autonomia era riservato ai modelli top di gamma, quelli che sulle API venivano fatturati a peso d’oro. Sonnet 5 riscrive questa gerarchia. Anthropic dichiara che il nuovo modello può eseguire piani, utilizzare strumenti come browser e terminali, e funzionare autonomamente a un livello che, solo pochi mesi fa, richiedeva modelli più grandi e costosi. È un miglioramento sostanziale rispetto a Sonnet 4.6 su tutti i fronti che contano per un agente software: ragionamento, uso di tool, coding, lavoro conoscitivo. E le prestazioni assolute, stando ai dati forniti dall’azienda, si avvicinano ormai a quelle di Opus 4.8, il modello di punta della famiglia Claude.

La vera novità, però, non sta solo nel salto tecnico. Sta nel posizionamento economico. Anthropic sta dicendo al mercato che l’agenticità avanzata non è più un lusso per pochi, ma una capacità che si può mettere a budget senza far saltare il conto mensile delle API. È un passaggio che scardina le aspettative e prepara il terreno per uno scontro che non sarà più sulla potenza assoluta, ma sul rapporto tra costo e autonomia operativa.

La corsa al prezzo: chi vince e chi perde

Mentre la scorsa settimana OpenAI presentava GPT-5.6 Sol in anteprima, il confronto si è spostato inevitabilmente sul listino. GPT-5.6 Sol, il cui rilascio è stato oggetto di restrizioni su richiesta governativa, arriva sul mercato con un pricing che fa riflettere: 5 dollari per milione di token in input e 30 dollari per milione di token in output. Numeri che vanno confrontati con i 2 dollari in input e i 10 in output del prezzo introduttivo di Sonnet 5. La differenza è netta, soprattutto sul lato output, dove il rapporto è di sei a uno: per ogni milione di token generati, GPT-5.6 Sol costa il triplo del modello Anthropic, e incide in modo pesante sui carichi di lavoro agentici, che per loro natura producono flussi di token molto più lunghi di una semplice risposta testuale.

E poi c’è Google, che a maggio ha lanciato Gemini 3.5 Flash, la sua risposta sul fronte dell’efficienza. Il mercato si sta rapidamente polarizzando: da una parte i modelli mammut, con capacità di reasoning estremo e costi elevati, dall’altra una nuova generazione di modelli “agili” che puntano a offrire l’80-90% delle prestazioni a una frazione del prezzo. Anthropic stessa riconosce che il mercato si sta spostando da una corsa alle capacità a una corsa al rapporto prezzo/prestazioni. È un mutamento strutturale: non si compete più solo sui benchmark, ma sul costo per task completato, sul prezzo per agente autonomo messo in produzione, sul ritorno operativo di ogni dollaro speso in API.

Per chi sviluppa, la conseguenza è immediata. La domanda non è più “qual è il modello più potente in assoluto”, ma “qual è il modello che mi dà abbastanza autonomia per il mio caso d’uso, al minor costo possibile”. E in questo calcolo, il divario di prezzo tra Sonnet 5 e GPT-5.6 Sol sposta l’ago della bilancia in modo deciso.

Sviluppatori, il trade-off è servito

Con i prezzi di GPT-5.6 Sol che in output sono fino a sei volte superiori rispetto alle tariffe di lancio di Sonnet 5, ogni decisione di architettura diventa anche una decisione di budget. Se state costruendo un agente che deve navigare decine di pagine web, riassumere documenti, iterare su una pipeline di tool, la scelta del modello determina moltiplicatori di costo che rendono insostenibile l’uso dei top di gamma per workload estesi. Sonnet 5 offre un punto di equilibrio inedito: una capacità agentica che sfiora quella di Opus 4.8, a un prezzo che lo colloca nella fascia medio-alta ma ancora gestibile per deployment su scala.

Certo, i carichi estremi — quelli che richiedono catene di ragionamento lunghissime o una precisione assoluta in contesti critici — potrebbero ancora giustificare l’investimento nei modelli più grandi. Ma per la maggior parte dei task agentici, il nuovo Sonnet ridefinisce il rapporto costo-efficacia. Il mercato non premierà più soltanto la potenza: premierà l’equilibrio tra costo e autonomia. E la vera sfida, per chi progetta sistemi, sarà ottimizzare per l’efficienza, non per la potenza assoluta.