Claude 3 di Anthropic è davvero migliore di ChatGPT? -

Nel mondo dell’intelligenza artificiale, la competizione per creare il modello più avanzato continua. La startup Anthropic ha da poco lanciato Claude 3, un modello di intelligenza artificiale che non è solo un passo avanti rispetto ai suoi predecessori come Claude 2, ma vuole anche superare ChatGPT di OpenAI. Secondo l’amministratore delegato, Dario Amodei, Claude 3 è la “Rolls-Royce” dei modelli IA, almeno in questo momento. Vediamo subito cosa è in grado di fare Claude 3 e cerchiamo di capire se è effettivamente migliore di ChatGPT.

Cosa fa Claude 3?

Claude 3 è una famiglia di modelli che comprende in ordine crescente di capacità Haiku, Sonnet e Opus. Ogni modello successivo offre prestazioni sempre più potenti. Opus e Sonnet sono già disponibili per l’uso in claude.ai e nell’API Claude che è disponibile in 159 paesi. Haiku sarà presto disponibile.

I modelli Claude 3 possono supportare chat dal vivo con gli utenti, completamenti automatici e attività di estrazione dati in cui le risposte devono essere immediate e in tempo reale. Possono elaborare un’ampia gamma di formati visivi, tra cui foto, diagrammi e grafici.

Opus

Opus è il modello più intelligente, con le migliori prestazioni del mercato su compiti altamente complessi. Può navigare in suggerimenti aperti e scenari invisibili con notevole fluidità e comprensione umana e analizzare diagrammi, grafici, dati finanziari e tendenze di mercato facendo previsioni. I potenziali usi sono la pianificazione ed esecuzione di azioni complesse su API e database, la codifica interattiva, la revisione della ricerca, il brainstorming e la generazione di ipotesi.

Sonnet

Sonnet raggiunge l’equilibrio ideale tra intelligenza e velocità, in particolare per i carichi di lavoro aziendali. Offre prestazioni elevate a un costo inferiore rispetto ai suoi concorrenti ed è progettato per un’elevata resistenza nelle implementazioni di intelligenza artificiale su larga scala. Può essere usato per elaborare i dati, consigli sui prodotti o marketing mirato, generare codice, controllo di qualità, analisi del testo dalle immagini.

Haiku

Haiku risponde a domande e richieste semplici con una velocità senza pari. Sarà utilizzato per interagire con i clienti fornendo supporto rapido e accurato. Rileverà comportamenti rischiosi o richieste dei clienti e si occuperà della gestione dell’inventario e dell’estrazione della conoscenza da dati non strutturati.

Claude 3 è sicuramente migliore delle sue versioni precedenti

Haiku è il modello più veloce ed economico sul mercato per la sua categoria di intelligence. Può leggere un documento di ricerca denso di informazioni e dati su arXiv con diagrammi e grafici in meno di tre secondi.

Per la stragrande maggioranza dei carichi di lavoro, Sonnet è 2 volte più veloce di Claude 2 e Claude 2.1. Opus offre velocità simili a Claude 2 e 2.1, ma con livelli di intelligenza molto più elevati.

I precedenti modelli di Claude si rifiutavano spesso di rispondere. Ciò suggeriva una mancanza di comprensione contestuale. Opus, Sonnet e Haiku hanno molte meno probabilità di rifiutarsi di rispondere. Come mostrato di seguito, i modelli Claude 3 mostrano una comprensione più sfumata delle richieste, riconoscono il danno reale e si rifiutano di rispondere a richieste innocue molto meno spesso.

Per valutare la precisione degli output dei modelli Claude 3, Anthropic ha utilizzato un’ampia serie di domande complesse e basate sui fatti che prendono di mira le debolezze note dei modelli attuali, classificando le risposte in “corrette”,”errate” e “incerte” (quando il modello afferma di non conoscere la risposta). Rispetto a Claude 2.1, Opus dimostra un duplice miglioramento nell’accuratezza sulle domande a risposta aperta e anche livelli ridotti di risposte errate.

Claude 3 è meglio di ChatGPT?

Il modello più potente, Opus, supera i suoi concorrenti nella maggior parte dei benchmark di valutazione comuni per i sistemi di intelligenza artificiale.

Claude 3 migliore ChatGPT — *Confronto tra i modelli Claude 3 e i suoi rivali (GPT e Gemini) su più benchmark di capacità. Fonte: Anthropic*

Claude 3 si distingue per la sua capacità di interpretare non solo il testo, ma anche le immagini. Questa caratteristica lo rende particolarmente adatto all’analisi di dati complessi. I nuovi modelli di Anthropic non solo migliorano le prestazioni, ma puntano anche a una maggiore accessibilità.

Tirando le somme, Claude 3 rappresenta un passo avanti nel campo dell’intelligenza artificiale. Con le sue capacità multimodali e le prestazioni migliorate, diventerà un serio concorrente di ChatGPT.