GPT-4o vuole prendere il posto di Eminem! Scopri Tutti i Talenti di ...
Redazione RHC : 30 Novembre 2024 09:17
OpenAI ha rilasciato un aggiornamento al modello linguistico ChatGPT-4o introdotto a maggio 2024. Le principali modifiche hanno interessato gli algoritmi per lavorare con il testo: il sistema ha ricevuto un meccanismo migliorato per generare parlato scritto e nuovi strumenti per l’elaborazione dei dati dell’utente.
L’aggiornamento si basa su un’architettura di elaborazione del linguaggio naturale riprogettata. Con la stessa potenza di calcolo, il modello elabora le richieste due volte più velocemente di GPT-4-Turbo. Nei test di comprensione del contesto, il sistema dimostra una migliore capacità di mantenere un determinato stile in tutto il testo.
Gli utenti sono stati i primi a notare i cambiamenti nel lavorare con i testi letterari. Uno di loro ha testato il modello in un modo insolito: gli ha chiesto di scrivere un rap in stile Eminem sulla meccanica quantistica. ChatGPT-4o ha riprodotto tutto nei minimi dettagli, anche la tecnica delle rime interne caratteristica dell’artista, che nessun modello linguistico era stato in grado di realizzare in precedenza.
Anche le possibilità di lavorare con i file sono state ampliate. Durante il caricamento dei fogli di calcolo, il sistema ora analizza non solo i dati stessi, ma anche le relazioni tra loro, le formule e la formattazione condizionale. Lavorando con le immagini, il modello riconosce i dettagli su diversi piani e può descriverne la posizione relativa.
Gli ingegneri di OpenAI hanno anche implementato un nuovo modulo di riconoscimento vocale. La modalità vocale avanzata analizza il flusso audio in tempo reale, consentendo di utilizzare il modello per la traduzione simultanea. L’intelligenza artificiale distingue il 95% delle parole nei discorsi fortemente accentati ed è in grado di elaborare 17 lingue senza perdita di qualità.
La capacità del modello di analizzare i modelli di intonazione merita un’attenzione speciale. ChatGPT-4o identifica i marcatori dello stato emotivo nel parlato: tempo, pause, cambiamenti di tono. Sulla base di essi, il sistema adatta lo stile delle risposte, adattandosi alla natura del dialogo.
Parallelamente alla versione principale, gli sviluppatori hanno rilasciato GPT-4o-mini, una modifica leggera con un’enfasi sulla velocità di risposta. Nei test di ragionamento MMLU, ha ottenuto un punteggio dell’82%, battendo Gemini 1.5 Flash del 3% e Claude 3 Haiku del 7%. La versione mini è particolarmente efficace nelle attività di generazione del codice grazie al carico ridotto del processore.
Durante il test, GPT-4o-mini ha mostrato un’elevata velocità nel lavorare con i linguaggi di programmazione più diffusi. Il modello genera codice funzionante in Python, JavaScript e Java in una frazione di secondo, tenendo conto del contesto del progetto e delle sue convenzioni di progettazione.
L’accesso alle nuove funzionalità è distribuito tra i livelli di abbonamento. Gli utenti della versione gratuita ricevono un numero limitato di richieste a GPT-4o, dopodiché il sistema passa alla versione mini. I proprietari di Plus, Teams ed Enterprise hanno accesso a un limite esteso, fino a cinque volte il limite di base.
E la base del progresso è l’ottimizzazione dei processi informatici. GPT-4o utilizza un nuovo metodo di elaborazione dei token, che riduce della metà il carico sui server mantenendo la qualità delle risposte. Ciò è particolarmente evidente quando si lavora con testi lunghi e query analitiche complesse.
RedazioneLa redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.