OpenAI pronta a rilasciare dentro ChatGPT un nuovo modello GPT-Bidi-1 rivoluzionario. Ecco cos’è e come funzionerà
Secondo alcune indiscrezioni, OpenAI starebbe pianificando di trasformare ChatGPT in una super-app, con un’importante revisione in programma. La revisione si concentrerebbe sullo strumento di programmazione Codex di OpenAI e sugli strumenti di intelligenza artificiale agentiva in grado di svolgere compiti per gli utenti.
Ma sembra che forse potrebbe esserci di più, dato che è stato individuato anche un nuovo modello audio bidirezionale chiamato “GPT Bidi 1”, che rappresenterebbe un notevole miglioramento delle capacità conversazionali di ChatGPT con il semplice botta e risposta
Si dice che Bidi sia l’abbreviazione di “bidirectional design”, che consente all’assistente di parlare, ascoltare e sentire simultaneamente. La scorsa settimana TestingCatalog ha individuato riferimenti a Bidi 1, con codice interno che lo presenta come un “importante passo avanti nell’intelligenza” e “la prossima generazione di tecnologia vocale”.
Si dice che Bidi 1 si trovi nel selettore delle modalità, sotto le impostazioni, accanto alle opzioni standard e avanzate. Il fumetto diventa giallo quando si seleziona Bidi 1. Secondo un recente rapporto di TestingCatalog, il nuovo modello ha già iniziato a essere distribuito a un sottoinsieme di utenti dell’app ChatGPT, il che suggerisce una possibile pubblicazione questa settimana.
Il modello potrebbe offrire piccoli e naturali segnali di riconoscimento, come un “okay”, quando si fa una pausa o si rallenta, senza interrompervi. Si dice anche che cambi attività al volo come ad esempio, se gli si chiede di contare fino a dieci, lo si interrompe per invertire il conteggio e si adatta immediatamente.
Uno dei cambiamenti più significativi è probabilmente la capacità del modello di mantenere il filo del discorso per tutta la durata della conversazione, anziché interrompere il contesto precedente, un punto debole che ha a lungo afflitto l’attuale sistema di sintesi vocale di ChatGPT. Inoltre, non interrompe più la conversazione durante le pause prolungate.
Il rapporto evidenzia inoltre che il rilascio di Bidi 1 può essere visto come un modo per OpenAI di colmare il divario tra i suoi potenti modelli di testo e il suo livello vocale più datato. Questo è importante perché OpenAI scommette che il parlato sarà il principale mezzo con cui la maggior parte delle persone accederà all’intelligenza artificiale, piuttosto che il testo.










































Lascia un commento
Visualizza commenti