ChatGPT è pronta a rilasciare un nuovo modello vocale Bidi 1 in grado di ascoltare e parlare simultaneamente

OpenAI pronta a rilasciare dentro ChatGPT un nuovo modello GPT-Bidi-1 rivoluzionario. Ecco cos’è e come funzionerà

Secondo alcune indiscrezioni, OpenAI starebbe pianificando di trasformare ChatGPT in una super-app, con un’importante revisione in programma. La revisione si concentrerebbe sullo strumento di programmazione Codex di OpenAI e sugli strumenti di intelligenza artificiale agentiva in grado di svolgere compiti per gli utenti.

Ma sembra che forse potrebbe esserci di più, dato che è stato individuato anche un nuovo modello audio bidirezionale chiamato “GPT Bidi 1”, che rappresenterebbe un notevole miglioramento delle capacità conversazionali di ChatGPT con il semplice botta e risposta

Si dice che Bidi sia l’abbreviazione di “bidirectional design”, che consente all’assistente di parlare, ascoltare e sentire simultaneamente. La scorsa settimana TestingCatalog ha individuato riferimenti a Bidi 1, con codice interno che lo presenta come un “importante passo avanti nell’intelligenza” e “la prossima generazione di tecnologia vocale”.

Si dice che Bidi 1 si trovi nel selettore delle modalità, sotto le impostazioni, accanto alle opzioni standard e avanzate. Il fumetto diventa giallo quando si seleziona Bidi 1. Secondo un recente rapporto di TestingCatalog, il nuovo modello ha già iniziato a essere distribuito a un sottoinsieme di utenti dell’app ChatGPT, il che suggerisce una possibile pubblicazione questa settimana.

Il modello potrebbe offrire piccoli e naturali segnali di riconoscimento, come un “okay”, quando si fa una pausa o si rallenta, senza interrompervi. Si dice anche che cambi attività al volo come ad esempio, se gli si chiede di contare fino a dieci, lo si interrompe per invertire il conteggio e si adatta immediatamente.

Uno dei cambiamenti più significativi è probabilmente la capacità del modello di mantenere il filo del discorso per tutta la durata della conversazione, anziché interrompere il contesto precedente, un punto debole che ha a lungo afflitto l’attuale sistema di sintesi vocale di ChatGPT. Inoltre, non interrompe più la conversazione durante le pause prolungate.

Il rapporto evidenzia inoltre che il rilascio di Bidi 1 può essere visto come un modo per OpenAI di colmare il divario tra i suoi potenti modelli di testo e il suo livello vocale più datato. Questo è importante perché OpenAI scommette che il parlato sarà il principale mezzo con cui la maggior parte delle persone accederà all’intelligenza artificiale, piuttosto che il testo.

Sono appassionato di tecnologia sin dalla tenera età, coltivo la mia passione con aggiornamenti quotidiani e non mi lascio scappare proprio nulla. Ho creato HowTechIsMade per condividere con voi le mie passioni ed aiutarvi ad avere un approccio più semplice con la tecnologia.
Exit mobile version