要實現(xiàn)電話通話,至少需要以下幾個關鍵能力:語音識別;語音合成;3、實時交互;這些技術OpenAI都有了,現(xiàn)在就看最終的產品了。
OpenAI 似乎正在努力在 chatGPT 中實現(xiàn)電話通話。這可能是周一宣布的活動的一小部分,這一點從OpenAI網站一些后臺代碼就可以發(fā)現(xiàn)

現(xiàn)在,OpenAI 也已配備了 webRTC 服務器來實現(xiàn)這一目標,這些服務器最近也進行了配置

起初大家以為webrtc被用于他們的純語音模式,但事實證明那是由Livekit完成的

早就2月份,OpenAI前開發(fā)者關系負責人就提及,ChatGPT的終極形態(tài)不是聊天,看起來和現(xiàn)在的信息對應上了

要實現(xiàn)電話通話,至少需要以下幾個關鍵能力:
1、語音識別 - 將語音信號轉換為文本
2、語音合成 - 將文本轉換為自然語音輸出
3、實時交互 - 能夠在通話過程中實時處理對方的語音輸入并作出響應
這些技術OpenAI都有了,現(xiàn)在就看最終的產品了
OpenAI語音技術負責人也轉發(fā)了周一發(fā)布會的推文
