3月7日消息,据媒体报道,OpenAI正在研发一种全新的语音模型,旨在让用户与ChatGPT的对话更加自然流畅。这项技术的核心突破在于,当用户在AI说话过程中打断系统时,AI能够实时调整回应,而不是像现在这样突然停止。
目前ChatGPT的高级语音模式采用的是回合式对话机制,用户必须先说完话,AI才会处理语音并生成回答。如果用户在AI发言时插入"okay"或"mm-hm"等简短回应,系统通常会直接停止,无法像正常对话那样继续推进交流。
为解决这一问题,OpenAI正在开发的BiDi(双向语音模型)能够持续处理说话者的语音输入,因此在被打断时可以立即调整回应。相比之下,现有的语音模型一旦开始生成回答,输出内容就基本固定,无法再根据新的输入进行变化。
这项技术目前仍处于开发阶段。据知情人士透露,原型模型在持续对话几分钟后容易出现故障,有时甚至会发出不自然的声音。OpenAI研究人员原本希望今年第一季度发布BiDi,但目前最新的发布时间可能推迟到第二季度或更晚。
OpenAI认为,如果语音模型能够在性能上接近文本模型,AI的使用范围将进一步扩大,因为大多数人更习惯与AI进行语音交流,而不是输入文字。BiDi模型在客服场景中可能尤其有价值。
例如,当顾客与零售商的AI客服通话时,如果顾客在对话过程中临时决定选择换货而非退货,BiDi模型理论上可以让AI客服顺畅调整对话,而不会突然停止或出现混乱。
知情人士还透露,BiDi模型在调用外部工具和应用方面也更灵活。OpenAI此前表示,公司计划为未来一款主要通过语音交互的AI设备改进语音模型,并考虑开发一款智能音箱,通过语音指令即可查看邮件或预订服务。

3月22日消息,一名男子一年接连撞坏3辆豪车,一度怀疑自己中邪了,结果去医院一检查,被医生发现他的身体出现了问题。
3月22日消息,日前,古装热播剧《逐玉》全集40集片源被大规模泄露,相关话题登上微博热搜,引发网友热议。
3月22日消息,今天,马斯克又扔出了一枚足以震动全球科技版图的核弹。 他联合SpaceX、特斯拉与xAI,在X平台正式官宣TERAFAB项目。这座被称为全球最大2nm先进芯片工厂的超级设施,将落户德州奥斯汀,成为人类算力史上的新里程碑。 和我们熟悉的台积电、I ...
3月22日消息,今日,博主RD观测公布最新数据显示,截至2026年第11周,华为Mate 80系列累计销量已达453.01万台。
3月22日消息,乘坐网约车发生事故,导致乘客受伤,而相应的责任赔偿,是由网约车司机还是平台承担?近日,浙江省海宁市人民法院审结了这样一起典型案例。
3月22日消息,近日,大众CEO:德国车企应向中国学习的话题,登上网络热搜。 据了解,德国大众汽车CEO奥利弗·布鲁姆近日在接受德国媒体采访时表示:德国汽车工业可以向中国严谨的工业规划学习。 报道称,布鲁姆作出该表态之际,这家德国汽车巨头正 ...
3月22日消息,在改变了电动车、商业航天等领域之后,马斯克现在又启动了新的计划——TeraFab芯片工厂,目标是未来生产2倍于美国电力规模的算力芯片。
据推主@Techjunkie Aman消息,软件工程师Moahmed Adel针对PS5的系统固件破解进度已推进至12.00版本。
3月18日消息,国家安全部今日发布《8000米!谁在放飞自我?》文章,其中展示了黑飞无人机和民航客机抢道的案例。
3月18日消息,据媒体报道,湖南长沙一位男子坚持用辣椒喂鱼已有两年时间,每月消耗约10吨辣椒,最多时一天能喂掉1万斤。朝天椒、小米椒等多个品类轮番上阵,成为鱼塘里的特殊饲料。
3月18日消息,近日网络上有传闻称,科大讯飞正在进行大规模裁员。 传言提及科大讯飞拟裁减约1500人,其中技术岗位占比高达70%,甚至有消息称补偿标准仅为0.6n。 对于这些网络传言,科大讯飞官方迅速作出回应,明确表示相关消息并不属实。 科大讯飞公关副 ...
3月18日消息,据报道,近日,宾利汽车交出了一份2025年的财报:连续第七年盈利,营收仅微跌1%,但营业利润暴跌超42%至2.16亿欧元。
3月18日消息,AMD代号Medusa Point的下代Zen 6架构APU工程样品再度现身Geekbench,测试成绩较首次曝光实现近乎翻倍提升。