资讯

ChatGPT的最新功能更新:图像和声音交互

OpenAI最近对ChatGPT引入了一系列创新的图像和声音交互功能,为用户提供更直观的交流方式。这些新功能使用户能够通过语音与ChatGPT进行对话,或者通过图片与之互动,从而使得交流更加多样化和富有吸引力。 具体来说,用户现在可以在移动设备上通过设置启用新的语音交互功能,并选择五种不同的语音中的一种进行对话。这项技术利用了新的文本到语音模型,能够从简短的语音样本中生成类似人类的语音。同时,这项功能还整合了Whisper语音识别系统,可以将用户的语音输入转换为文本。 此外,ChatGPT的图像功能允许用户上传图片,通过绘图工具指定关注图片的特定部分,以便更精准地解析和响应。这些图像功能是基于多模态GPT-3.5和GPT-4模型,这些模型可以将它们的语言推理能力应用于各种图片,如照片、截屏和含文本的文档。 这些新功能目前正逐步向Plus和Enterprise用户推出,并计划在未来几周内向其他用户群体开放。通过这种渐进式的部署策略,OpenAI旨在在提升功能的同时,优化风险缓解措施,确保技术的安全性和效益。 总的来说,这些更新显著扩展了ChatGPT的应用场景,使其不仅限于文字交流,而是成为一个更全面的交互助手。这些变革有望进一步推动人工智能技术的普及和应用。