OpenAI ChatGPT Bot 可供您测试

导读 OpenAI ChatGPT 是一个聊天机器人,可以帮助您编写代码、诗歌,或者告诉您如何装饰新房。虽然它确实有局限性,但它似乎非常擅长进行对话

OpenAI ChatGPT 是一个聊天机器人,可以帮助您编写代码、诗歌,或者告诉您如何装饰新房。虽然它确实有局限性,但它似乎非常擅长进行对话、参与哲学讨论等等。

OpenAI是一家人工智能研究和部署公司,其使命是确保通用人工智能造福全人类。它的DALL-E-2是一个人工智能系统,可以通过自然语言的简单描述来创建逼真的图像和艺术。现在,该公司发布了 ChatGPT,这是一个以对话方式进行交互的聊天机器人。

用于训练 ChatGPT 的方法包括使用人类反馈强化学习 (RLHF)。该团队使用监督微调训练了一个初始模型,其中人类 AI 培训师扮演了对话的双方。培训师可以访问模型编写的建议,以帮助他们撰写回复。

接下来,该团队创建了强化学习的奖励模型。这是通过收集比较数据来实现的,比较数据由两个或多个按质量排序的模型响应组成。数据是通过 AI 培训师与聊天机器人的对话收集的。通过使用奖励模型,他们能够使用近端策略优化来微调模型。