OpenAI o1起源
OpenAI 在9月12日推出了新的OpenAI o1(OpenAI o1官网入口 https://openai.com/o1/),这是一种新的大型语言模型,经过强化学习训练来执行复杂的推理。
o1 在回答之前会思考——它可以在响应用户之前产生一个很长的内部思维链。就像人类一样,通过培训,它们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。
作为早期模型,它尚不具备 ChatGPT 的许多有用功能,例如浏览网页以获取信息以及上传文件和图像。对于许多常见情况,GPT-4o 在短期内将更加强大。
但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,OpenAI将计数器重置为 1,并将该系列命名为 「OpenAI o1」。
「关于o1、o1-preview、o1-mini的关系」
1、o1-preview是o1的第一个版本,也叫预览版。所以目前而言,在下一个版本更新之前o1-preview就是o1。 2、o1-mini就是o1的更快、更便宜的版本,特别擅长不需要广泛常识知识的编码、数学和科学任务。
OpenAI o1如何使用
使用方式有2种,可以在网页和API使用,具体方式如下:
一、OpenAI o1网页版:
在chatgpt官网https://chatgpt.com登录
「使用限制」:o1-preview 的每周速率限制为 30 条消息,o1-mini 的每周速率限制为 50 条。
二、OpenAI o1-API:
目前,只有符合API 5级资格的开发人员可以使用 API 中的 o1-preview 和 o1-mini 模型,速率限制为 20 RPM。API用户等级如下图:
按照这个标准,大部分人都不符合。那么就无法使用o1的API了吗?当然不是!
我们还可以选择国内的那些较大的ChatGPT中转站的API,他们大都可以拿到资格,之间购买他们的即可。
OpenAI o1模型能力
「能力测试」: o1模型更新在物理、化学和生物学方面具有挑战性的基准任务上的表现与博士生类似。我们还发现它在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13% 的问题,而o1的得分为 83%。OpenAI o1 在竞争性编程问题 (Codeforces) 中排名第 89%,在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列。
「安全测试」: 在最难的越狱安全测试中,GPT-4o 得分为 22(评分范围为 0-100),而o1-preview 模型得分为 84。
「目标群体」: 如果您正在解决科学、编码、数学和类似领域的复杂问题,这些增强的推理能力可能特别有用。例如,医疗保健研究人员可以使用 o1 来注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。
「适用场景」: o1 模型在推理方面提供了显着的进步,但它们并不打算在所有用例中取代 GPT-4o 。对于需要图像输入、函数调用或持续快速响应时间的应用程序,GPT-4o 和 GPT-4o mini模型将仍然是正确的选择。但是,如果您的目标是开发需要深度推理并且可以适应更长响应时间的应用程序,那么 o1 模型可能是一个绝佳的选择。
英伟达用ChatGPT-4训练机器人,代码水平超过人类专家
英伟达(NVIDIA)基于OpenAI的GPT-4打造Eureka,可自动训练实体机器人的动作指令,例如,转笔、开抽屉、使用剪刀等超复杂动作。具备零样本生成、编写代码和语境改进等能力,可对强化学习的奖...
祝贺|Plos Digital Health刊发ChatGPT-4通过中国执业医师考试
以ChatGPT为代表的大语言模型人工智能AI在医疗领域的应用备受关注。大语言模型的性能表现依赖于其训练数据集,英语由于其通用性,在全世界广泛使用,因此,ChatGPT在英语语境下解决问题的能力表现出...
ChatGPT-4 Vision 催生万亿产业
(做了多年视觉分析,谨以忐忑的心情写下本文)2023年9月25日,微软发布ChatGPT-Vision的研究报告(文章末尾有下载地址),同日openai发布重要更新:听,说,看。2023年10月3日,...
详解ChatGPT的视觉能力
OpenAI终于宣布要在ChatGPT上接入视觉功能了。跳票了大半年的图像功能终于是要上了。本来在今年的3月末的时候,OpenAI就演示了GPT4在多模态上的非凡能力。它能够根据你输入的图片进行有效的...
国内版ChatGPT使用攻略
一、 什么是ChatGPT?ChatGPT是指将ChatGPT模型和相关资源复制到另一个可访问的服务器。这种方法有助于解决访问ChatGPT的问题,特别是在网络环境不可靠或存在其他访问限制的情况下。简...
一文读懂ChatGPT中的强化学习
作者:陈之炎本文约2400字,建议阅读8分钟本文介绍了ChatGPT中的强化学习。ChatGPT基于OpenAI的GPT-3.5创造,是InstructGPT的衍生产品,它引入了一种新的方法,将人类反...