OpenAI o1起源
OpenAI 在9月12日推出了新的OpenAI o1(OpenAI o1官网入口 https://openai.com/o1/),这是一种新的大型语言模型,经过强化学习训练来执行复杂的推理。
o1 在回答之前会思考——它可以在响应用户之前产生一个很长的内部思维链。就像人类一样,通过培训,它们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。
作为早期模型,它尚不具备 ChatGPT 的许多有用功能,例如浏览网页以获取信息以及上传文件和图像。对于许多常见情况,GPT-4o 在短期内将更加强大。
但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,OpenAI将计数器重置为 1,并将该系列命名为 「OpenAI o1」。
「关于o1、o1-preview、o1-mini的关系」
1、o1-preview是o1的第一个版本,也叫预览版。所以目前而言,在下一个版本更新之前o1-preview就是o1。 2、o1-mini就是o1的更快、更便宜的版本,特别擅长不需要广泛常识知识的编码、数学和科学任务。
OpenAI o1如何使用
使用方式有2种,可以在网页和API使用,具体方式如下:
一、OpenAI o1网页版:
在chatgpt官网https://chatgpt.com登录
「使用限制」:o1-preview 的每周速率限制为 30 条消息,o1-mini 的每周速率限制为 50 条。
二、OpenAI o1-API:
目前,只有符合API 5级资格的开发人员可以使用 API 中的 o1-preview 和 o1-mini 模型,速率限制为 20 RPM。API用户等级如下图:
按照这个标准,大部分人都不符合。那么就无法使用o1的API了吗?当然不是!
我们还可以选择国内的那些较大的ChatGPT中转站的API,他们大都可以拿到资格,之间购买他们的即可。
OpenAI o1模型能力
「能力测试」: o1模型更新在物理、化学和生物学方面具有挑战性的基准任务上的表现与博士生类似。我们还发现它在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13% 的问题,而o1的得分为 83%。OpenAI o1 在竞争性编程问题 (Codeforces) 中排名第 89%,在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列。
「安全测试」: 在最难的越狱安全测试中,GPT-4o 得分为 22(评分范围为 0-100),而o1-preview 模型得分为 84。
「目标群体」: 如果您正在解决科学、编码、数学和类似领域的复杂问题,这些增强的推理能力可能特别有用。例如,医疗保健研究人员可以使用 o1 来注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。
「适用场景」: o1 模型在推理方面提供了显着的进步,但它们并不打算在所有用例中取代 GPT-4o 。对于需要图像输入、函数调用或持续快速响应时间的应用程序,GPT-4o 和 GPT-4o mini模型将仍然是正确的选择。但是,如果您的目标是开发需要深度推理并且可以适应更长响应时间的应用程序,那么 o1 模型可能是一个绝佳的选择。
OpenAI的王炸: OpenAI o1 到底是何方神圣?
自从上半年OpenAI发布Sora演示视频惊艳了全世界后,后面虽然都没有发布什么颠覆性的产品,一直不温不火,OpenAI 的乏力似乎是肉眼可见。Sora 的无限期跳票,GPT4o 的演示效果也没有被很...
低于预期--OpenAI o1
经过上次Sam预告后2024年9月12 OpenAI推出 OpenAI o1系列模型https://openai.com/index/introducing-openai-o1-preview/htt...
最简单的方式让你看明白OpenAI的o1模型是什么
今天OpenAI 突然发布了 OpenAI o1 系列的2个模型,o1 在推理能力上代表了人工智能最强的水平。在国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o只正确解决了13%的问题,而这个...
AI新突破:“慢就是快”,OpenAI的o1模型懂思考了,我们该怎么办?
这一年多来,从只是听说,到去试用各种AI工具,我看到AI的爆发和巨变。而就在我们刚刚适应了GPT-4的节奏,OpenAI又给我们扔了一颗重磅炸弹。AI大咖们从一大早就发了各种帖子和视频,那我就用通俗的...
OpenAI偷偷释出GPT4.5?文末附体验网址!是营销还是真有硬货?
其实只有一个问题,GPT2还是GPT-2?就在今天,一个模型的悄然上线引起了AI社区的轩然大波。它就是在LMSYS Chatbot Arena中悄然发布的Gpt2-chatbot:可能大伙也有疑问,现...
神秘大模型火速“刷屏”,网友竞猜GPT-4.5要来了,奥特曼神秘莫测地只说了一句话!
整理 | 苏宓出品 | CSDN(ID:CSDNnews)强大的东西往往都是以最朴实无华的形式出现。在没有官宣、没有炒作的氛围中,昨夜,一款名为“gpt2-chatbot”的模型杀出重围,在 AI 社...