OpenAI o1起源
OpenAI 在9月12日推出了新的OpenAI o1(OpenAI o1官网入口 https://openai.com/o1/),这是一种新的大型语言模型,经过强化学习训练来执行复杂的推理。
o1 在回答之前会思考——它可以在响应用户之前产生一个很长的内部思维链。就像人类一样,通过培训,它们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。
作为早期模型,它尚不具备 ChatGPT 的许多有用功能,例如浏览网页以获取信息以及上传文件和图像。对于许多常见情况,GPT-4o 在短期内将更加强大。
但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,OpenAI将计数器重置为 1,并将该系列命名为 「OpenAI o1」。
「关于o1、o1-preview、o1-mini的关系」
1、o1-preview是o1的第一个版本,也叫预览版。所以目前而言,在下一个版本更新之前o1-preview就是o1。 2、o1-mini就是o1的更快、更便宜的版本,特别擅长不需要广泛常识知识的编码、数学和科学任务。
OpenAI o1如何使用
使用方式有2种,可以在网页和API使用,具体方式如下:
一、OpenAI o1网页版:
在chatgpt官网https://chatgpt.com登录
「使用限制」:o1-preview 的每周速率限制为 30 条消息,o1-mini 的每周速率限制为 50 条。
二、OpenAI o1-API:
目前,只有符合API 5级资格的开发人员可以使用 API 中的 o1-preview 和 o1-mini 模型,速率限制为 20 RPM。API用户等级如下图:
按照这个标准,大部分人都不符合。那么就无法使用o1的API了吗?当然不是!
我们还可以选择国内的那些较大的ChatGPT中转站的API,他们大都可以拿到资格,之间购买他们的即可。
OpenAI o1模型能力
「能力测试」: o1模型更新在物理、化学和生物学方面具有挑战性的基准任务上的表现与博士生类似。我们还发现它在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13% 的问题,而o1的得分为 83%。OpenAI o1 在竞争性编程问题 (Codeforces) 中排名第 89%,在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列。
「安全测试」: 在最难的越狱安全测试中,GPT-4o 得分为 22(评分范围为 0-100),而o1-preview 模型得分为 84。
「目标群体」: 如果您正在解决科学、编码、数学和类似领域的复杂问题,这些增强的推理能力可能特别有用。例如,医疗保健研究人员可以使用 o1 来注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。
「适用场景」: o1 模型在推理方面提供了显着的进步,但它们并不打算在所有用例中取代 GPT-4o 。对于需要图像输入、函数调用或持续快速响应时间的应用程序,GPT-4o 和 GPT-4o mini模型将仍然是正确的选择。但是,如果您的目标是开发需要深度推理并且可以适应更长响应时间的应用程序,那么 o1 模型可能是一个绝佳的选择。
Azure ChatGPT 16K发布&LangChain实践
前几天,Azure OpenAI gpt-35-turbo 发布了更新。gpt-35-turbo 有两个新版本:GPT-35-turbo(版本 0613)gpt-35-turbo-16k(版本 061...
李政涛|ChatGPT/生成式人工智能对基础教育之“基础”的颠覆与重置
学报本期精彩新刊速递|华东师范大学学报(教育科学版)2023年第7期引论朱永新, 杨帆|ChatGPT/生成式人工智能与教育创新:机遇、挑战以及未来教育治理与教育生态余南平, 张翌然|ChatGPT/...
惊爆!99%的Chatgpt使用者都不知道的三个秘密,今天告诉大家
99%的Chatgpt使用者都不知道的三个秘密,今天告诉大家大家有没发现使用GPT生成的内容永远都很生硬,没有get到正确的点上;内容经常胡编乱造,不能拿来就去使用,还要经过层层修改;内容风格不符合平...
ChatGPT新手秘籍:8个实用技巧助你快速入门
ChatGPT火了这么久,有很多人都开始用它来提升工作与学习的效率,但有很多人还是停留在非常简单,非常表面性的提问,并没有完全发挥ChatGPT的潜力。今天这篇内容,主要给大家分享下ChatGPT入门...
利用GPT4等进行大模型自动打分是否靠谱:3种评价方法、4大缺陷及4大应对方案工作解读
评估基于大型语言模型(LLM)的聊天助手是具有挑战性的,因为它们具有广泛的能力,而现有的基准在衡量人类的偏好方面是不够的。一方面,通过使用MT-bench和Chatbot Arena进行人工排序依赖于...
如何减少人工成本用ChatGPT轻松赚钱?
自从ChatGPT在2022年底出圈之后,ai话题到现在都一直没断过,到1月底的时候,它的全球使用用户就达到了1亿,这是人类有史以来,用户增长速度最快的创新,且才短短半年时间它的版本就已经更新迭代到...