OpenAI o1起源
OpenAI 在9月12日推出了新的OpenAI o1(OpenAI o1官网入口 https://openai.com/o1/),这是一种新的大型语言模型,经过强化学习训练来执行复杂的推理。
o1 在回答之前会思考——它可以在响应用户之前产生一个很长的内部思维链。就像人类一样,通过培训,它们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。
作为早期模型,它尚不具备 ChatGPT 的许多有用功能,例如浏览网页以获取信息以及上传文件和图像。对于许多常见情况,GPT-4o 在短期内将更加强大。
但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,OpenAI将计数器重置为 1,并将该系列命名为 「OpenAI o1」。
「关于o1、o1-preview、o1-mini的关系」
1、o1-preview是o1的第一个版本,也叫预览版。所以目前而言,在下一个版本更新之前o1-preview就是o1。 2、o1-mini就是o1的更快、更便宜的版本,特别擅长不需要广泛常识知识的编码、数学和科学任务。
OpenAI o1如何使用
使用方式有2种,可以在网页和API使用,具体方式如下:
一、OpenAI o1网页版:
在chatgpt官网https://chatgpt.com登录
「使用限制」:o1-preview 的每周速率限制为 30 条消息,o1-mini 的每周速率限制为 50 条。
二、OpenAI o1-API:
目前,只有符合API 5级资格的开发人员可以使用 API 中的 o1-preview 和 o1-mini 模型,速率限制为 20 RPM。API用户等级如下图:
按照这个标准,大部分人都不符合。那么就无法使用o1的API了吗?当然不是!
我们还可以选择国内的那些较大的ChatGPT中转站的API,他们大都可以拿到资格,之间购买他们的即可。
OpenAI o1模型能力
「能力测试」: o1模型更新在物理、化学和生物学方面具有挑战性的基准任务上的表现与博士生类似。我们还发现它在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13% 的问题,而o1的得分为 83%。OpenAI o1 在竞争性编程问题 (Codeforces) 中排名第 89%,在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列。
「安全测试」: 在最难的越狱安全测试中,GPT-4o 得分为 22(评分范围为 0-100),而o1-preview 模型得分为 84。
「目标群体」: 如果您正在解决科学、编码、数学和类似领域的复杂问题,这些增强的推理能力可能特别有用。例如,医疗保健研究人员可以使用 o1 来注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。
「适用场景」: o1 模型在推理方面提供了显着的进步,但它们并不打算在所有用例中取代 GPT-4o 。对于需要图像输入、函数调用或持续快速响应时间的应用程序,GPT-4o 和 GPT-4o mini模型将仍然是正确的选择。但是,如果您的目标是开发需要深度推理并且可以适应更长响应时间的应用程序,那么 o1 模型可能是一个绝佳的选择。
基于ChatGPT的视频智能摘要实战
向AI转型的程序员都关注了这个号👇👇👇随着在 YouTube 上提交的大量新视频,很容易感到挑战并努力跟上我想看的一切。我可以与我每天将视频添加到“稍后观看”列表中的经历联系起来,只是为了让列表变得越...
ChatGPT调教指南-咒语指南-提示词工程
感谢很多朋友和同事的关注,很多人做了体验,也有朋友还不太会用的,就像上次所讲的‘GPT是个威力无比强大的AI,但是绝大多数人根本没有让它充分发挥。把ChatGPT当做一个聊天机器人随便玩玩,既对不起你...
超越ChatGPT — 机器学习如何提高增材制造的生产力
ChatGPT充分发挥了人工智能 (AI) 的优势。在短短两个月内,它就达到了 1 亿用户。在网上和媒体上,公众正在分享使用聊天机器人自动化工作、检查代码和创建内容大纲的示例。它还引发了大量提供人工智...
AI孙燕姿,ChatGPT,AI绘图...这节课通过探究“人工智能”学习“概念的概述”
设计思路2023年,随着ChatGPT在全球范围内强势“出圈”,人工智能领域再一次受到全世界的关注。“特朗普被捕”AI生成图片热传,要不是别人提醒这是AI合成图,普通人仅凭肉眼难以辨别真假。“特朗普被...
GPT-4能否取代数据分析师?达摩院的初步实验为你解答~
深度学习自然语言处理原创作者 | 刘嘉玲最近,数据分析师圈子大家在讨论GPT-4对他们的工作有什么影响:是替代还是辅助?个人认为GPT-4可以帮助我提高工作效率和质量。要成为一名高级的数据分析师,需...
GPT结合行业变革,起点在云鹰汇
2023年5月26日,下午2点,在湖南·长沙·58小镇·风云资本,云鹰汇启动了一次历史性变革的GPT行业共创。活动整时长是4小时,这是云鹰汇发起的第一次GPT行业共创的邀请函,蜻蜓点水试一下,所以是拿...