【OpenAI 2024年09月13日】 9月13日,OpenAI宣布推出其全新产品OpenAI o1,也就是此前广受期待的代号为 “草莓(Strawberry)”生成式AI模型。“o1在回答问题之前会先思考--它可以在回复用户之前产生很长的内部思考链。”准确地来说,o1实际上一系列用于解决难题的全新推理模型,经过强化学习训练可以执行复杂的推理,擅长准确生成和调试复杂代码。目前发布的是OpenAI o1-preview 版本以及OpenAI o1-mini。OpenAI o1-mini是一种速度更快、成本更低的推理模型,作为一款较小的模型,o1-mini比o1-preview便宜80%。
OpenAI表示,对于复杂推理任务而言,新模型代表着AI能力的崭新水平,因此值得将计数重置为1,并将该系列命名为 OpenAI o1,给它一个有别于“GPT-4”系列的全新名号。测试结果表明,OpenAI o1在竞争性编程问题(Codeforces)中排名第 89 位,在美国数学奥林匹克(AIME)预选赛中跻身美国前500名学生之列(o1正确解答了83%的题目,而GPT-4o仅解答了13%),并在物理、生物和化学问题(GPQA)基准测试中超越人类博士级准确度。