OpenAI正式发布GPT4.1，实力不如Gemini 2.5 Pro/Claude 3.7

就在今天，OpenAI按照老传统，凌晨1点开直播宣布推出三款新模型：GPT-4.1、GPT-4.1 mini和 GPT-4.1 nano。

得知OpenAI此次发布的是GPT-4.1，还以为哪里传来的假消息，想不到居然是真的。

取名字居然倒着取，gpt 4 -> gpt4o -> gpt4 o1/o3 -> gpt 4.5 -> gpt 4.1，就有点怪异。

回归正题，给大家讲一讲OpenAI此次发布的GPT-4.1。

GPT-4.1系列是OpenAI全新的多模态模型，可以看图、看视频，不能识别音频，其能力要全面优于GPT-4o。

OpenAI官方表示不会整合到ChatGPT官网中，只能通过API调用，不过会将GPT-4.1的能力连续整合到GPT-4o，同时还透露，GPT-4.5预览版的API将在未来3个月后下架。

给出的原因很简单，GPT-4.1的性价比更高。（估计是GPT-4.5太贵，没人用）。

面对OpenAI这波离谱的取名操作，知名博主@小互给出自己的看法，我举双手双脚赞同。

看过此次的GPT-4o公布的成绩单，不难看出OpenAI此次推出GPT-4.1主打的就是编程。

在 SWE-bench Verified（衡量真实世界软件工程技能的指标）中，GPT-4.1的成绩超越了GPT-4o和GPT-4.5。

不过面对Gemini 2.5 Pro、C laude 3.7等模型，GPT-4.1就有点不够看了。

这里给大家简单介绍一下这个基准测试，Aider 的多语言基准测试对 LLMs 进行了 225 个具有挑战性的 Exercism 编程练习的测试，涵盖 C++、Go、Java、JavaScript、Python 和 Rust 等编程语言。

所以这个基准测试的可信度还是蛮高的。

在发布的短短几个小时后，网上众多大神对GPT-4.1进行来第一波实测。

提示词：编写一个使用 Pygame（或另一个合适的库）的 Python 程序，模拟几个受重力影响的弹跳球在旋转的方形内运动。球应与旋转方形墙壁发生碰撞，保持物理现实，包括速度变化、重力效果和旋转感知的碰撞检测。

还有网友将GPT-4.1、GPT-4.1-mini、GPT-4.1-nano以及GPT-4.5生成此前很火的球在六边形滚动的代码。

最稳定的就是GPT4.1和GPT-4.5了，GPT-4.1-nano表现就有点辣眼睛了。

还有沃顿商学院教授Ethan Mollick用GPT-4.1去生成飞船控制面板的p5js。他觉得，相较于GPT-4，GPT-4.1进步非常大，整体上表现出色。

最后给大家公布一下大家最关心的价格，

GPT-4.1每百万Token的输入价格是2美金，每百万Token的输出价格是8美金，而号称OpenAI史上最便宜API的GPT-4.1-nano每百万Token的输入价格是0.1美金，每百万Token的输出价格是0.4美金。

这么便宜，感觉可以强体验一手，如果大家还不会获取OpenAI的API Key，可以看我之前的文章，里面详细介绍了如何获取 OpenAI API Key的方法和如何解决支付难题的详细方法。

类似文章