
本文来自微信公众号:字母AI,作家:刘奕君玉溪不锈钢保温施工,头图来自:AI生成
近OpenClaw不错说是火遍了大江南北。各大厂商皆说我方的模子怎样撑持小龙虾,唯没东说念主荐ChatGPT。
事实上OpenAI才收购了OpenClaw。
原因就个“贵”。
让AI帮你完成个稍稍复杂的任务,比如自动化惩办批客户邮件,背后可能要调用模子几十上百次:交融意图、检索信息、生成草稿、校对润、逐封发送……如果每步皆调用满版GPT-5.4,轮操作下来,饲料费(token)比虾自己还贵。
杰出是跟着OpenClaw这类agent框架的爆发,AI的职责方式也曾发生了根底转机:从前咱们向AI发问,它盯着问题想很久,然后吐出长串翰墨;面前AI濒临个复杂任务,要将其拆解成渺小环节分步进。每步皆调用旗舰大模子,不仅延迟让东说念主崩溃,资本也会到离谱。
在这种布景下,OpenAI追究发布GPT-5.4 mini与nano两款微型模子,并声称其为公司“迄今庞大的微型模子”。
麻雀虽小五脏俱全,不要轻茂这两个小玩意,不仅GPT-5.4中枢的势和才智它们摄取了下来,同期还快、省资源,而况符合于多数目、频率的AI任务调用。
OpenAI貌似是认为mini还不够小,是以作念出了轻量的nano。
nano是GPT-5.4轻量、快速的版块,为对速率和资本条目的任务而磋商。
事实即是,用单模子惩办系数事务价比太低,频繁堕入射炮蚊子的境况,不如和洽成大模子决定任务向,小模子进行大界限快速实施的案。
OpenAI自的Codex即是这样干的。
个主模子负责理撤职务意图、拆解环节,然后退换mini/nano别的子agent去实施具体的代码修改、测试动手、成果校验,每个子任务只要耗低的资本。
大模子就像镇守中军、出谋献计的主帅,只持顶层计谋、退换全局资源。小模子则是数支精锐轻骑,体态毛糙、举止迅捷、批量奔赴前方,完成细分任务。
、OpenAI为什么这样作念
mini和nano在价钱上确乎“mini”以及“nano”。要交融OpenAI为什么押注轻量化,先望望这两款模子到底低廉到什么进度。
mini和nano均撑持 400k tokens 的高下文窗口。在输入价钱上,GPT-5.4旗舰版是2.5 好意思元/百万token,mini版是0.75好意思元/百万 token,nano版是夸张,仅0.2好意思元/百万token,输入资本仅为旗舰模子GPT-5.4的8。
而输出价钱上,GPT-5.4是15好意思元/百万 token,mini版约为它的1/3(4.5 好意思元),nano版约为它的1/12(1.25 好意思元)。
换句话说,OpenAI用户们的账单径直到了头。
价钱仅仅处所,确切驱动OpenAI作念这件事的,是通盘行业的使用趋势也曾发生了根底转向。
轻量化小模子主要有调用资本低、反映快这两大特征,不少凭证标明小模子也曾成为现时AI落地具价比、具增长后劲的弃取。
在OpenRouter本月度受接待LLM排名榜前十中,轻量化模子占到了6个席位,它们参数目广泛集会在数十亿至数百亿别,和Claude Opus这类动辄数千亿致使万亿参数的通用旗舰大模子酿成澄澈的相反。
榜单Top 2席位被轻量化小模子包揽,1名MiniMax M2.5以8.29T tokens的调用量断层跑全榜,月度涨幅达 476;2名Google Gemini 3 Flash Preview,调用量也达到4.24T tokens,远多数通用旗舰大模子。
Hugging Face Hub的模子下载量统计不异印证了这趋势:92.48的下载量来自少于10亿参数的模子,86.33 为5亿以下,69.83 为2亿以下。
大模子也干预了薄利多销的时期。
1B+参数目的模子,即便包含多款公论热度的开源大模子,全体下载占比仅为7.52,不及轻量化模子的十分之,这评释大模子的怜惜度,似乎并未转机为确切的落地与选择。
从OpenAI自身的营业账原本看,管道保温施工作念小模子是说念必答题。
本年2月底,OpenAI文书ChatGPT大家每周活跃用户已冲破9亿,付用度户约5000 万,付费转机率仅约5附近,大多数用户仍停留在费版块。这也成为其将来营业化中枢的增漫空间。
大多数的C端付用度户,中枢使用场景是日常对话、案牍润、信息检索、轻量代码编写等频轻量需求。
这类场景不需要GPT-5.4这类旗舰大模子的限复杂理才智,百亿以内的轻量化小模子足以粉饰大部分需求,同期又能提供毫秒反映、列队恭候的使用体验,匹配大多数用户的中枢诉求。
说了这样多“为什么”,接下来望望这两款模子到底交出了怎样的答卷——毕竟,饲料低廉了,虾的个头如果也缩水了,那就不叫降本增,叫偷工减料。
二、mini、nano才智几何
mini和nano的势就仅仅小和低廉吗?
No No No!
根据OpenAI官网的系列跑分测试,不错说它们才智进展也很凸起。
在业内公认的AI圭臬员测试SWE-bench Pro 中,GPT-5.4 mini的准确率达到了54.4,进展具伤力,迫临满版GPT-5.4的57.7。
GPT-5.4 nano的准确率为52.4,再琢磨到它低的资本,相配适相助为快速迭代的代码审查和援助子agent。
以下两张图表看得直不雅,横轴永诀代表模子的反映时长和所用资本,纵轴均暗意模子在职务中的准确率。
GPT-5.4诚然准确率稳居,但是在横轴上却蔓延了太远,也即是不仅念念考久,的钱还多。而nano和mini的折线则全体居于坐标图左侧,记号了它们的价比。
它们仅仅葬送了点点终的逻辑上限,就换来了快的反映速率和低的资本。
对此,不少网友戏称:小龙虾的饲料费终于被下来了。
的确,mini和nano将来可能会成为养虾的主流API弃取。
在OSWorld-Verified(确切电脑环境操作测试)中,GPT-5.4 mini达到了72.1的准确率,险些追平了满旗舰版的75。
这项测试主如果让AI像东说念主样,通过看示器、动鼠标、敲键盘来使用台确凿电脑,包括使用Chrome、Office、VS Code等软件。
邮箱:215114768@qq.com这才是OpenClaw等agent玩敬重的标的。
往时让AI操控电脑,AI频繁会瞎点大概反应粗笨。mini版块的这个分意味着,它识别按钮、滑块、输入框的精度,在些自动化任务上不错加庖丁解牛。
然而,也不是系数场景皆符合用小模子。
nano模子在OSWorld-Verified上的得分仅为39.0,致使低于上代GPT-5 mini的42.0。
这意味着在需要缜密操控电脑界面的复杂任务上,nano还力有不逮。
不异,关于需要度理、长链条逻辑的难度任务,旗舰版GPT-5.4仍然不能替代。
小模子的价值不在于取代大模子,而在于和大模子搭配使用——把对的模子放在对的位置,才是子agent架构确切的精髓。
这也恰正是nano和mini发布的层酷好,它们不是来旗舰版饭碗的,而是来帮旗舰版摊派那些“射炮蚊子”的活儿。
当大模子不再需要亲身惩办每个琐碎环节,通盘系统的率和资本结构皆会发生质变。
OpenAI想的不是场浅薄的价钱战,OpenAI内心OS是这样的:“我不错每个token少赚你点钱,但是我要让你多用我的小模子,把总收入抬上去。”
典型的薄利多销。
往时“低廉”是国产模子的护城河,然而这说念护城河正在被填平。对通俗建立者和企业用户而言,AI可能很快就会变成五行八作用得起、跑得快的新基础门径。
小龙虾的饲料费下来了,养虾的门槛也在偷偷镌汰。接下来的问题是:谁能养出肥的虾?
本文来自微信公众号:字母AI,作家:刘奕君
相关词条:铁皮保温施工 隔热条设备 锚索 离心玻璃棉 万能胶生产厂家1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定玉溪不锈钢保温施工,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。