白银罐体保温 280好意思元单!1000名工程师教Claude写好代码

 新闻资讯    |      2026-06-09 01:33
铁皮保温

新智元报说念白银罐体保温

【新智元读】Anthropic自工程师早已基本不写代码了,却280好意思元个任务,费钱请约1000名外部工程师,手把手教Claude Code写出好代码。喂养前沿模子的,终究照旧东说念主。

近,篇报说念把Claude Code的「杰出秘笈」摆在了台面上。

Business Insider称,Anthropic有个门普及Claude Code的技俩,正在通过约1000名软件工程师的反映来磨它。

这个技俩在数据公司Snorkel AI里面,代号为「Marlin」。

早在本年1月,Claude Code负责东说念主Boris Cherny就爆料我方照旧两个多月没手写过行代码,天就让Claude提交22个拉取苦求(Pull Request),前天则提交了27个,全是模子写的。

也有报说念称,Anthropic里面代码也大部分由AI生成。

道理的地,正在这儿。

边,Anthropic自中枢工程师照旧把无数编码责任交给模子;另边,它在费钱请约1000名外部工程师,手把手教Claude Code什么才叫「好代码」。

小时280好意思元

买的到底是什么

按Business Insider的说法,Marlin技俩请的外部工程师皆有软件工程布景。他们的活儿,听上去很像次简直的代码评审。

经过疏漏是这么。先从份包含数千个仓库的清单里,选个GitHub的代码仓库。然后建个PR,也即是开采者提派遣码修改的那步。再写段领导词,把任务讲了了。

模子会生成两套代码,而这些外部工程师接下来要作念的,是A/B测试:比较两套输出,选出好的那套。

每个任务报酬280好意思元,大要花小时。有些还要和Snorkel的审核层往返好几轮。

评判的程序,是评估分娩代码的正确、安全、可靠和可戒备。

举两个简直的例子。

在个任务里,外部工程师让模子重构系统处理推行元数据(execution metadata)的式,主义是让代码知晓、好戒备,但不改变。

另个任务中,外部工程师给MLflow这个开源机器学习平台作念安全确立,针对它加载模子时下载Python包可能出现的高唱注入间隙。材料的条款尽头明确:既要挡住高唱注入,又不可误伤正当的pip(Python包管束器)选项。

这些任务的条款,照旧出了数据标注的鸿沟,像是要让个资工程师,把脑子里那套「这么写好」的判断原样拷给模子。

然,Anthropic购买的并非代码,而是资步履员头脑中阿谁怎样把代码写得安全、干净的判断。

为什么非得是工程师

Anthropic为什么要如斯大费周章?因为Claude Code早就不是个写代码的聊天框了。

Anthropic官把它界说为技俩的AI智能体。它能读完总计代码库,跨文献作念计较,平直推行修改,跑测试,再把柄失败的效果我方迭代。

Anthropic官网对Claude Code的界说:套能读代码库、跨文献转换、跑测试、拜托已提派遣码的智能体。

这意味着它会确凿起首改文献、跑任务,宣战总计代码工程。

Anthropic我方也了了这件事的重量,因此在工程博客里反复讲Claude Code的权限、沙箱和批准疲惫(approval fatigue)问题。

默许情况下,风险文献修改或高唱推行需要用户批准;为减少反复授权带来的 批准疲惫,Anthropic还引入了sandboxing,让Claude Code在预设文献系统和网罗界限内安全地起首。

当个AI能跑高唱、能动线上代码,犯错的代价就不样了。锻真金不怕火主义也随着变:从「写对」升到「写得安全、可靠、可戒备」。

这些东西,往常的代码语料喂不出来。它昔日藏在资工程师的代码审查里,是东说念主传东说念主的教学。咫尺白银罐体保温,Anthropic想通过招募东说念主类编程,把它酿成不错购买的数据。

Snorkel

被低估的「数据军火商」

整件事情的信得过主角是Snorkel。

这公司2019年从斯坦福AI Lab走出来,押注的向唯有个:信得过决定机器学习成败的是数据,而不是模子或者算力。

Snorkel的两位垂危创举东说念主是Alex Ratner和他在斯坦福的师Chris Ré,他们说Snorkel的中枢学术泉源。

Snorkel AI联结创举东说念主、CEO Alex Ratner

2015年,Snorkel还仅仅Ratner读博时的个「下昼技俩」:与其花大价格雇东说念主条条标数据,不如用步履和执法作念「弱监督」(weak supervision),让模子不靠东说念主工逐条标注也能学。

靠着这套念念路,Snorkel攒下60多篇论文,开源器具也被Google、Intel用了起来,直到2019年才厚爱拆分红公司。

Snorkel AI联结创举东说念主,斯坦福熟识Chris Ré

Ratner的师Chris Ré亦然个狠角。

他是斯坦福熟识、麦克阿瑟天才得主、衔接创业者,参与的技俩曾被苹果收购,还创办了估值度达50亿好意思元的SambaNova。

有道理的照旧这公司的回身。

Snorkel当年要破的,恰是「东说念主工标注又慢、又贵、又不稳」这个老浩劫,当时AI开采约80的期间皆耗在手工标注数据上,因此Snorkel初的期望,即是尽量把东说念主从标注里平安出来。

可到了前沿模子时间,稀缺、值钱的又回到了东说念主身上,仅仅换成了博士、大夫、讼师、资工程师等的试吃和判断。这靠「少用东说念主」起的公司,如今获利的商业反倒是组织支粗略的雄师去锻真金不怕火前沿AI,Marlin仅仅其中单。

它的责任流,刚好也呼应了Marlin技俩的需求。

Snorkel官网这么态状这套责任流:先界说任务、评分程序和考据器,管道保温施工框定「什么算好」,再跑评审活水线,作家、多名评审、终裁决者层层把关,全程留痕。

Snorkel官网暗示:评审分出现不对后经裁决处分,并写入评分程序变纪录,每处转换皆可回顾到谁、何时、依据什么。

它还会把评估环境和数据并搭好,让同批任务能在不同模子版块上反复跑,得出可复现、可比较的分数。而要让分数干净可比,评分的东说念主就不可受版块干与。这些外部工程师不知说念我方评的是哪个版块,原因就在这儿。

报价也很能评释问题。

Snorkel个公开的法律向左券岗,每个质地任务10到100好意思元;而Marlin的软件工程任务是280好意思元个、约小时,折成时薪差未几是同业的两倍半(Scale AI、Mercor给工程师开到每小时110好意思元)。顶周入还能过3000好意思元。

Snorkel招募的这些外部工程师的反映,是确凿贵。

客户名单里有Google、Mistral、Anthropic。2025年5月,Snorkel完成D轮融资,估值13亿好意思元。

Anthropic营收负责东说念主Kate Jensen泄露,要把Claude的后劲开释出来,得靠引入域和东说念主类反映的新评估法,Anthropic会不息和Snorkel这么的公司联结。

Snorkel、Scale、Mercor这些公司,昔日被当成「标注平台」。如今它们成了前沿模子公司背后的隐形供应链。

给忠良的AI喂料的,即是这么支分别巨匠、看不见的雄师。

几个巨头

的是同种数据

不仅仅Anthropic在买简直工程工夫。这场竞赛,几个重磅玩皆在参与,仅仅法不同。

Cursor走的是产物数据这条路。

它官写明:用户开启隐痛方式后,代码不会被它或三用于锻真金不怕火;唯关系闭隐痛方式,它才可能用代码库数据、领导词、裁剪活动、代码片断,来改进AI、锻真金不怕火模子。

Cursor的Tab模子每天产出过10亿个裁剪字符,苦求量比第一版涨了约100倍。杰出的Composer,通过强化学习(RL)锻真金不怕火,让模子在无数代码任务环境中学习调用裁剪、搜索等器具,处理长周期的工程任务。

到新的Composer 2.5,干脆主攻需要数百步操作的长周期任务。

马斯克摄取的是成本绑定/收购期权的式。

本年2月,xAI并入SpaceX。4月底,SpaceX拿下了年内以600亿好意思元收购Cursor母公司Anysphere的权益,或者先付100亿好意思元作念度联结。马斯克看中的恰是Cursor手里那份巨匠活跃的简直开采者活动数据。

5月25日,马斯克在X上文牍,新代基础模子Grok V9-Medium锻真金不怕火完成,参数1.5T,是现时分娩模子的3倍。他突出点出,这照旧没加Cursor数据补训之前的收获,加完「编程工夫会强好多」,模子展望6月中旬发布。

这么来,V9会是个系统地「吃过」简直开采者活动数据的Grok。

OpenAI自后的Codex也走上了这条路。2025年发布的Codex由codex-1驱动,OpenAI称其是在简直编码任务上通过强化学习锻真金不怕火的,主义是写出靠拢东说念主类格调、相宜PR民俗的代码,还能反复跑测试直到通过;每个任务跑在预装了你代码库的壅塞沙箱里。

如今Codex已升为OpenAI的agentic coding平台,由其前沿编码模子驱动;据Axios报说念,每周用户已过500万。

他们争夺的,其实是同种东西:过程数据,仅仅旅途各不疏通。

Anthropic先有模子,缺简直开采现场的反映,就费钱请约1000名工程师,把软件工程过程拆成可学习的数据;

Cursor先有产物和简直用户活动,也有自研的Tab、Composer等编程模子。但比拟OpenAI、Anthropic,它缺的是通用基础模子底座和大规模锻真金不怕火算力;

马斯克缺的亦然数据,干脆试图用几百亿好意思元去买个不息产生开采者活动数据的产物进口;

OpenAI模子、产物两端皆不缺,于是我方搭沙箱,让模子在简直编码任务里通过强化学习遍遍试错、测试、修正、迭代。

几法不同,同归殊途,皆在用越来越接近简直工程现场的数据,来锻真金不怕火我方的AI编程模子。

信得过的护城河

是东说念主的试吃和判断

有篇叫SWE-chat的论文,次大规模汇集了简直的智能体编码会话:6000段、过6.3万条用户prompt、35.5万次器具调用。

它得出个扎心的数字:智能体产出的代码,唯有44终参预了用户的提交里。有半多的运说念被东说念主删了、改了、翻了。

SWE-chat实测:vibe coding已占41的会话,但智能体写的代码唯有44终参预提交;用户在44的交互轮次里通过改进、报错或中断来反模子输出。

这评释,HumanEval那类老的基准测试(benchmark)照旧刷到豪阔,光看跑分道理不大了。信得过的战场,是简直开采过程里那些反复、试错、翻重来的数据。

模子越强,越要费钱去买东说念主类还没被替代的那部分东西:工程直观。

Anthropic花280好意思元个任务,请来约1000名工程师作念A/B投票:这套看上去重荷的活儿,买的恰是这点。

谁能把工程现场酿成模子能消化的数据,谁就持住了参预AI编程下程的入场券。

参考府上:

https://www.businessinsider.com/anthropic-improve-claude-code-snorkel-data-training-contractors-2026-620

https://snorkel.ai/blog/anthropic-claude-aws-revolutionizing-pharma-data-analytics-with-snorkel-ai/

裁剪:元宇

邮箱:215114768@qq.com相关词条:玻璃棉毡     塑料挤出机     预应力钢绞线    铁皮保温    万能胶生产厂家

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定白银罐体保温,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。