AI专吃屎山代码

你公司核心系统跑的那坨屎山代码,可能正在被AI一口一口吞掉。
不是比喻。是事实。
IBM刚发布的代码现代化工具链,一端喂进上世纪七十年代的COBOL,另一端吐出来的是Kotlin微服务。中间环节做了三件事:阅读理解三十年没注释的意大利面代码、拆解耦合、重写部署。从项目立项到生产上线,两周。
你让一个高级工程师干这事,光读懂那段代码就能耗掉半年——如果他不先辞职的话。
这事比想象中可怕。可怕在哪?我们分开说。
屎山的体量:比你想象的恶心十倍¶
全球每天跑在生产线上的代码,有60%以上超过十五年。银行的转账清算、航空的订票系统、政府的社保数据库——这些玩意儿的底层逻辑写于DOS时代。
中信银行去年做过一次审计。他们的核心交易系统里有43万行代码从未被任何人完整读过。不是不想读,是写过它们的人要么退休了,要么去世了。没注释,没文档,唯一能跑的只有跑着的那份二进制。
华尔街的清算系统更夸张。纽约梅隆银行的后端至今还在跑1972年写的那套框架。每提交一个patch都要祭出三位数的测试用例,因为没人说得清改了A会不会炸了B。
这不是技术债。是技术黑洞。
全球遗留代码维护市场,年产值超过3万亿人民币。养活了几十万拿着六位数年薪的COBOL老法师——他们靠的就是「只有我能碰这坨屎」的垄断地位。
现在,AI来了。

AI是怎么啃屎山的:三刀法¶
大型语言模型在读懂屎山代码这件事上的能力,远超人类。
逻辑很简单。LLM的底层架构就是模式匹配引擎,训练数据里塞满了GitHub上所有公开仓库——好的、烂的、被遗弃的、写于1998年的。它对老旧代码模式的敏感度,比十年经验的架构师高一个量级。
目前市面上三套主流方案:
第一刀:静态分析增强。 AWS的CodeGuru和Google的Project IDX都在做同一件事——把屎山代码先过一遍符号执行引擎,生成调用图和依赖链,再交给LLM「阅读理解」。这一步解决了AI上下文窗口不够大的问题,让模型能看全景而不是局部。
第二刀:语义映射。 IBM watsonx Code Assistant做的事更狠。它直接把COBOL函数映射成Kotlin等价物——不是翻译,是语义重构。一个500行的COBOL报表模块,重构完变成17行Kotlin。不是删了483行,是删了483行冗余逻辑。
第三刀:自我对抗验证。 这是最妙的一刀。模型生成新代码后,用自己的另一个实例去「攻」它——找出逻辑漏洞、边界条件、并发竞争。攻击成功的,打回重写。攻击失败的,代码就算过了。Meta内部已经在生产环境跑这套流程,准确率比人工代码审查高出11个百分点。
三刀下去,屎山塌了。
问题是从此以后谁来看这座山。
COBOL老法师:最后的掘墓人¶
这里有一个人间悲剧。
美国联邦政府每年花3亿美金维护IRS的税法计算系统。这套系统90%的代码是COBOL。全美还在写COBOL的程序员不到700人,平均年龄63岁。
每退休一个,知识就永久消失一个。
财政部不是没想过重写。2020年做过一次预算:全量重构需要47亿美金、6年时间、0停机——三个数字放到一起就是个笑话。
现在AI进场了。IBM去年用watsonx替美国一家大型保险公司做COBOL现代化,全程只保留了两个退休返聘的老法师做验收。几千个需求,三周干完。
老法师看完成果,说了句话流传开了:「我干了四十年的事,它三周做完了。做得比我好。」
这句话比任何行业报告都狠。
不是AI要取代你。是你四十年积累的本事,本来就是可以被模式匹配的。

谁先死:写屎山的还是守屎山的¶
这事最残酷的地方在于:最先被干掉的不是写新代码的人,是维护旧代码的人。
过去二十年,软件行业有一条铁律——入行先写新功能,升到高级开始修bug,熬成首席才能碰屎山。屎山维护是职业生涯的终极形态,是资历的终极货币。
AI把这个货币烧了。
一个中级工程师+AI工具,能在两周内完成一个传统五人团队半年的遗留系统迁移。过去你靠「只有我懂这段代码」在公司站稳脚跟,现在这条护城河只剩三天——AI三天就能读懂你守了十年的那坨屎。
亚马逊去年的内部数据显示:用CodeWhisperer做遗留系统维护的团队,效率中位数提升340%。与此同时,该团队的headcount缩减了30%。
不是裁员。是有人走了就不再补了。走的速度比补的速度快,自然就少了。
所以AI到底行不行¶
有一个细思极恐的细节。
AI读懂屎山代码的成功率,高于它从零写新代码的成功率。
这话不是我说的,是Google DeepMind去年底做的对比实验。他们用Gemini在一组混合任务上跑分:从零实现一个微服务的正确率是71%,理解并重构一个已有服务的正确率是89%。
原因很直白:从零创造需要「世界知识+意图推理」,而屎山重构只需要「模式匹配+约束满足」。前者是AI的短板,后者是AI的长板。
这意味着一个荒诞的未来:AI最擅长的工作,恰恰是人类最不愿意做的工作。而被认为「最有创造力的」新功能开发,反而是AI相对薄弱的环节。
讽刺吧。
那些靠维护屎山拿高薪的老法师,以为自己在吃最硬的骨头。结果这把刀,专挑硬骨头砍。
你还能做什么¶
三个不那么让人开心的结论:
第一,任何依赖「信息不对称」建立的职业壁垒,在AI面前都是纸糊的。「只有我懂的代码」=「只有我懂的文本」,而文本恰好是LLM最擅长的领域。
第二,遗留系统现代化的市场会爆发,但赢家不是开发者。是那些掌握了AI+工具链的咨询公司和平台厂商。IBM、AWS、Accenture已经在瓜分这块3万亿的蛋糕。
第三,你只有一条路:从「信息不对称的受益人」变成「信息整合的操盘手」。不是你去读屎山,是你告诉AI怎么读屎山。价值不在「知道代码里的秘密」,在于「知道该让AI重构什么」。
留给老法师的时间不多了。AI吃屎山的速度比人写屎山的速度快。
而这个世界最不缺少的,就是屎山。
