AI专吃屎山代码

你公司核心系统跑的那坨屎山代码，可能正在被AI一口一口吞掉。

不是比喻。是事实。

IBM刚发布的代码现代化工具链，一端喂进上世纪七十年代的COBOL，另一端吐出来的是Kotlin微服务。中间环节做了三件事：阅读理解三十年没注释的意大利面代码、拆解耦合、重写部署。从项目立项到生产上线，两周。

你让一个高级工程师干这事，光读懂那段代码就能耗掉半年——如果他不先辞职的话。

这事比想象中可怕。可怕在哪？我们分开说。

屎山的体量：比你想象的恶心十倍¶

全球每天跑在生产线上的代码，有60%以上超过十五年。银行的转账清算、航空的订票系统、政府的社保数据库——这些玩意儿的底层逻辑写于DOS时代。

中信银行去年做过一次审计。他们的核心交易系统里有43万行代码从未被任何人完整读过。不是不想读，是写过它们的人要么退休了，要么去世了。没注释，没文档，唯一能跑的只有跑着的那份二进制。

华尔街的清算系统更夸张。纽约梅隆银行的后端至今还在跑1972年写的那套框架。每提交一个patch都要祭出三位数的测试用例，因为没人说得清改了A会不会炸了B。

这不是技术债。是技术黑洞。

全球遗留代码维护市场，年产值超过3万亿人民币。养活了几十万拿着六位数年薪的COBOL老法师——他们靠的就是「只有我能碰这坨屎」的垄断地位。

现在，AI来了。

遗留系统维护现场

AI是怎么啃屎山的：三刀法¶

大型语言模型在读懂屎山代码这件事上的能力，远超人类。

逻辑很简单。LLM的底层架构就是模式匹配引擎，训练数据里塞满了GitHub上所有公开仓库——好的、烂的、被遗弃的、写于1998年的。它对老旧代码模式的敏感度，比十年经验的架构师高一个量级。

目前市面上三套主流方案：

第一刀：静态分析增强。 AWS的CodeGuru和Google的Project IDX都在做同一件事——把屎山代码先过一遍符号执行引擎，生成调用图和依赖链，再交给LLM「阅读理解」。这一步解决了AI上下文窗口不够大的问题，让模型能看全景而不是局部。

第二刀：语义映射。 IBM watsonx Code Assistant做的事更狠。它直接把COBOL函数映射成Kotlin等价物——不是翻译，是语义重构。一个500行的COBOL报表模块，重构完变成17行Kotlin。不是删了483行，是删了483行冗余逻辑。

第三刀：自我对抗验证。 这是最妙的一刀。模型生成新代码后，用自己的另一个实例去「攻」它——找出逻辑漏洞、边界条件、并发竞争。攻击成功的，打回重写。攻击失败的，代码就算过了。Meta内部已经在生产环境跑这套流程，准确率比人工代码审查高出11个百分点。

三刀下去，屎山塌了。

问题是从此以后谁来看这座山。

COBOL老法师：最后的掘墓人¶

这里有一个人间悲剧。

美国联邦政府每年花3亿美金维护IRS的税法计算系统。这套系统90%的代码是COBOL。全美还在写COBOL的程序员不到700人，平均年龄63岁。

每退休一个，知识就永久消失一个。

财政部不是没想过重写。2020年做过一次预算：全量重构需要47亿美金、6年时间、0停机——三个数字放到一起就是个笑话。

现在AI进场了。IBM去年用watsonx替美国一家大型保险公司做COBOL现代化，全程只保留了两个退休返聘的老法师做验收。几千个需求，三周干完。

老法师看完成果，说了句话流传开了：「我干了四十年的事，它三周做完了。做得比我好。」

这句话比任何行业报告都狠。

不是AI要取代你。是你四十年积累的本事，本来就是可以被模式匹配的。

COBOL程序员工作台

谁先死：写屎山的还是守屎山的¶

这事最残酷的地方在于：最先被干掉的不是写新代码的人，是维护旧代码的人。

过去二十年，软件行业有一条铁律——入行先写新功能，升到高级开始修bug，熬成首席才能碰屎山。屎山维护是职业生涯的终极形态，是资历的终极货币。

AI把这个货币烧了。

一个中级工程师+AI工具，能在两周内完成一个传统五人团队半年的遗留系统迁移。过去你靠「只有我懂这段代码」在公司站稳脚跟，现在这条护城河只剩三天——AI三天就能读懂你守了十年的那坨屎。

亚马逊去年的内部数据显示：用CodeWhisperer做遗留系统维护的团队，效率中位数提升340%。与此同时，该团队的headcount缩减了30%。

不是裁员。是有人走了就不再补了。走的速度比补的速度快，自然就少了。

所以AI到底行不行¶

有一个细思极恐的细节。

AI读懂屎山代码的成功率，高于它从零写新代码的成功率。

这话不是我说的，是Google DeepMind去年底做的对比实验。他们用Gemini在一组混合任务上跑分：从零实现一个微服务的正确率是71%，理解并重构一个已有服务的正确率是89%。

原因很直白：从零创造需要「世界知识+意图推理」，而屎山重构只需要「模式匹配+约束满足」。前者是AI的短板，后者是AI的长板。

这意味着一个荒诞的未来：AI最擅长的工作，恰恰是人类最不愿意做的工作。而被认为「最有创造力的」新功能开发，反而是AI相对薄弱的环节。

讽刺吧。

那些靠维护屎山拿高薪的老法师，以为自己在吃最硬的骨头。结果这把刀，专挑硬骨头砍。

你还能做什么¶

三个不那么让人开心的结论：

第一，任何依赖「信息不对称」建立的职业壁垒，在AI面前都是纸糊的。「只有我懂的代码」=「只有我懂的文本」，而文本恰好是LLM最擅长的领域。

第二，遗留系统现代化的市场会爆发，但赢家不是开发者。是那些掌握了AI+工具链的咨询公司和平台厂商。IBM、AWS、Accenture已经在瓜分这块3万亿的蛋糕。

第三，你只有一条路：从「信息不对称的受益人」变成「信息整合的操盘手」。不是你去读屎山，是你告诉AI怎么读屎山。价值不在「知道代码里的秘密」，在于「知道该让AI重构什么」。

留给老法师的时间不多了。AI吃屎山的速度比人写屎山的速度快。

而这个世界最不缺少的，就是屎山。

AI现代化遗留系统场景