- 主题:要迈向一人一月一百万行代码了
实话实说,一二十万行已经很了不起了
【 在 stevenxh 的大作中提到: 】
: 他说的6w行什么意思啊?后面又说一个月只能hold 10w-20w行的规模。一个月写了一百多万行,但有效的只有一二十万行么?
--
FROM 222.129.50.*
test
--
FROM 114.254.21.*
re
【 在 chunhui 的大作中提到: 】
: 如图
: 这已经不是效率问题了。这是工作层次问题。
--
FROM 120.245.118.*
这是领导为出成绩,把员工当驴使?
--
FROM 111.164.183.*
Claude Code/Codex/Gemini 3 Pro可以连续工作30小时,现在也能在大型项目上工作。问题在于,AI交付的软件是否可靠?这个可靠性最终还是要靠实际生产的检验,与之前人类编写的软件一样,没有什么形式化的方法能够验证可靠性问题(之前有TLA+之类的方法也没发挥什么作用),这不是能找到什么方法解决这个问题,是很可能找不到方法。
所以当前的AI coding工具还是强调human-in-the-loop;这种效率的提升就是有天花板的,(实际上编码只占软件开发工作流中的少部分),什么时候develop-loop-without-human交付的大型复杂软件(os/data process platform/distributed system/middleware/industrial software...)在生产上持续被验证,ai coding的信心持续提升,效率才会发生根本性提升。
AI Coding显然是软件开发模式(我们团队现在80%以上代码都是AI生成)的一次重大革新,至于会不会成为那个“银弹”,当下还难以判断。
【 在 chunhui 的大作中提到: 】
: 前面说了,如果你真的打算让ai来提高写代码的效率,那么你就不太可能把用人review代码作为工作中的一环。因为一旦你这么作了,那人就会成为瓶颈,用ai的效率就高不到哪儿去。你肯定要想办法解决去掉人才会更利用ai的好处。
--
FROM 121.199.22.*
作为生产工具,且量上来了,感觉还是有点成本的
【 在 hgoldfish 的大作中提到: 】
: 当前 AI 的成本不太需要考虑。这些 AI 公司都拼了命向用户送钱。
: 个个都巨亏。
--
FROM 159.226.43.*
Galen Hunt 是微软非常有影响力的技术领袖(曾领导 Midori 操作系统项目),他提出的这个愿景确实非常大胆,甚至听起来有些“疯狂”。
要理解这件事靠不靠谱,我们需要拆解他的技术逻辑。
一、“一名工程师,一个月,一百万行”靠谱吗?
如果靠人工手动重写,这绝对是不可能的。一个顶级程序员一年能写出几万行高质量、逻辑严密的 Rust 代码就已经很了不起了。
但 Galen Hunt 这里的核心逻辑是:AI 辅助的自动化迁移。
靠谱的地方: * 内存安全转换: 微软拥有海量的 C/C++ 遗留代码。很多基础库的逻辑是稳固的,主要风险在于内存管理。如果能通过工具自动识别 C++ 的内存模型(所有权、生命周期)并映射到 Rust,效率会呈几何倍数提升。
LLM 的加持: 传统的“代码转代码”工具(如 c2rust)生成的代码往往很不“地道”(充满了 unsafe)。引入 AI 代理(AI Agents)可以像人类一样进行重构、添加注释、优化结构,从而实现从“机器翻译”到“智能重写”的跨越。
不靠谱(面临的挑战):
语义鸿沟: C++ 的某些模式(如多重继承、模板黑魔法、复杂的指针算术)很难完美转换成 Rust。
正确性验证: 自动生成的 100 万行代码,谁来确保逻辑 100% 正确?测试和验证的成本可能远超重写本身。
结论: 这是一个**“北极星目标”**。他指的不是工程师“写”了 100 万行,而是工程师“监督、指导、审核”AI 转换了 100 万行。
二、什么是“程序码处理基础设施”和“源码的可扩展图”?
这是典型的编译器技术与大数据/AI结合的产物。
1. 程序码处理基础设施 (Code Processing Infrastructure)
这不仅是一个 IDE 或编译器,而是一套工厂流水线。它包括:
摄取层: 能够处理不同构建系统(MSBuild, CMake, Bazel)的代码。
分析层: 能够跨项目、跨仓库分析代码依赖。
执行层: 大规模并行运行 AI 代理,对代码进行修改并自动提交 Pull Request。
2. 源码的可扩展图 (Scalable Graphs of Source Code)
这是最关键的技术名词,通常指 代码属性图 (Code Property Graph, CPG) 的超大规模版本。
传统的抽象语法树 (AST): 只看得到代码的结构(如:这是一个函数)。
控制流图 (CFG) & 数据流图 (DFG): 看得到代码怎么运行,数据怎么流转。
可扩展图 (Scalable Graph): * 全系统关联: 它把整个微软的代码库(数亿行)建成一个巨大的图。如果你修改了底层的一个 C++ 指针,这个图能告诉你它会如何影响上层几千个依赖项。
AI 的“地图”: AI 代理不能只看一行代码就改一行。它需要在这个“图”里导航,理解上下文。
数学抽象: 通过图算法,可以识别代码中的重复模式、漏洞路径,或者寻找最适合重构为 Rust 所有权模型的切入点。
三、总结
Galen Hunt 招人的意图很明显:他不是在招普通的程序员,而是在招“造工具的人”。
他需要的是一群懂编译器底层(把代码变成功)、懂数据库(处理海量代码图数据)、懂 AI(让 AI 能够自动化操作)的顶级专家,去开发一套能够自动吞噬 C++ 并吐出 Rust 的机器。
如果你对这个职位感兴趣,重点不在于你写 Rust 有多快,而在于你是否能理解如何通过静态分析和 AI 代理,大规模地自动化处理代码逻辑。
你想了解更多关于 C++ 转 Rust 的技术细节,或者关于代码属性图(CPG)的相关资料吗?
--
FROM 114.241.229.*
如果能搞出来这个工具,希望他能开源。
【 在 z16166 的大作中提到: 】
: Galen Hunt 是微软非常有影响力的技术领袖(曾领导 Midori 操作系统项目),他提出的这个愿景确实非常大胆,甚至听起来有些“疯狂”。
: 要理解这件事靠不靠谱,我们需要拆解他的技术逻辑。
: 一、“一名工程师,一个月,一百万行”靠谱吗?
: ...................
--
FROM 221.216.159.*
这个解释是合理的,就是LLM辅助的静态代码分析和转换,我在20年前搞程序自动化漏洞检查的时候就接触过这个东西,这实际上是非常古老的东西。
【 在 z16166 的大作中提到: 】
: Galen Hunt 是微软非常有影响力的技术领袖(曾领导 Midori 操作系统项目),他提出的这个愿景确实非常大胆,甚至听起来有些“疯狂”。
: 要理解这件事靠不靠谱,我们需要拆解他的技术逻辑。
: 一、“一名工程师,一个月,一百万行”靠谱吗?
: ...................
--
修改:heideggerr FROM 123.191.92.*
FROM 123.191.92.*
20年前的东西跟现在LLM驱动的东西,没有任何关系。
一定要说是同一个东西的话,那你和猪都是吃喝拉撒水,所以你等于猪。
【 在 heideggerr 的大作中提到: 】
: 这个解释是合理的,就是LLM辅助的静态代码分析和转换,我在20年前搞程序自动化漏洞检查的时候就接触过这个东西,这实际上是非常古老的东西。
:
--
FROM 116.233.45.*