要迈向一人一月一百万行代码了

水木社区手机版

主题:要迈向一人一月一百万行代码了
90楼|buildtolast|2025-12-24 21:34:52|只看此ID
实话实说，一二十万行已经很了不起了

【在 stevenxh 的大作中提到: 】
: 他说的6w行什么意思啊？后面又说一个月只能hold 10w-20w行的规模。一个月写了一百多万行，但有效的只有一二十万行么？
--
FROM 222.129.50.*
91楼|zhelong|2025-12-24 21:46:46|只看此ID
test
--
FROM 114.254.21.*
92楼|envi|2025-12-24 22:06:05|只看此ID
re
【在 chunhui 的大作中提到: 】
: 如图
: 这已经不是效率问题了。这是工作层次问题。
--
FROM 120.245.118.*
93楼|zhongjianguo|2025-12-25 10:32:38|只看此ID
这是领导为出成绩，把员工当驴使？
--
FROM 111.164.183.*
94楼|kenryhuang|2025-12-25 13:41:24|只看此ID
Claude Code/Codex/Gemini 3 Pro可以连续工作30小时，现在也能在大型项目上工作。问题在于，AI交付的软件是否可靠？这个可靠性最终还是要靠实际生产的检验，与之前人类编写的软件一样，没有什么形式化的方法能够验证可靠性问题（之前有TLA+之类的方法也没发挥什么作用），这不是能找到什么方法解决这个问题，是很可能找不到方法。

所以当前的AI coding工具还是强调human-in-the-loop；这种效率的提升就是有天花板的，(实际上编码只占软件开发工作流中的少部分)，什么时候develop-loop-without-human交付的大型复杂软件(os/data process platform/distributed system/middleware/industrial software...)在生产上持续被验证，ai coding的信心持续提升，效率才会发生根本性提升。

AI Coding显然是软件开发模式(我们团队现在80%以上代码都是AI生成)的一次重大革新，至于会不会成为那个“银弹”，当下还难以判断。

【在 chunhui 的大作中提到: 】
: 前面说了，如果你真的打算让ai来提高写代码的效率，那么你就不太可能把用人review代码作为工作中的一环。因为一旦你这么作了，那人就会成为瓶颈，用ai的效率就高不到哪儿去。你肯定要想办法解决去掉人才会更利用ai的好处。
--
FROM 121.199.22.*
95楼|CardEasy|2025-12-25 15:16:47|只看此ID
作为生产工具，且量上来了，感觉还是有点成本的

【在 hgoldfish 的大作中提到: 】
: 当前 AI 的成本不太需要考虑。这些 AI 公司都拼了命向用户送钱。
: 个个都巨亏。
--
FROM 159.226.43.*
96楼|z16166|2025-12-25 20:39:40|只看此ID
Galen Hunt 是微软非常有影响力的技术领袖（曾领导 Midori 操作系统项目），他提出的这个愿景确实非常大胆，甚至听起来有些“疯狂”。

要理解这件事靠不靠谱，我们需要拆解他的技术逻辑。

一、“一名工程师，一个月，一百万行”靠谱吗？
如果靠人工手动重写，这绝对是不可能的。一个顶级程序员一年能写出几万行高质量、逻辑严密的 Rust 代码就已经很了不起了。

但 Galen Hunt 这里的核心逻辑是：AI 辅助的自动化迁移。

靠谱的地方： * 内存安全转换：微软拥有海量的 C/C++ 遗留代码。很多基础库的逻辑是稳固的，主要风险在于内存管理。如果能通过工具自动识别 C++ 的内存模型（所有权、生命周期）并映射到 Rust，效率会呈几何倍数提升。

LLM 的加持：传统的“代码转代码”工具（如 c2rust）生成的代码往往很不“地道”（充满了 unsafe）。引入 AI 代理（AI Agents）可以像人类一样进行重构、添加注释、优化结构，从而实现从“机器翻译”到“智能重写”的跨越。

不靠谱（面临的挑战）：

语义鸿沟： C++ 的某些模式（如多重继承、模板黑魔法、复杂的指针算术）很难完美转换成 Rust。

正确性验证：自动生成的 100 万行代码，谁来确保逻辑 100% 正确？测试和验证的成本可能远超重写本身。

结论：这是一个**“北极星目标”**。他指的不是工程师“写”了 100 万行，而是工程师“监督、指导、审核”AI 转换了 100 万行。

二、什么是“程序码处理基础设施”和“源码的可扩展图”？
这是典型的编译器技术与大数据/AI结合的产物。

1. 程序码处理基础设施 (Code Processing Infrastructure)
这不仅是一个 IDE 或编译器，而是一套工厂流水线。它包括：

摄取层：能够处理不同构建系统（MSBuild, CMake, Bazel）的代码。

分析层：能够跨项目、跨仓库分析代码依赖。

执行层：大规模并行运行 AI 代理，对代码进行修改并自动提交 Pull Request。

2. 源码的可扩展图 (Scalable Graphs of Source Code)
这是最关键的技术名词，通常指代码属性图 (Code Property Graph, CPG) 的超大规模版本。

传统的抽象语法树 (AST)：只看得到代码的结构（如：这是一个函数）。

控制流图 (CFG) & 数据流图 (DFG)：看得到代码怎么运行，数据怎么流转。

可扩展图 (Scalable Graph)： * 全系统关联：它把整个微软的代码库（数亿行）建成一个巨大的图。如果你修改了底层的一个 C++ 指针，这个图能告诉你它会如何影响上层几千个依赖项。

AI 的“地图”： AI 代理不能只看一行代码就改一行。它需要在这个“图”里导航，理解上下文。

数学抽象：通过图算法，可以识别代码中的重复模式、漏洞路径，或者寻找最适合重构为 Rust 所有权模型的切入点。

三、总结
Galen Hunt 招人的意图很明显：他不是在招普通的程序员，而是在招“造工具的人”。

他需要的是一群懂编译器底层（把代码变成功）、懂数据库（处理海量代码图数据）、懂 AI（让 AI 能够自动化操作）的顶级专家，去开发一套能够自动吞噬 C++ 并吐出 Rust 的机器。

如果你对这个职位感兴趣，重点不在于你写 Rust 有多快，而在于你是否能理解如何通过静态分析和 AI 代理，大规模地自动化处理代码逻辑。

你想了解更多关于 C++ 转 Rust 的技术细节，或者关于代码属性图（CPG）的相关资料吗？
--
FROM 114.241.229.*
97楼|chunhui|2025-12-25 21:25:39|只看此ID
如果能搞出来这个工具，希望他能开源。
【在 z16166 的大作中提到: 】
: Galen Hunt 是微软非常有影响力的技术领袖（曾领导 Midori 操作系统项目），他提出的这个愿景确实非常大胆，甚至听起来有些“疯狂”。
: 要理解这件事靠不靠谱，我们需要拆解他的技术逻辑。
: 一、“一名工程师，一个月，一百万行”靠谱吗？
: ...................
--
FROM 221.216.159.*
98楼|heideggerr|2025-12-26 02:56:51|只看此ID
这个解释是合理的，就是LLM辅助的静态代码分析和转换，我在20年前搞程序自动化漏洞检查的时候就接触过这个东西，这实际上是非常古老的东西。

【在 z16166 的大作中提到: 】
: Galen Hunt 是微软非常有影响力的技术领袖（曾领导 Midori 操作系统项目），他提出的这个愿景确实非常大胆，甚至听起来有些“疯狂”。
: 要理解这件事靠不靠谱，我们需要拆解他的技术逻辑。
: 一、“一名工程师，一个月，一百万行”靠谱吗？
: ...................
--
修改:heideggerr FROM 123.191.92.*
FROM 123.191.92.*
99楼|lvsoft|2025-12-26 11:12:43|只看此ID
20年前的东西跟现在LLM驱动的东西，没有任何关系。
一定要说是同一个东西的话,那你和猪都是吃喝拉撒水,所以你等于猪。

【在 heideggerr 的大作中提到: 】
: 这个解释是合理的，就是LLM辅助的静态代码分析和转换，我在20年前搞程序自动化漏洞检查的时候就接触过这个东西，这实际上是非常古老的东西。
:
--
FROM 116.233.45.*