再好奇问一下,你前面讲到的感觉大部分都是工程性质的开发,就是人本身也会有确定解法的代码开发。那有没有尝试过用sonnet 3.5做类似科研探索性质的任务呢?比如说,让他给rust或ts开发一个模拟algebraic effect
的库?或者退一步,让它写一个魔改版的cpp编译器,学习rust那样强制要求raii?或者,再退一步,假设地,在js只有回调没有promise的那个年代,让它自己发明出一个类似promise的东西?
【 在 lvsoft 的大作中提到: 】
: 这个叫ai的自省能力,有这个能力的ai屈指可数。
: 不过这方面的定量评测我只有比较旧的数据,还远比不上人。
: 但我觉得claude现在是相当可以的。大部分情况下能自纠成功,少部分需要人提醒下(不是告诉他答案,仅仅是让它停下来想一想),只有极少部分自己绕不出来,通常发生在超长对话中。这个时候重开对话也能快速纠正。
--
FROM 123.120.175.*