就算跟人沟通,也会说不清楚听不明搞不对的情况。也不完全是ai的问题。你这个如果做出来,就相当于一个编码智能体了。不止可以用来对比测试。
可以让不同的模型互相验证,或者一个负责写代码,一个负责测试。再或者,可以限定一下工作内容程序的种类,它可能做得更容易。比如仅限于一句话生成gui类的,小程序类的,算法类的。
【 在 lvsoft 的大作中提到: 】
: 现在claude还是会钻牛角尖,如果不敲打它,它会在一个问题上兜来兜去兜很久。
: 打破这个循环的方法也很简单,我就是在这个时候告诉他你钻牛角尖了,让它跳出来先分析下。或者让它专注第一个问题,或者让它先打下log再说。然后它就能把问题解决了。
: 但关键是,如果你问它,他自己也会明白自己在绕圈子,也知道应该专注,应该打log。按理说它应该是可以自省自动解决掉的。我是感觉它距离100%完全自动化就差这么一点点的一步之遥,这可能只是cursor内部的提示词的再调教下的事。
: ...................
--
FROM 111.196.128.*