哦,我知道4o本来编码和逻辑方面也不咋样, v3肯定也学了相关页面,编码问题不是太大主要是乱解释,比如拿同服务另一个api参数给这api,编造参数,输出前后不一致,我觉得根本不是没在知识库的问题,所以很怀疑它的能力。你这排名是都自己试过?
【 在 haili (人尔有窍 风吹为籁) 的大作中提到: 】
: 这只是恰好4o训练到了你对应的API网页呗,或者它见的代码库里面调用这个版本API比较多,恰好学到了。
:
: 拿单个例子测试没啥意义,多用就知道了。单纯编码问题,不要求推理,还是 sonnet 3.5 > v3 > 4o >=gemini-pro exp/flash = qwen-coder-32B
:
--
FROM 106.9.106.*