个人经常混用下来的体感。(flash靠ai studio免费,4o/sonnet 3.5 o1/3 mini靠you的混合账号)
只要你把页面拿过去,或者直接ctrl+a作为context给LLM,这之后的编码才是考验llm的逻辑的。
否则会各有侧重点的,以前不同编程语言测下来各模型的能力都有差异。
【 在 smthhz 的大作中提到: 】
: 哦,我知道4o本来编码和逻辑方面也不咋样, v3肯定也学了相关页面,编码问题不是太大主要是乱解释,比如拿同服务另一个api参数给这api,编造参数,输出前后不一致,我觉得根本不是没在知识库的问题,所以很怀疑它的能力。你这排名是都自己试过?
--
FROM 119.57.72.*