Re: Deepseek-R1：8b VS LLAMA3.2：3b实际代码比较 (转载)

水木社区手机版

展开|楼主|同主题展开|溯源|返回

上一篇|下一篇|同主题上篇|同主题下篇

主题:Re: Deepseek-R1：8b VS LLAMA3.2：3b实际代码比较 (转载)
foxknox|2025-01-26 08:26:56|
确实，感觉喂的语料里面垃圾太多了造成的！

LLM的训练并不是数据越多越好，而是高质量的数据越多越好！垃圾数据太多只能训练个傻子出来！

【在 lvsoft 的大作中提到: 】
: 我接入了deepseek的官方api，然后刚才我忽然冒出来的突发奇想的点子，刚准备和claude 3.5 sonnet聊聊的时候有想到可以拉上r1一起对比下看看效果。
: 结果这完全没法用，r1基本就是在胡说八道。
: 我只截取了最后一段，但前面r1的回答比这个更离谱...
: ...................
--
FROM 36.161.235.*

上一篇|下一篇|同主题上篇|同主题下篇

BYR-Team©2010. KBS Dev-Team©2011 登录完整版