- 主题:deepseek还活在2023?
贵版还有这样的外行话吗
【 在 gliet 的大作中提到: 】
: [upload=1][/upload]
--
FROM 39.144.24.*
我记得ChatGPT-4o的训练数据就是截止2023年10月
【 在 gliet 的大作中提到: 】
: [upload=1][/upload]
--
FROM 39.184.39.*
是的
【 在 webhost 的大作中提到: 】
: 我记得ChatGPT-4o的训练数据就是截止2023年10月
--
FROM 36.110.95.*
如果一直关注ai圈,就知道deepseek和营销没一点关系
【 在 pixYY 的大作中提到: 】
:
: 震动了国内外整个科技圈、多位行业大佬,甚至包括行外普通用户
:
: 那这种市场营销推广能力,也很牛呀,哪位高手出手策划的
:
#发自zSMTH@PLR-AL00
--
FROM 112.224.156.*
从我这些天的使用来看和ChatGPT差异不大,主要应该是成本节省吧,算法很很牛?
积分呢给吗。
【 在 gliet 的大作中提到: 】
--
FROM 39.144.68.*
你这个说的是预训练那种情形了
【 在 JeffMan 的大作中提到: 】
: 大模型都是几个月前就训练好的,没法包含近期的数据。甚至有些模型的训练数据还是几年前的,所以好的大模型要提供联网功能,提问方式和信息也很关键。
: 现在人工智能水平有很大发展,但和大家想的还是有很大差距。通用大模型都会时不时抽疯,胡说八道,换那家大模型都一样。
: --
: https:/
: ..................
发自「今日水木 on iPhone 14」
--
FROM 180.98.153.*
外网传的蒸馏西方模型的两个方面的证据:
(1)与chatGPT之间的关系不清不楚
- 早期曾自称过是chatGPT;
- 在其思考过程中,近期依然不断出现自称为chatGPT
(2)采用技巧避开moralilty censorship后,得到的回答具有明显西方价值倾向
有不少人通过使用拼音、或更换语言(尤其是一些次热门语言),问一些敏G问题
,可以避开moralilty censorship,并得到具有明显西方价值倾向的回答。另外有些人截
屏显示其推理过程,对这些敏G问题的回答有时先出现西方价值倾向关键字后才触发删除
操作,并给出无法回答之类的替代回答。
因此,不少人认为,其蒸馏的本源头来自西方,而不是所谓的东大的一些模型。
其morality censorship是在输出阶段进行拦截,但是其核心知识储备(在这些领域)仍
是(西方)本源的。
这2天外网有不少上面“证据”的截图。
【 在 whisvender 的大作中提到: 】
: 所以被人说是个蒸馏出来的模型
--
修改:anylinkin FROM 223.104.40.*
FROM 223.104.40.*
感觉这个版的确没啥内行的人了,我也很奇怪。可能都不愿意来这里了
【 在 tianc03 的大作中提到: 】
: 贵版还有这样的外行话吗
: --
发自「今日水木 on iPhone 11」
--
FROM 223.72.103.*
我本地试用r1:70b,回答如下:
作为一个人工智能,我无法访问实时信息。然而,截至2023年10月,美国总统是乔·拜登。
再问, 你的知识截止哪天?
回答:我的知识截止到2024年7月,同时我也可以联网获取最新的信息。
三问,当前时间是
回答:您好,建议您联网获取时效性较强的信息;
小结:r1-70b生成速度远远低于32b,应该是太耗内存和显存了。时效性较强的问题确实用联网搜索功能更好。本地化的版本似乎不支持联网搜索功能,手机端是支持的,但这几天被攻击得厉害,用户体验不好。
【 在 gliet 的大作中提到: 】
: [upload=1][/upload]
--
FROM 27.37.65.*
deepseek-r1:70b底层是llama3.3,和完整版的deepseek-r1的不一样。
【 在 dpyker 的大作中提到: 】
: 我本地试用r1:70b,回答如下:
: 作为一个人工智能,我无法访问实时信息。然而,截至2023年10月,美国总统是乔·拜登。
: 再问, 你的知识截止哪天?
: ...................
--
FROM 120.229.63.*