deepseek还活在2023？

水木社区手机版

主题:deepseek还活在2023？
10楼|tianc03|2025-01-30 12:55:38|只看此ID
贵版还有这样的外行话吗
【在 gliet 的大作中提到: 】
: [upload=1][/upload]
--
FROM 39.144.24.*
11楼|webhost|2025-01-30 14:21:31|只看此ID
我记得ChatGPT-4o的训练数据就是截止2023年10月
【在 gliet 的大作中提到: 】
: [upload=1][/upload]
--
FROM 39.184.39.*
12楼|gliet|2025-01-30 14:23:27|只看此ID
是的

【在 webhost 的大作中提到: 】
: 我记得ChatGPT-4o的训练数据就是截止2023年10月
--
FROM 36.110.95.*
13楼|chrstl|2025-01-30 16:58:47|只看此ID
如果一直关注ai圈，就知道deepseek和营销没一点关系

【在 pixYY 的大作中提到: 】
:
: 震动了国内外整个科技圈、多位行业大佬，甚至包括行外普通用户
:
: 那这种市场营销推广能力，也很牛呀，哪位高手出手策划的
:

#发自zSMTH@PLR-AL00
--
FROM 112.224.156.*
14楼|VaporTrail|2025-01-30 18:00:04|只看此ID
从我这些天的使用来看和ChatGPT差异不大，主要应该是成本节省吧，算法很很牛？
积分呢给吗。

【在 gliet 的大作中提到: 】
--
FROM 39.144.68.*
15楼|happyxjh|2025-01-30 18:02:39|只看此ID
你这个说的是预训练那种情形了
【在 JeffMan 的大作中提到: 】
: 大模型都是几个月前就训练好的，没法包含近期的数据。甚至有些模型的训练数据还是几年前的，所以好的大模型要提供联网功能，提问方式和信息也很关键。
: 现在人工智能水平有很大发展，但和大家想的还是有很大差距。通用大模型都会时不时抽疯，胡说八道，换那家大模型都一样。
: --
: https:/
: ..................

发自「今日水木 on iPhone 14」
--
FROM 180.98.153.*
16楼|anylinkin|2025-01-30 18:17:02|只看此ID
外网传的蒸馏西方模型的两个方面的证据：

（１）与chatGPT之间的关系不清不楚

　　　－　早期曾自称过是chatGPT；

　　　－　在其思考过程中，近期依然不断出现自称为chatGPT

（２）采用技巧避开moralilty censorship后，得到的回答具有明显西方价值倾向

　　　有不少人通过使用拼音、或更换语言（尤其是一些次热门语言），问一些敏G问题
，可以避开moralilty censorship，并得到具有明显西方价值倾向的回答。另外有些人截
屏显示其推理过程，对这些敏G问题的回答有时先出现西方价值倾向关键字后才触发删除
操作，并给出无法回答之类的替代回答。

　　　因此，不少人认为，其蒸馏的本源头来自西方，而不是所谓的东大的一些模型。
其morality censorship是在输出阶段进行拦截，但是其核心知识储备（在这些领域）仍
是（西方）本源的。

　　　这２天外网有不少上面“证据”的截图。

【在 whisvender 的大作中提到: 】
: 所以被人说是个蒸馏出来的模型
--
修改:anylinkin FROM 223.104.40.*
FROM 223.104.40.*
17楼|cddc|2025-01-30 18:50:56|只看此ID
感觉这个版的确没啥内行的人了，我也很奇怪。可能都不愿意来这里了
【在 tianc03 的大作中提到: 】
: 贵版还有这样的外行话吗
: --

发自「今日水木 on iPhone 11」
--
FROM 223.72.103.*
18楼|dpyker|2025-01-30 19:18:15|只看此ID
我本地试用r1:70b,回答如下：
作为一个人工智能，我无法访问实时信息。然而，截至2023年10月，美国总统是乔·拜登。

再问，你的知识截止哪天？
回答：我的知识截止到2024年7月，同时我也可以联网获取最新的信息。

三问，当前时间是
回答：您好，建议您联网获取时效性较强的信息；

小结：r1-70b生成速度远远低于32b,应该是太耗内存和显存了。时效性较强的问题确实用联网搜索功能更好。本地化的版本似乎不支持联网搜索功能，手机端是支持的，但这几天被攻击得厉害，用户体验不好。

【在 gliet 的大作中提到: 】
: [upload=1][/upload]
--
FROM 27.37.65.*
19楼|ArchLinux|2025-01-30 21:48:05|只看此ID
deepseek-r1:70b底层是llama3.3,和完整版的deepseek-r1的不一样。

【在 dpyker 的大作中提到: 】
: 我本地试用r1:70b,回答如下：
: 作为一个人工智能，我无法访问实时信息。然而，截至2023年10月，美国总统是乔·拜登。
: 再问，你的知识截止哪天？
: ...................
--
FROM 120.229.63.*