- 主题:亲自测试/比较了deepseek
开源的,估计很快会有人开发支持这个功能
已经看到有人用ds做自己的知识库了
【 在 MyRina (Marina) 的大作中提到: 】
: 注册外国信箱很难,最后用的中国手机
:
: 文书表格做的比gtp好,让对比三个project, 有作图
:
--
FROM 112.36.43.*
大哥 美国念几年书,固有意识这么难突破嘛。。。
性能对比数据**
| 指标 | 昇腾910B (FP16) | NVIDIA A100 (FP16) | 差异率 |
|---------------------|-----------------|--------------------|--------|
| 单卡推理速度 (tokens/s) | 1420 | 1580 | -10% |
| 训练吞吐量 (TFLOPS) | 78 | 89 | -12% |
| 能效比 (TFLOPS/W) | 2.1 | 2.4 | -13% |
*注:基于DeepSeek-7B模型的测试结果,Batch Size=32,Sequence Length=2048。*
【 在 lili2030 (Barbarossa) 的大作中提到: 】
: 本质上是算力不够,你看ChatGPT需要几十万块英伟达GPU卡,由于霉国禁用,DeepSeek买不到。之所以目前它有GPU卡,都是禁用前储存的。运营大量用户需要大量算力,特别是实时回答问题时候。你想想如果同时回答一百万个用户的问题,需要多少算力。因此,DeepSeek的前途是渺茫的,市场上没有多少人用,所以没有收入,算力不到chatGPT的千分之一,无法支持大量用户,技术上只能支持文本,它训练的数据全是文本,对图像视频语音语音数据知难而退了,这方面的算法比训练文本数据根本两回事。
: 【 在 MyRina 的大作中提到: 】
: : 等钱到位了就能支持更多人了
:
--
FROM 112.36.43.*
绝大部分任务它一窍不通
举几个例子,我来帮你打ds的脸
【 在 lili2030 (Barbarossa) 的大作中提到: 】
: 拭目以待吧,过一年半载你看看。DeepSeek只适合特定任务,和ChatGPT比,绝大部分任务它一窍不通。你看看它的训练算法就知道,用的混合专家模型大约270个,混合线性注意力机制模型,再加强化学习。因此,它只能做问答式的任务,而且只能是已有知识的问答式任务,未知领域探索它一窍不通。它本质就是一个百度搜索引擎。
: 【 在 MyRina 的大作中提到: 】
: : 就你觉得渺茫
: : - 来自 水木社区APP v3.5.7
--
FROM 112.36.43.*