水木社区手机版
首页
|版面-新能源汽车(GreenAuto)|
新版wap站已上线
展开
|
楼主
|
同主题展开
|
溯源
|
返回
上一篇
|
下一篇
|
同主题上篇
|
同主题下篇
主题:Re: Thor 芯片有四档
whistlingMe
|
2025-05-13 15:50:59
|
…仔细读读你自己这句话是不是前后矛盾,量化了还保证不了响应时间,那不就算力不够吗
现在各家恰恰都在基于LLM做新方案…
32B的模型4bit量化,thor-x都吃力。但是32B的模型对于“世界知识”都有点不够。
现在车端算力是还差的多而不是过剩
【 在 Icanread 的大作中提到: 】
: 最后到设备上的模型都是量化稀疏化过的,压根就用不到那么大的模型,那么大的模型响应时间根本没法保证,这和llm有根本上的不同
--
FROM 124.64.22.*
上一篇
|
下一篇
|
同主题上篇
|
同主题下篇
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版