赞。
您这里提的垂域大模型是指sft,或者rl的么?
现在一般公司做的,都是基于32b,甚至更少的吧。
这种模型能说话那肯定不行。
好比鹦鹉,经过训练也能算算术题,大家都觉得神奇,但是没人会觉得这种鹦鹉能代替计算器。
【 在 ML232 的大作中提到: 】
: 首先,先定义"大模型"。
: 目前英文语境里,其实没有"大模型"(Large Model)这个概念。大家说的大模型,其实指的都是大语言模型(Large Language Model, LLM)。
: 那为啥大语言模型能work?
: ...................
--
FROM 36.40.165.*