- 主题:请问用什么方法评价训练的DS模型
训练出来个DS的模型,想问一下,用什么评价指标来度量效果。
--
FROM 106.37.220.*
你能训练出来一个DS的模型,已经是这里的top1%
没有相应的评价指标?
可以从你训练的目标出发来评价,和训练前的比较
比如你要用来写作,同样的prompt测试
【 在 CCS2011 的大作中提到: 】
: 训练出来个DS的模型,想问一下,用什么评价指标来度量效果。
--
FROM 115.199.109.*
顺道问一下网上下载的671版本的ds模型,是经历了什么阶段的
是在预训练和微调之前的的,还是之后的
不知道lz说的训练是采用什么方式
【 在 Bruce12 的大作中提到: 】
: 你能训练出来一个DS的模型,已经是这里的top1%
: 没有相应的评价指标?
: 可以从你训练的目标出发来评价,和训练前的比较
: ...................
--
FROM 223.104.41.*
我是甲方,想用客观量化标准去度量
【 在 Bruce12 的大作中提到: 】
: 你能训练出来一个DS的模型,已经是这里的top1%
: 没有相应的评价指标?
: 可以从你训练的目标出发来评价,和训练前的比较
: ...................
--
FROM 220.194.10.*
各种评测工具呗,各家大模型不是也是用各类评测工具测试的么?看看网上怎么量化比较DS的。
没有完全客观量化的标准,各个工具的打分也不一样。一般也就取个结果平均或怎样的。
【 在 CCS2011 的大作中提到: 】
: 我是甲方,想用客观量化标准去度量
--
FROM 166.111.35.*
请问DS 70B用什么工具?或者千问用什么工具?
【 在 dukenuke 的大作中提到: 】
: 各种评测工具呗,各家大模型不是也是用各类评测工具测试的么?看看网上怎么量化比较DS的。
: 没有完全客观量化的标准,各个工具的打分也不一样。一般也就取个结果平均或怎样的。
:
--
FROM 106.37.220.*