- 主题:没人琢磨让大参数AI遍历一边中国古籍吗
没准能比人类多看出来点啥
--
FROM 218.249.201.*
古籍才有几个字?不够大模型吃
【 在 dragonfly112 的大作中提到: 】
: 没准能比人类多看出来点啥 ...
--
FROM 120.245.122.*
估计够大模型瞎编史书了
【 在 ericzeng 的大作中提到: 】
: 古籍才有几个字?不够大模型吃
:
--
FROM 98.164.217.*
绝逼不够
【 在 bjmvi 的大作中提到: 】
: 估计够大模型瞎编史书了 ...
--
FROM 124.64.17.*
二十四史带上注,大抵几千万字了。用Bert、GPT跑一跑差不多是够的。不过,标注团队比较难找到靠谱儿的。
【 在 ericzeng 的大作中提到: 】
: 绝逼不够
:
--
FROM 111.201.73.*
晕,大模型参数都以十亿计,几千万字就能训练出来?
【 在 molar 的大作中提到: 】
: 二十四史带上注,大抵几千万字了。用Bert、GPT跑一跑差不多是够的。不过,标注团队比较难找到靠谱儿的。 ...
--
FROM 124.64.17.*
其实 我想要个 在线搜索 史书原文的网站。。。
这应该是前置吧
【 在 dragonfly112 的大作中提到: 】
: 没准能比人类多看出来点啥
--
FROM 218.60.148.*
那是要训练一个通用模型,而且要求效果足够好,还得是跨语言的。
用二十四史训练一个入门级的,能用文言文问答中国古代史的模型,大体是够的。只要标注得当。
再加上,文言文语言上相对成熟,二十四史例题比较规范,所以总体还好……
【 在 ericzeng 的大作中提到: 】
: 晕,大模型参数都以十亿计,几千万字就能训练出来?
:
--
FROM 111.201.73.*
可以搜“语料库”,然后多看几个,有的语料库可以把搜索范围限定到某些史书。
【 在 gqzhb 的大作中提到: 】
: 其实 我想要个 在线搜索 史书原文的网站。。。
: 这应该是前置吧
--
修改:molar FROM 111.201.73.*
FROM 111.201.73.*
谷歌就能干呀
【 在 gqzhb 的大作中提到: 】
: 其实 我想要个 在线搜索&nbsp ...
--
FROM 124.64.17.*