- 主题:谁能用简单的话说明白chatgpt的工作原理?
1.然语言处理(NLP),通过大量语言相关数据得到y = f(x)方程, 给出每个y的评分,评分最高的做为下一步输入的问题。
2.后台有一个根据互联网信息生成题库,平时训练使用,通过大量输入数据得到z=f(y),不同的y输入给出不同z的评分,评分最高的做为输出结果。
3.用户查询的时候就是x查数据库里的得分,转成z的过程。类似从知乎搜索一条记录,选取评分最高的一条回复。
【 在 phoenixhills 的大作中提到: 】
--
FROM 111.203.246.*
搜索引擎+内容组合生成
【 在 phoenixhills 的大作中提到: 】
--
FROM 125.69.45.*
谢谢认可。
Chatgpt已经是一个质的飞跃了,我们简单测试初步发现chatgpt可能解决了开放域结构化信息提取和语义分析,很惊艳。
后面全球nlp和计算语言学学术界将陷入一个尴尬的境地,因为像顶会ACL有多个session是信息提取和语义分析,以后这些session怎么办呢 chatgpt又没公开技术,那样就不能在人家基础上继续开展研究,但如果以学术界以往的成果基础上往上升,可能较长一段时期内怎么做又比不过chatgpt的效果,这就很尴尬。
另外,因为我只关注这两个方面,我的直觉是这两个方面做好了,ACL的其他session的方向也会迎刃而解,也就是其他方向也面临着同样的尴尬境地。
另外,我的感觉是如果chatgpt把他的核心技术能转移到计算机视觉再有一个提升,然后结合波士顿动力机器人,
估计不久的将来,可能大街上会有不少独立行动,行动自如的机器人,还可以和人正常交流。像机器人作为战斗力强的士兵也可能是不难的了。
限于我的认知我就考虑到这些。估计很多行业都会面临重大变革,可能真是一次行业革命开始了。质的人工智能时代真的到来了。
国内确实得抓紧了。重点是企业公司啊,要说学术界,那看看美欧的学术界如何针对chatgpt的到来。学术界对学术界,产业界企业对产业界企业,我认为还是这样比较好。你不能说英伟达如果卡脖子的话,就直接赖国内学术界,只能间接,而间接只有一点就是去了产业界企业公司的人才学术界培养的不到位,然而显然卡脖子的因素不止这个吧。
另外,国内都在说chatgpt数据过硬,我的感觉是这绝对是误导,绝对是有除数据之外的关键核心技术的,重量级的,划时代的,而因为不公开这部分当然是最难的。
再就是,不要吹牛皮,也不要妄自菲薄,就像杨立昆都参不透chatgpt,就像谷歌不也是翻车了。还是真诚一点,实事求是,踏踏实实。
【 在 donkeymeat 的大作中提到: 】
: 你是懂的。
: Chatgpt这个创造价值的工具,无论从哪个角度,也不可能公开。
: 就弄几篇论文,让你们猜去吧。
: ...................
--
修改:cst12345 FROM 61.156.119.*
FROM 61.156.119.*
嗯你是专家
数据集过硬也有一定的道理
从另一个角度看来 强化学习 加 人类交互 还是为了增加数据样本量 另外在损失函数上可能更合理
不过nlp的数据集可是比图像数据集大了多少量级 而且用法很多 能够交互 图像很难
所以一时半会在视觉上可能不会有很大进展 当然这不是理论上的问题
- 来自 水木社区APP v3.5.6
【 在 cst12345 的大作中提到: 】
: 谢谢认可。
: Chatgpt已经是一个质的飞跃了,我们简单测试初步发现chatgpt可能解决了开放域结构化信息提取和语义分析,很惊艳。
: 后面全球nlp和计算语言学学术界将陷入一个尴尬的境地,因为像顶会ACL有多个session是信息提取和语义分析,以后这些session怎么办呢 chatgpt又没公开技术,那样就不能在人家基础上继续开展研究,但如果以学术界以往的成果基础上往上升,可能较长一段时期内怎么做又比不过chatgpt的效果,这就很尴尬。
: 另外,因为我只关注这两个方面,我的直觉是这两个方面做好了,ACL的其他session的方向也会迎刃而解,也就是其他方向也面临着同样的尴尬境地。
: 另外,我的感觉是如果chatgpt把他的核心技术能转移到计算机视觉再有一个提升,然后结合波士顿动力机器人,
: 估计不久的将来,可能大街上会有不少独立行动,行动自如的机器人,还可以和人正常交流。像机器人作为战斗力强的士兵也可能是不难的了。
:
: 限于我的认知我就考虑到这些。估计很多行业都会面临重大变革,可能真是一次行业革命开始了。质的人工智能时代真的到来了。
:
: 国内确实得抓紧了。重点是企业公司啊,要说学术界,那看看美欧的学术界如何针对chatgpt的到来。学术界对学术界,产业界企业对产业界企业,我认为还是这样比较好。你不能说英伟达如果卡脖子的话,就直接赖国内学术界,只能间接,而间接只有一点就是去了产业界企业公司的人才学术界培养的不到位,然而显然卡脖子的因素不止这个吧。
:
: 另外,国内都在说chatgpt数据过硬,我的感觉是这绝对是误导,绝对是有除数据之外的关键核心技术的,重量级的,划时代的,而因为不公开这部分当然是最难的。
:
: 再就是,不要吹牛皮,也不要妄自菲薄,就像杨立昆都参不透chatgpt,就像谷歌不也是翻车了。还是真诚一点,实事求是,踏踏实实。
--
FROM 114.249.220.*
谢谢夸奖,:),不是专家,就一般人。
另外,你说的突然又让我想补充一下,就是机器语言理解和交互如果有一个三维真实世界的基础,会很不错,再就是机器人如果天天在街上溜达交流等,这种真实世界的感知或者感知形成的数据对于语言理解和人工智能有很好地迭代作用。
奥,再就是我个人感觉和认为对于人工智能和计算机学术界人才培养来说,沁在学术氛围中发表多篇高质量论文的学生即使到产业界高科技公司企业要比大部分时间在做工程凑合几篇论文毕业的学生来说竞争力大,估计还会大很多。
【 在 donkeymeat 的大作中提到: 】
: 嗯你是专家
: 数据集过硬也有一定的道理
: 从另一个角度看来 强化学习 加 人类交互 还是为了增加数据样本量 另外在损失函数上可能更合理
: ...................
--
修改:cst12345 FROM 61.156.119.*
FROM 61.156.119.*
没啥讲得清讲不清的,ai时代代码不重要,算法不重要,模型不重要,超参不重要,精度也不重要。
基本上就没啥重要的东西。
openai也不可能毫无征兆凭空搞出一个完全不同的,颠覆性的东西。
gpt路线本身就是openai一直在不被看好的情况下一路坚持过来的,没理由杜撰个什么新的神奇的玩意。
要说他们没有公开的东西,大概就是里面各种训练的技巧。ai这玩意有点玄学,能不能训出来也是要有点运气+本事的。
但这玩意对大厂也不构成什么门槛。
【 在 donkeymeat 的大作中提到: 】
: 没人能讲得清楚,除非你有代码。
: 双向预测理论上都会说,肯定比单向好啊,信息多。
: 这就是算法的魅力,谁也抄不到。哈哈。
: ...................
--
修改:lvsoft FROM 180.111.24.*
FROM 180.111.24.*
咋办?凉拌啊。
顶会本来就是第二梯队。
第一梯队本来就是大厂。
别说几个小众领域的session了,很多本来日子过的还不错的startup都直接凉凉了。
比如grammarly,估值130亿刀了,chatgpt一出直接就得暴毙,他们能找谁说理去啊?
另外我不认为google翻车了,google只不过是打不赢一场非对称战争而已。
bing的搜索份额只有3%,google可是超过90%,连bing都要申请制而不是直接开放公众使用,可想而知以现在的成本,google根本就负担不起每次搜索都用llm去搞。
就算负担得起,也会极大的损失利润(分析师推算会损失70%以上的利润)。而bing就很简单,只要能捅死google就行。这才是为啥google会code red的缘故,压根就不是什么技术层面的问题。
【 在 cst12345 的大作中提到: 】
: 谢谢认可。
: Chatgpt已经是一个质的飞跃了,我们简单测试初步发现chatgpt可能解决了开放域结构化信息提取和语义分析,很惊艳。
: 后面全球nlp和计算语言学学术界将陷入一个尴尬的境地,因为像顶会ACL有多个session是信息提取和语义分析,以后这些session怎么办呢 chatgpt又没公开技术,那样就不能在人家基础上继续开展研究,但如果以学术界以往的成果基础上往上升,可能较长一段时期内怎么做又比不过chatgpt的效果,这就很尴尬。
: ...................
--
修改:lvsoft FROM 180.111.24.*
FROM 180.111.24.*
chatgpt能用来炒股吗?
【 在 lvsoft 的大作中提到: 】
: 简单的说,nlp领域,自从诞生了transformer之后,就是gpt和bert相爱相杀的两条路线之争。
: gpt是单向的预测,也就是给你上文让你写下文。
: bert是双向预测,也就是随机挖掉一部分让你做完形填空。
:
: bert的任务更为简单,同等参数规模下也比gpt好。大家
: ..................
--
FROM 221.220.60.*
如果对人类负责任的话,现在知道也不能说吧,否则如果大家都知道了,地球会大乱。
【 在 phoenixhills 的大作中提到: 】
--
FROM 221.219.102.*
问题是人也到不了100,自动驾驶出问题会出人命,ChatGPT出问题没多大事
【 在 churchmice 的大作中提到: 】
: 但是深度学习这种玩意咋可能稳步提升呢?
: 机器从0到90很容易,但是从90到100很难或者说几乎不可能
: 没有理论的支撑,训练数据再多都没用,参考几年前的自动驾驶,那个时候也以为只要一直喂数据就行了,结果呢?现在只敢号称辅助驾驶了,更有人开始鼓吹车路协同了。
: ...................
--
FROM 111.197.105.*