- 主题:[转载] AI 学会新技能
人工智能让研究人员能检查当今科学仪器产生的大量数据,改变了科学实践。使用深度学习,可以从数据本身中学习,在数据的海洋中大海捞针。人工智能正在推动基因搜索、药学、药物设计和化合物合成的发展。为了从新数据中提取信息,深度学习要使用算法,算法通常是在海量数据上训练出来的神经网络。按照其分步说明,它与传统计算有很大的不同。它从数据中学习。深度学习没有传统计算编程那么透明,这留下了一个悬而未决的重要问题:系统学到了什么,它知道什么?五十年来,计算机科学家一直在试图解决蛋白质折叠问题,但没有成功。2016 年 Google 母公司 Alphabet 的人工智能子公司 DeepMind 推出了 AlphaFold 计划。利用蛋白质数据库作为训练集,该库中包含了超过 15 万种蛋白质的经验确定结构。不到五年的时间里,AlphaFold 就解决了蛋白质折叠问题,或者至少解决了其中最重要的方面:根据氨基酸序列识别蛋白质结构。AlphaFold 无法解释蛋白质是如何如此快速而精准地折叠的。这对人工智能来说是一次巨大的胜利,因为它不仅赢得了很高的科学声誉,而且是一项可能影响每个人生活的重大科学突破。
https://www.solidot.org/story?sid=71933
--
FROM 59.60.57.*
人工智能的泡泡快破了
【 在 hgoldfish 的大作中提到: 】
: 人工智能让研究人员能检查当今科学仪器产生的大量数据,改变了科学实践。使用深度学习,可以从数据本身中学习,在数据的海洋中大海捞针。人工智能正在推动基因搜索、药学、药物设计和化合物合成的发展。为了从新数据中提取信息,深度学习要使用算法,算法通常是在海量数据上训练出来的神经网络。按照其分步说明,它与传统计算有很大的不同。它从数据中学习。深度学习没有传统计算编程那么透明,这留下了一个悬而未决的重要问题:系统学到了什么,它知道什么?五十年来,计算机科学家一直在试图解决蛋白质折叠问题,但没有成功。2016 年 Google 母公司 Alphabet 的人工智能子公司 DeepMind 推出了 AlphaFold 计划。利用蛋白质数据库作为训练集,该库中包含了超过 15 万种蛋白质的经验确定结构。不到五年的时间里,AlphaFold 就解决了蛋白质折叠问题,或者至少解决了其中最重要的方面:根据氨基酸序列识别蛋白质结构。AlphaFold 无法解释蛋白质是如何如此快速而精准地折叠的。这对人工智能来说是一次巨大的胜利,因为它不仅赢得了很高的科学声誉,而且是一项可能影响每个人生活的重大科学突破。
:
:
https://www.solidot.org/story?sid=71933: ...................
--
FROM 222.129.51.*
google通过一个超大的训练数据训练了一个具有8-11岁儿童智力的AI。
不光能推理,还能给出推理过程。
但是我感觉AI是到一定瓶颈了。
因为一个8-11岁的人类儿童只需要想比较而言很小的数据量就能获得很好的认知能力。
但是AI缺需要如此大的训练集。
不知道还缺了啥.
【 在 GoGoRoger 的大作中提到: 】
: 人工智能的泡泡快破了
: 涎盗烦隼吹纳窬纭0凑掌浞植剿得鳎氪臣扑阌泻艽蟮牟煌K邮葜醒啊I疃妊懊挥写臣扑惚喑棠敲赐该鳎饬粝铝艘桓鲂淳龅闹匾侍猓合低逞У搅耸裁矗朗裁矗课迨昀矗扑慊蒲Ъ乙恢痹谑酝冀饩龅鞍字收鄣问题,但没有成功。2016 年 Google 母
: Alphabet 的人工智能子公司 DeepMind 推出了 AlphaFold 计划。利用蛋白质数据库作为训练集,该库中包含了超过 15 万种蛋白质的经验确定结构。不到五年的时间里,AlphaFold 就解决了蛋白质折叠问题,或者至少解决了其中最重要的方面:根据氨基酸序列识别蛋白质结构。Alpha
: ...................
--
FROM 223.104.24.*
很小的数据量?人类从出生开始就一直在通过五感不断的收集数据进行学习,这个数据量很小?
【 在 lokta 的大作中提到: 】
: google通过一个超大的训练数据训练了一个具有8-11岁儿童智力的AI。
: 不光能推理,还能给出推理过程。
: 但是我感觉AI是到一定瓶颈了。
: ...................
--
修改:adamhj FROM 202.109.128.*
FROM 202.109.128.*
没看到相比较这三个字?
【 在 adamhj 的大作中提到: 】
: 很小的数据量?人类从出生开始就一直在通过五感不断的收集数据进行学习,这个数据量很小?
--
FROM 223.104.24.*
我不知道google给了AI多大的数据量,我也不好衡量人类儿童从出生长到8-11岁通过各种感官获取的数据量有多大,所以我不知道怎么比较;请问你是如何确定人类儿童获得数据量相比较小?
【 在 lokta 的大作中提到: 】
: 没看到相比较这三个字?
--
FROM 202.109.128.*
但人会死,死了经验归零
AI不会死
【 在 lokta 的大作中提到: 】
: google通过一个超大的训练数据训练了一个具有8-11岁儿童智力的AI。
: 不光能推理,还能给出推理过程。
: 但是我感觉AI是到一定瓶颈了。
: ...................
--
FROM 119.131.204.*
举个例子。
历史上存在狼孩事件。
如果按你的说法,无时无刻不在接受信息对神经进行训练,那么为什么狼孩的智力跟正常人类社会的小孩智力差距那么大?那说明无时无刻接受的信息不见得对训练是有效的。这些信息对智力贡献很小。每天接触到的信息就是打猎,吃饭,睡觉,抢地盘。日复一日的重复等于是把有限的训练集拿来反复训练。数据量打,信息质量差。
人的一生,接触到的声音,视觉,触觉这些东西很难去量化。那我只能拿文本这一块去对比。
搜索一下,人一生能读1800本书,这个文本估计下来也不会超过100M吧。但是opt-175b的训练数据最大的都超过800gb了。这不说明问题么?
【 在 adamhj 的大作中提到: 】
: 我不知道google给了AI多大的数据量,我也不好衡量人类儿童从出生长到8-11岁通过各种感官获取的数据量有多大,所以我不知道怎么比较;请问你是如何确定人类儿童获得数据量相比较小?
--
FROM 223.104.24.*
数据量不够时间来凑
但是对人的教育,难以预测结果好坏。AI的训练估计也是一样,只是现在智力还不足以显示差别
【 在 lokta 的大作中提到: 】
: 举个例子。
: 历史上存在狼孩事件。
: 如果按你的说法,无时无刻不在接受信息对神经进行训练,那么为什么狼孩的智力跟正常人类社会的小孩智力差距那么大?那说明无时无刻接受的信息不见得对训练是有效的。这些信息对智力贡献很小。每天接触到的信息就是打猎,吃饭,睡觉,抢地盘。日复一日的重复等于是把有限的训
: ...................
--
FROM 119.131.204.*
我不是想反驳你的结论,我只是质疑你提出的那个前提罢了
至于你的结论我也认同;我认为现在AI的这种训练模式比起人的学习过程有三种缺陷:
1.缺乏信息的立体性:人类在学习的时候,通过的是五感同时接收信息来进行的,可以认为,每一种感官,都是一个信息的“维度”,每多一个维度,人脑能从大量杂乱信息中精确抽取有效信息的效率就更高;所以先天残障的儿童(例如失明、聋哑之类)的智力发育会比正常儿童的智力发育缓慢;
2.缺乏互动的主动性:人类的学习除了单方面的接收(例如看书、听课)外,还有通过主动行为来进行尝试、实验,例如小孩看到一个未知的东西可能会去摸一摸、捏一捏、舔一舔,一方面是更好的接收信息,一方面也是看目标对自己的行为会有什么反应,例如一个东西举起来,松手就会掉下去,这就是对“重力”的认知过程;这种学习方式是通过数据集无法获取的,必须要有一个完整的模拟环境
3.缺乏方向性的指导:人类的小孩身边经常会有父母教导,小孩做错的时候父母可以做正确的示范,然后孩子就会模仿,这无疑会大大加速小孩的学习速度;更不要说当小孩掌握一定程度语言能力后,这种教导会变的更有效,这是目前AI所缺乏的;
现在的AI,就相当于把一个残障的智能生物幼体(一般只有一维输入),天天只读书不训练,或者只能做重复性的机械训练,并且无人指导的环境里完全靠自己进行学习,简直是地狱难度..
【 在 lokta 的大作中提到: 】
: 举个例子。
: 历史上存在狼孩事件。
: 如果按你的说法,无时无刻不在接受信息对神经进行训练,那么为什么狼孩的智力跟正常人类社会的小孩智力差距那么大?那说明无时无刻接受的信息不见得对训练是有效的。这些信息对智力贡献很小。每天接触到的信息就是打猎,吃饭,睡觉,抢地盘。日复一日的重复等于是把有限的训
: ...................
--
修改:adamhj FROM 202.109.128.*
FROM 202.109.128.*