从2012年谷歌正式提出“知识图谱”概念,并应用到实际场景中后,全世界提供知识服务和需要知识服务的人都逐渐知道了“知识图谱”。“知识图谱”的构建者也是服务的供应者如雨后春笋般,借助着“人工智能”的东风,遍地开花。
一时间,“知识图谱”概念在业内炒得火热。但是,这其中很多人实际上是一头雾水,既不了解什么是“知识图谱”,更不清楚“知识图谱”究竟有什么用。
服务提供者为了增加“知识图谱”的神秘感或者营造一种“高大上”的氛围,总是点到为止,不讲通透,或许是人家真的讲不通透。潜在使用者多数不是人工智能专业领域的技术人员,而是以业务部门的人员为主,所以很多人不解究竟什么是知识图谱,对自己的能有什么帮助,多数会问应用场景的问题。
所以我这次就想用大白话来讲一讲“知识图谱”,让用户看明白的“知识图谱”才是真正的“知识图谱”。
不出意外,大家都上过学,应该知道同样的老师,同样的课堂环境,同样的时间,不同的学生学习效果不同。这是为什么?肯定很多人会说学习好的学生都有方法。没错,但是是什么方法呢?学习好的学生会告诉你,他的方法就是把学过的知识串联起来了,当遇到一个问题时他能够快速找到解决问题都用到哪些知识,这些知识怎么关联到一起来解决问题。而学习差的学生,则是学了这一节,忘了上一节,脑子里的知识都是孤立的,1 1=2和2 2=4在他们的脑子里是不存在关系的,所以他们就无法推断出3 3=6.
所以总结一下,学习好的学生是因为在他们的脑子里知识实现了“结构化”,也就是知识之间存在联系,形成了一张张知识关系网络。学习差的学生是因为在他们的脑子里知识没有结构化,是一个个孤零零的“点”,无法关联应用。
知识图谱就是知识结构化的结果,就是存在关联性的知识建立起的知识关系网络,讲到这里,大家首先应该相信知识图谱对我们是有用的。需要强调,这里的知识不只是上学时课本上的知识,确切的说应该是对我们个人有用的信息。所以,同一个信息,对张三有用,那么这个信息对张三来讲就是知识,对李四没用,那么这个信息对李四来讲就不是知识。可见,知识是存在个性化的,同理知识图谱也具备个性化特征。
知识图谱是知识关系网络,那么它究竟长什么样子呢?
其实从“知识图谱”或者“知识关系网络”这两个词,我们就可以想象到它的形态,没错,就是网状图形态,而按照现有的视觉技术,可以设计出丰富多样的网状图形态,它们都可以是知识图谱,只是变了个样子而已。就如同小明可以穿各种衣服,但他还是小明,只是换了一种装扮而已。
知道了什么是知识图谱,知识图谱长什么样,那么是不是还想知道知识图谱怎么来的?
还拿小明举例子,小明最初形态是按照生物原理,一个卵子从成千上万的精子中找到一个最合适的精子,然后结合在一起形成的受精卵。知识图谱呢,就是按照既定规则,从一个知识点发起,然后从成千上万的数据中找到与之关联的其他知识,结合在一起生成一张专业化个性化的知识关系网络,这张关系网络在不同的人那里会具备不同的性能和作用。
那么知识图谱对于我们究竟有什么用呢?
上学时总会听到老师告诉学生,我们要把厚厚的课本读薄。什么意思?其实是告诉学生课本里的“字”并不是需要我们都要去记住,我们需要从中提炼出有用的核心知识,就如同做阅读理解提炼中心思想一样,要把核心内容提炼出来,剩下的内容可以扔在一边。不过光提炼还不够,还要形成知识脉络,学会运用。比如在学习二元一次方程前为什么要先学习一元一次方程,因为后者是前者的基础,二者存在脉络关系。知识图谱就可以帮助我们第一实现知识量级降维,即从数据海洋中提炼出可以为我所用的知识,第二实现脉络梳理,即将知识之间的关系梳理出来,供我参考、分析、推理、查询,即将知识量化降维,并梳理关系支持各种应用需要。这就是知识图谱最基础最具概括性的作用。
知识图谱的应用极其广泛,最后举几个具体栗子:
1. 线索推断,比如锁定了犯罪嫌疑人,那么我可以通过该犯罪嫌疑人的知识图谱(社会关系网)来推断他可能的行踪,又如医学病理推断,想找到病理之间的联系,找到病因所在,就可以借助医学知识图谱实现;
2. 风险预测,根据以往风险引发的事故数据,可以生成风险事故知识图谱,然后找找到与事故存在较多关联的风险有哪些,提前做出风险预测和防范;
3. 行业分析,将整理好的行业数据进行统一加工处理,生成行业知识图谱,从中可以提炼出每个行业的发展情况和时间走势等;
4. 学科服务,帮助学校的优势学科实现知识梳理和挖掘,结合精准检索,提升优势学科教学效果;
5. 个性推送,根据用户行为,可以生成并不断完善用户画像知识图谱,以此为依据,对用户进行知识的个性化推送;
6. 精准检索,同样结合用户画像知识图谱,可以显著提升知识检索的准确性和完整性,过滤掉无关信息,做到有关知识不遗漏;
7. 设备维保,通过对以往设备维保数据的分析处理,构建设备性能、维护和保养知识图谱,既可以梳理出设备常见故障及原因,还可提供有针对性的维保方案;
8. 知识分类,基于广义知识图谱,可以将分类对象实现量化降维,进而按照自有知识体系进行知识分类;
9. 素材提取,在写各种常用文章时,我们习惯于从各处搜集资料,然后复制粘贴到文档中,再进行语言组织理顺,搜集资料的过程其实就是从大量的信息中提取素材的过程,纷繁复杂,现在可以借助广义知识图谱来实现素材的自动提取;
10. 写作选题,不论是科研还是学术还是文学,在写作时均需要选择一个适合自己的角度作为着眼点,这个时候通过本领域的知识图谱就可以自动梳理出一个详细的领域细分关系图,将领域从不同的视角进行描述和呈现,这样就为写作选题提供了参考;
11. 相似性分析,比如在招投标中,可以基于投标文件知识图谱对当前投标文件进行理解,进而给出文件之间的相似度,可以有效识别串标等不规范行为;
12. 人-知识关联,为了鼓励企业成员积极将个人的经验知识转化为电子文档,实现知识共享和传承,企业会设立奖励机制,但是为确保奖励的公正性,就可以通过企业内部知识图谱来统计出员工在各个领域的知识贡献度,作为知识奖励的决策依据;
13. 智能问答,通过构建专业领域的知识图谱,可以实现知识推理,并将推理转化为问答形式,当用户输入问题时,系统自动给出答案。
借此机会,欢迎终端客户或渠道伙伴畅聊合作,可添加微信交流
--
FROM 101.41.245.*