2012年谷歌提出了知识图谱技术,由此打开了认识智能的大门。截止目前,知识图谱依然被人工智能业界一致认为是最好的AI数据库。知识图谱,因其三元组的数据架构天然便于机器理解,机器读懂后即可获得认知能力,即根据已有知识推理新知识的能力。同时,今年十四五规划,三次提到人工智能(AI),并且强调下一代的人工智能应该具备学习和基础的推理决策能力。而知识图谱自然被认为是不可或缺的最核心一环。
知识图谱这个词虽然不为大众熟知,但其应用已经深入我们生活的方方面面,包括:法务,电商,教育,医疗,金融,游戏等等各个行业的龙头企业都已在构建自家的知识图谱库来提高AI的认知,从而提供更好的智能推荐,智能搜索服务。
作为AI大脑,一张有效的知识图谱是如何被构建出来的呢?我们将以《三国演义》为案例,与大家展示,一本小说是如何从书变成知识图谱的。一般而言,知识图谱的构建可以分为 6 个环节,分别是知识建模、知识存储、知识抽取,知识融合、知识计算以及知识应用。
「1」知识建模:
EpiK的三国演义领域专家,首先根据客户需求的应用方向,形成具体的框架和模型。简而言之就是基于行业的应用属性、知识特点、实际需求,依据知识图谱的模式进行业务抽象和业务建模,主要是实体定义、关系定义、属性定义。
「2」知识存储:
针对构建知识图谱设计底层的存储方式,完成各类知识的存储,包括基本属性知识、关联知识、事件知识、时序知识、资源类知识等。存储方式将直接导致查询效率和应用效果。
「3」信息抽取:
从各种类型的数据源中提取出实体、属性以及实体间的相互关系,在此基础上形成本体化的知识表达。比如说刘备是蜀国君主;诸葛亮,关羽,张飞都是蜀国的臣子;曹操和孙权分别是魏国和吴国的君主。同时还需要根据不同角度进行单独实体抽取,例如,刘备和诸葛亮,关羽,张飞是君臣关系;和曹操,孙权是敌对方。
「4」知识融合:
在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等;各方面的知识都融合了之后,刘备可以就可以象征多个身份,蜀国君主,刘婵的父亲,张飞,关羽的大哥,刘备这个成为代表不同的身份。
「5」知识计算:
对于经过融合的新知识,需要经过质量评估之后(部分需要人工参与甄别,校对),才能将合格的部分加入到知识库中,以确保知识库的质量。
「6」知识应用:
根据不同的需求,将用知识图谱来训练各自方向的智能系统,其中包括智能诊断,智能投顾,智能投保,智能招聘,智能法顾,智能搜索,深度问答,智能推荐等等一系列C端应用。
随着知识图谱技术越来越成熟和普及,新的问题正在逐步浮现。在我们以后生活越来越依赖各种智能助手时,知识图谱的好坏作为AI的大脑直接决定了AI的智能推荐是否足够公正公开。举个例子,当我们有保险和医疗的需求,如何保证AI给我们推荐的是最合适我们的,而不是竞价排名的结果。EpiK给出的解决方案是知识图谱的分布式存储,通过EpiK的协作平台所生成的知识图谱将保持永久开源,确保公开透明,同时因区块链的特性和DAO社区自治机制,让知识图谱不会被恶意篡改。
伴随区块链技术的越发成熟,去中心化 + 知识图谱取代传统的“垄断型”知识图谱俨然是大势所趋。知识图谱的构建也将从传统各自为政,做好后数据垄断的局面,变成 EpiK 提倡的共享共建共益的方式进化。而这对于大众来说,安心使用一份好的知识图谱构建的AI生活助手,也不再是难事。
EpiK Protocol 铭识协议
铭识协议致力于借助区块链技术打造一个去中心化的共建共享共益的安全可信知识图谱协作平台,通过可信存储、可信激励、可信治理和可信金融四大核心能力,以极低的管理成本组织全球知识社区用户共同协作,将人类各领域知识转化为知识图谱永久保存,开阔 AI 的认知,推动认知智能时代的到来。
合约地址:0xdaf88906ac1de12ba2b1d2f7bfc94e9638ac40c4
生态合作机构:Chainlink,清华大学大数据研究中心,Open Knowledge Foundation,OpenSLR,CSAGI,小牛思拓,面壁者数据,中软国际,DR.SEEK 等等
EPIK 官网 :https://www.epik-protocol.io/
EPIK 钱包:https://epik-protocol.io/wallet
EPIK GitHub:https://github.com/EpiK-Protocol
EPIK 微信公众号: EpiK Protocol 铭识
EPIK 微信社群:Sigrid_EpiK
TG的链接: https://t.me/EpikProtocol