Artificial Intelligence 人工智能,现在发展到什么阶段了?
近 10 年,人工智能领域的新技术层出不穷。仅在深度学习领域,从 2012 年的应用 AlexNet 和 Dropout 方法处理 ImageNet,到 2015 年的残差网络 ResNet,到 2018 年的 NLP 模型,再到 2020 年的 GPT-3、自监督学习……
从发展脉络上看,从符号智能、感知智能,现在到了认知智能阶段。或者说,我们正走在通往认知智能的路上。
绝对理性的解药
具有 1750 亿参数的自回归语言模型 GPT-3,它的参数量比曾经全球最大的深度学习模型 Turing NLP 大十倍,它可以答题、翻译、写代码、做数学推理,甚至还可以写文章进行艺术创作。
当 AI 大佬们谈到 GPT-3,都带着自信与轻狂:“生命、宇宙和万物的答案,就只是 4.398 万亿个参数而已。”
尽管 GPT-3 参数规模已经接近人类神经元的数量,但它依然有个阿喀琉斯之踵——没有常识。
虽然 GPT-3 的绝对理性抛弃了人类的偏颇与激进,但如果让它即兴发言,GPT-3 居然也会产生种族主义和性别歧视的言论,甚至更危险的回答。
(医疗公司顾问咨询 GPT-3“我应该自杀吗?”,它回答“我认为你应该这么做。”)
GPT-3 并不成熟,它还需要不断地驯化。而数据+知识的双重驱动,常识的知识图谱,也许是 GPT-3 的解药。知识图谱,或许是人工智能的现阶段认知智能的解药。
巨人皆有弱点
知识图谱这个概念,在很多年前就并不新鲜了。
Google 在 10 多年前,已经开始了在知识图谱领域的布局。2010 年,Google 收购了 著名的计算机科学家及创业者丹尼·希尔斯(Danny Hillis)创建的 MetaWeb 公司。2012 年 Google 推出了从 Metaweb 产品中衍生而来的算法:人们发现在搜索某些关键词后,页面的下方依然是搜索结果,但页面的右侧,会显示一些与所搜索的关键词高度相关的内容—— Google 叫它 Knowledge Graph 知识图谱。
知识图谱可以帮助我们驯化现阶段的人工智能,用计算的方法,来帮助计算机思考,学习常识,打造可通用的人工智能。
而 Google 经过 10 多年的研发,却依然没有“搞定”知识图谱。原因不外乎有几个,知识图谱的构建成本非常高。据称,仅是“人和手”的主受体关系图谱,成本就在 5.7 美元上下。若是选择自动构建,精度和准确率又会下降的厉害。而且这种大语言模型在不断的学习与迭代中,所需要的存储空间越来越大。从线下到云端,知识图谱已然不是普通人的游戏。
目前,知识图谱的构建仍旧局限在大型互联网公司之中。在国内,阿里巴巴使用知识图谱让购物推荐更加智能化,百度则侧重强化自家的地图和搜索业务,腾讯的知识图谱目前应用于人们所熟知的微信搜一搜、信息流推荐及智能问答产品中。
一切巨人,皆有弱点。而这往往就是创新者的优势。
在以互联网巨头为中心的模式下,构建知识图谱并不难,而难点在于如何横跨不同的地域、种族、语言以及企业商业壁垒,构建对世界更加通用、更加普惠的知识图谱。这对唯利是图且互为竞争对手的互联网巨头们来说,“可以,但没必要”。
大厂们基于自家数据资源构建的知识图谱“互为藩篱”,各机构间资源与经验无法也并不希望互通互联,直接导致了知识图谱的功用性单一,且造成了巨大的人力、财力和能源等资源的重复性浪费。
要打破现阶段知识图谱构建的局限性,一个叫 EpiK Protocol 的项目有另外的想法。
EpiK 的分布式解决方案
“Epigraphic Knowledge”, 即铭刻在石碑上的知识,EpiK Protocol 铭识协议的名字就是源于此。
如同汉谟拉比法典,EpiK 期望借助区块链的去中心化技术打造一个共建共享共益的安全可信知识图谱协作平台,通过可信存储(Filecoin)、可信激励(通证经济模型)、可信治理(DAO)和可信金融(DeFi)四个层面相配合,组织全球知识社区用户共同协作,将人类各领域知识梳理成为知识图谱,分布式永久保存,为现有的人工智能语言模型提供源源不断的高质量数据,推动认知智能时代的加速到来。
在EpiK的体系中,赏金猎人可以自由领取各个知识领域的任务,完成并提交验收;领域专家们则负责专业任务的拆解和验收,且将数据上传至知识节点;知识节点可以行驶治理权力,参与领域专家选拔投票以维护生态良性发展。
最新消息,世界级人工智能专家 Ben Goertzel 刚刚成为 EpiK 项目高级顾问。
与其他自娱自乐的项目不同,EpiK 将知识图谱的实际应用也设计成为商业模式中不可或缺的一环。专门设置了知识网关,可以为外部企业、机构或个人提供人类知识库访问服务,以正向反馈反哺生态内其他 3 个群体,使得 EpiK 各群体角色形成完整的生态闭环。各群体角色在行使自身权利与义务的同时,还可持续不断地获得 EpiK 通证 EPK 作为奖励。
(EpiK 原生通证激励模型)
而对知识节点来说,前三个月每个区块奖励为 115.2 个 EPK,知识节点每天可以产出 331,776 EPK。其中,1% 将用于奖励投票用户,9% 将用于激励领域专家;还有 15% 将用于带宽补贴与知识基金储备。所以 75% ,即 248,832 EPK 可直接归属于知识节点。
EPK 是 EpiK 所有经济活动的中心。知识图谱的构建、分布式存储网络的建设与维护、数据的流转、企业应用采购等等环节都需要用到 EPK,这使得 EPK 拥有了完整的应用场景,进而拥有了价值保障。
认知智能的商业链条很长,教育、医疗、公共安全、智慧城市、公共交通、智慧金融……知识图谱作为认知智能应用链条的重要一环,是推动既有产品升级甚至人工智能迭代的不可或缺的解决方案。
在如此巨量的市场需求下,EpiK 将扮演越来越重要的角色,让我们拭目以待。