这次不讲故事,不说梦想,没有情怀,没有诗。
但是有远方
老慕来给你做科普,哈哈哈哈。
作为杂科全书,让我告诉你点我想说的。
为什么要了解?
项目方当妈只当一段时间,后面下放权力-DAO,所有投票均出自我们这些手握投票权的人。要想项目穿越牛熊,你得有所了解。
对于这个项目,数据积累要时间,应用开发要时间等等等等,都是舟中人,是想坐舟渡江,还是来打造万吨邮轮,都离不开我们自己的认知。
科普文章最大问题是枯燥,我尽力写的狗血,好记一点。勿怪
你和你的“puppy”
“一个知识图谱是要在在描述现实世界中存在的实体以及实体之间的关系。”
其实就是:
记录你和你puppy之间的关系(哪个puppy?不知道啊,我只是打比方,你和你puppy的关系算噪声,不是什么有效知识。哈哈哈哈,哦,对了,噪声 = 无效数据)
结构化到推理(与深度学习的小区别)
人人都知道大数据
大数据其实是 = 大量数据是非结构化。
一切数据当记录下来时,所用到的操作是不同的。
要是用说的,用图像的,深度学习已经解决的很好了,可是文本数据并不是。那怎么办?
去吧! 皮卡丘(知识图谱)。哈哈哈
如果我写了两篇文章
一篇说“我的puppy怎么怎么样了”
另一篇说“老慕的puppy咋地咋地了”。
好了,这时候机器只知道puppy是一样的,并不能联系起来。
而有了知识图谱则能处理实体间消歧,让机器也知道我就是老慕,老慕就是我。
再结合等等下面要说的三元组,那结构化的数据就有了。
而过了一段时间,我写了第三篇文章,内容是和之前两篇有关的文章时,知识图谱是可以理解实体之间的关系链,然后能做出推理和连接,把三篇文章联系到一起。
这时候,深度学习是很难地。因为他自己无法解释,可是知识图谱可以呀,进行作业时,不论是正推反推,逻辑推,归纳推还是规则推理,都能给你解释的明明明白白。
所以让我们喊出“learn to learn”,哈哈哈
三元组?
此三元不是“上中下”元的三元节,不是三元食品的三元。
这东西就是知识图谱的一种通用表示方式。
最基本的:
(实体1-关系-实体2); (实体-属性-属性值); 等等等等
例子:
(实体1-关系-实体2) = (你 - 关系 - puppy)
(实体-属性-属性值) = (你的puppy - 动物?-体重)
例子深化:
(实体1-关系-实体2) =(h,r,t)
h是头,r是关系,t是尾
结合一下就是
(你,关系,puppy),这里面的关系,你自己填,我不代劳,哈哈哈哈哈
而这个时候。。。加点东西,你看:
(你,关系,puppy)s
或者
(你,关系,puppy)0.6
这里面 s=0.6,什么意思,为毛多了个s,那是因为不确定性,s代表可信度(你和你puppy的关系还要多了个可信度。。。。哈哈哈,恶搞恶搞,不要介意)
(h,r,t) 和(h,r,t)s
可以很浅显的理解成是构成“确定性”知识图谱和“不确定性”知识图谱的三元组。
留个心眼才能发展好
我说这些原因很简单,因为确定性知识图谱的应用范围是有限的。
项目要被广泛使用,要想赚大钱,比如金融,法律,医药等等这些领域,都是需要大量的经验性和概率性,而普通的确定性知识图谱是很难满足的(因为不准确)。
这也是为什么我想让大家多了解的原因之一,多知道点,总比傻乎乎什么都不知道的好,在以后的DAO治理中,你要给哪个领域专家投票,要擦亮眼睛选对人,免得你投票的人上传的东西虽然是“对”的,但其实根本不能给项目未来带来福利。
同时,到了后面,大规模的图谱构建是很难由领域专家人工去筛选标注的,必然会用到自动化的方式去整理参与构建,那领域专家选的什么模型啊什么技术去实现,这些东西都是只需要粗略明白,不求精通即可,不要很明显的被骗就好了,而且这些知识的获取并不占用多少时间,比如你现在看完文章其实才花了几分钟而已。
现在有关DAO治理的白皮书还没出来,不知道权限是会怎么样,项目方妈说就在中旬左右会把Dao治理的白皮书给到我们,我们拭目以待吧。