EPK价格之回归分析篇
by Z
2021.09.16
一、摘要
本文试图通过使用多元回归方程的形式解释epk价格走势,经过一个月来的数据采集和统计学计算验证,发现epk价格与以下四个变量存在显著线性关系。
1、ETH价格(ETH_price);
2、前百大持币地址比重(top100%);
3、质押币量比重(pledge%);
4、六加交易所流通币量比重(exchange%)
此关系表达式暂且可以列举为以下公式:
EPK_price = 0.00025639*ETH_price + 2.91216180*top100% - 2.40776078*pledge% - 5.83160174*exchange%
二、分析方法
第一步
统计自8月15日主网上线至9月15日的31组数据,找出EPK价格与各独立变量间的相关性关系,统计变量包括:ETH_price,top100%,pledge%,exchange%,floating%,总币量,交易所币量,BTC_price,矿工质押,自由流通量,前百大地址流通币量,d_EPK,d_ETH,d_top100%,d_pledge%,d_FF%,d_EX%,d_BTC。(见附表–全部数据组)
第二步
通过回归函数,ANOVA表,t-test,F-test,BP chi-square-test,Durbin-Watson-test,分别判断数据组间的相关性,解释力度,是否存在异方差,以及残差项是否存在序列相关等。并排除不符合相关测试判别的自变量。最终得到摘要内容中列出的四个自变量。(见附表-各种test)
第三步
进一步修正初步函数的拟合情况,具体分为:线性相关、指数相关、和log相关。发现,线性相关函数的R2达到0.993。即最具解释力度,最终得出函数表达式。
第四步
通过通俗易懂的表达方式去解释这一结果的实际意义。
即,epk作为通证经济模型下的币种,
A、其价格必定受到ETH大盘价格的影响,其影响因子系数为0.00025639;
B、同理前百大持币地址币量占总币量的比重作为衡量一个币种共识能力的代理指标,其影响因子为2.91216180;
C、EPK属于质押挖矿币种,其价格应与其质押比重存在相关性,其影响因子系数为-2.40776078;
D、一个代币的价格,主要通过交易所流通的币来交易买卖决定,其影响因子系数为-5.83160174;
三、结论:
仅按目前的模型而言,作预判分析可以的出以下基本结论:
1、epk价格会随大盘作正相关涨跌;
2、随前百大占比作正相关涨跌;
3、随质押总量占比作负相关涨跌;
4、随交易所流通币量占比作负相关涨跌。
四、局限性分析:
结论中的2和3明显与正常逻辑线不符。
结论2:因为正常理解应该是持币越分散,共识度更高,而不是越集中币价越涨对吗?
这里的解释逻辑是:目前收集的持币地址数据全部来自以太坊的ERC-20持币地址,其中排行榜第一的2500W(见附件-钱包地址),是官方1:1兑换erc20和主网epk的兑换池地址。这包含了大部分通过交易所购买并兑换成主网epk的币量,虽然显示为集中度高了,其实是更分散了。因为都分散到了各个矿工的钱包里。
这一点在后期epk基本脱离erc20后,实现独立的持币地址统计时,将作调整,届时应该会得到一个负相关系数因子。
结论3:随质押总量占比的上升,反而币价跌了。
这一点我给出的解释是,因为统计学意义需要长期的数据作支撑,目前数据量还是少了;另外,在主网上线的这短短一个月内发生了大盘大跌、preDAO T+60、机构解锁释放提案等重大事件。造成数据产生与实际解释逻辑不符的情况,这也是可以理解的。从长期逻辑上来说,质押越高,共识越强,币价应该更高。
***本文公式及结论分析,仅供epk社区交流学习所用,不作为投资参考分析。再次,由于回归分析的局限性包括但不限于,过分拟合、以历史数据作未来预测数据量不够造成df(degree of freedom)不准、大事件影响未被充分考虑等,所以,看官请海涵!
附表:
1、全部数据组
2、各种test
回归参数表
BP-test
DW-test