feedback

意见

反馈

back-to-up

回到

顶部

数据分析可视化——解读数字货币

周宁奕   2018-08-07

近年来,数字货币发展迅速却又蒙着神秘面纱。连菜市场的大妈大爷也能唠一唠的区块链、比特币、以太坊,你又了解多少呢?法定货币与数字货币存在怎么样的关系?数字货币的交易网络如何用可视化手法巧妙呈现?DT君上周请到了数据侠周宁奕,他用数据分析及可视化,带领大家了解了数字交易市场背后的那些事儿。本文为嘉宾的直播实录整理,感兴趣的朋友不要错过哦~

今天跟大家分享的主题是对数字货币的市场分析,跟区块链的关系并不是特别的大,因为区块链只是数字货币底层的一个技术,今天更多的是从市场的层面上去看一些规律和特点,然后做一些可视化的分析。

10000个比特币与2个pizza的故事

大概在九年或十年以前,有个码农他跑到一家披萨店去买2个披萨,然后大概是花了1万个比特币,这应该是全世界第一笔用比特币进行的交易。这个数字放到今天,是非常很夸张的一个数字了。

 

今天的数字货币种类非常的多,至少有几千种,我们可以想象比特币是一种游戏规则,它是架构在区块链上的一种数字货币的游戏,会有很多山寨币,也就是跟比特币类似的一大类数字货币。

对于数字货币而言,我们要进行购买,首先是要有撮合交易,什么是撮合交易?打一个比方,原始社会的时候,大家物物交换,买卖是你我之间的协议,我们如果不把比特币当作钱的话,我拿1万个比特币和25个披萨,也是一个物物交换协议。那么什么是撮合?撮合就是我们在一个市场上有非常多的人在买入,也有非常多的人在卖出。那我卖的价格肯定是要比你想买的价格要高的,但如果价格产生了交叉那就成交了,现在撮合引擎是比特币交易的标准配置。全世界最早的这个交易所是Mt.Gox,但Mt.Gox现在已经破产了,因为当年一次黑客的入侵,还有一些别的交易所向比如OKEX、BINANCE等,这些交易所都是通过撮合引擎来进行数字货币的交易,它跟证券、期货和外汇都是类似的原理。

虚拟币≠区块链

很重要的一点是,虚拟币跟区块链是不一样的。区块链只是一个底层技术,而虚拟币是上层的一种应用场景,虚拟币很多特点,我们就不展开了,因为网上也特别多,比如去中心化、共识等,但是我们知道交易所本身其实是中心化的。交易所它是怎么一个原理呢?它首先是有个非常大的钱包地址,你可以往这个交易所里面打钱,然后你在交易所上面做交易。你跟他发生了一笔交易,那只是交易所它在内部的账本里面给你划了一笔钱,就是说它总的交易所有100万,你有2万,他有3万,后面发生了交换,你这2万美元去换了他3万的那个币。但是交易所其实是中心化的,里面的交易基本是不上区块链的,人家用中心化的数据库,模式是给你打欠条,比如你买了2万个币,他说交易所欠你2万个币,其实币还是在交易所自己的钱包里的。

数字货币VS传统金融

我们刚才聊到数字货币其实跟传统的金融有一定的类似之处,但是也有一些不一样的地方,首先,数字货币是没有开盘和收盘的,24小时乘以七天交易,而且政策限制比较少;另外它的标准其实是比较公开的,比如在做币的这些团队,它往往是把代码都给开源了,不像传统的很多项目,他一般是不愿意把自己的代码给公开出来的;还有一点是说虚拟币的投机性是很强的,因为你没有涨停板也没有跌停板;另外就是股票会有一定的计算标准,比如说怎么去评估资产,巴菲特他早期会有最低清算价值去评估一个公司底线,就是我把你这个公司卖掉能换多少钱,但比特币这个很难讲对不对?你说它值多少钱呢?只是大家都觉得它值这么多钱。其他还有很多区别,比如说像交易所,一个股票在深交所或者上交所可能就上一家,但数字货币交易所全世界非常多家,但你自己也可以开一家,因此不同的币种不同的交易所,里面还有差价。

这样会产生很有意思的问题和方法,比如说很多人通过比特币是去做一些套利,就是说这个所是卖九块钱,那个所是卖十块钱,那么中间就会有一块钱的差价,所以呢我就到那边去买个九块,再提到这边来十块钱卖掉,随之就会产生一些跟传统的交易所不一样的操作方法,比如跨所套利的策略;另外最重要的一点是说数字货币是没有什么监管的,所以也是风险非常大的一种交易模式。

今天的分享呢主要还是对数字货币做一些简单的分析,不构成任何的投资建议。

数字货币里的概念解读

其实数字货币里面概念还是蛮多的,我会跟大家分享一些简单的概念。

Pair

首先是“交易对”的概念,比如说我用钱买了商品,钱在右边,商品在左边,我从右到左是买,从左到右是卖,钱和商品的关系就是一个pair,或者有些地方叫做symbol,这都是一个概念。

有了这个概念以后,我们就会看到交易其实就是:谁什么时候以什么价格买或者卖了多少商品,它是给谁的,这个就是一条order。那么我们通常会看到一些比特币的网站上会有这样的一个图,这个图左边是一个K线图,在股票里面也是有的,右边是个深度图,这个深度图里绿颜色的是一个卖单,我卖的价格肯定是高于买的价格,在这中心地带就是成交的地方。这是简单的一个交易的分析,就是你的K线是怎么来的。我们最直观的一个交易价格,随着时间的变化,就会画出左边那个白色的线,可能它是一秒钟出一次数据的,右边呢是一个K线图,它是做累积的,你能想象一天中一个小时有3600秒,一天24小时就是24×3600,是个非常大的数字,所以我要看一天的变化的话,它可能会有一种汇总的方式,那就是K线图。

API交易

虚拟币交易有很多是通过API来交易,也就是自动化交易,这个已经出来很多年了。搞比特币的第一批人可能都是码农,所以他们一般都对数据处理或接口有些经验,在很多的平台上,很多交易全都是通过自动化来做的。

我们会发现不同的交易所其实都有差别,比如说它用来做交易的接口有可能是 Websocket 的,也可能是 http 接口,包括它的名称上也是会有点不一样,以及它一些接口有些交易所有,有些没有,所以我就写了一个库https://github.com/zhouningyi/exchanges ,它是Nodejs的,可以兼容不同的交易所,而且接口一致。上层如果做量化交易的话会写一些策略,那么这个策略只要调用这个库呢就可以用接口都是一样的,在这个交易所用这个方法是买,同样的方法可以在那个交易所也进行买入,屏蔽了交易所的差异。如果大家感兴趣的话,可以看一看我的一些小尝试,包括有一些把它的表结构也标准化了,我们要把交易的数据都存到历史的数据库里面去,就需要有一个表结构,我既然已经统一了这个数据格式,也会把我推荐存储表的格式也写成了一个配置,可以这样去存数据。

 

 交易所——CoinmarketCap

今天世界上有非常多的交易所,这个交易所的数量可能都是以千或万来计算,我们能进行交易的品种也非常的多,我自己认为大部分其实都是意义不大的空气币,技术上并没有什么创新,只是用来割韭菜的。这么多的交易所,这么多的币种,我们要了解它的全貌是很难的。

有一家网站叫CoinmarketCap,这个网站,它收集了各种交易所的数据,可以统计到每个交易所每个币种今天卖了多少,买了多少,有多少的成交量等等,它是个整合站,所以我们可以从里面爬取数据并进行分析。

关于CoinmarketCap,有几个概念可以跟大家聊一聊,CoinmarketCap是一个交易所的集成,所以它首先有很多很多的交易所,就包括了像刚才讲的币安、OKEx,他们都是exchange,那么在一个exchange里面呢又有很多“交易对”。

交易日的话它可以有两种类型,一种是虚拟币对虚拟币,比如比特币可以去买很多别的虚拟币,一种呢是说我用美元去买比特币,那美元欧元人民币都是法币,是国家定的货币。

 

我们刚才讲的交易所的结构,最后会有个coin的概念。coin,就是各种虚拟货币,比特币、EOS、以太坊等等。这些表呢都存在了我们的一个数据可视化平台(Zatlas, https://v.anlink.com/home)上,这个表的数据是免费用的,这个平台也是免费的,这里面有几个表,比如说像coin,coin是个圆表,就是每个虚拟货币什么时候发行,现在价格多少,logo是什么,代码地址是什么等等。中间下面的trade_graph,它是一个交易网络的表,我们知道比特币之间,虚拟货币之间可以互相交易,A买b,b买c,c买A,所以trade_graph就是这样的一个概念。

在第一张表里面有一些信息,就是在当前的这一天里面,一个币种被交易了多少流量,比如说比特币买了EOS, USDT也买了EOS,那么对于EOS这个币种来讲,至少有几个市场他都可以发生交易,这个钱都可以换算成美元,所以说你可以计算出这个币种在全世界的上千个交易所里面产生的所有交易的美金数量。我们也知道虚拟货币一般都是有个峰值的,它的总量是一定的,所以根据这两点,我们可以算出它这个交易的活跃度。

所以这个图很有意思,我首先是按照交易的总量进行排序,比特币肯定是排第一个。被交易除以它的总量,这个比率是一个活跃度,黄线是活跃度,蓝色是交易的频率,那很有意思的是,我们算出来以后发现,排在前面活跃度很大的是那个USDT,这是一个美元的等值货币,也就是说币市大跌的时候,或者你买入美元的时候,买入这个数字货币之前,你可能都是要换成这个钱的。比如说你市场大跌,你换成法币的话,这个速度太慢了,可能你这过程中就跌光了,所以你就换成一个跟美元等值的这个货币。这个货币其实本身它并不具有投资价值,因为对于投机者而言,他希望看到增长,或者做空看下跌,但是USDT它的价格是基本不会变的,它只做个中转,所以它的使用频率特别高。

 

还有一个很有意思的点,这两年整个区块链的圈子对于发币而言,大家都在炒概念,比较热的,一个是公有链,就是说底层技术,别人的币可以基于我做开发。

现在区块链技术比较复杂,不仅仅做比特币,像以太坊可以写智能合约,并且实现了更高的一个并发数。在这个里面就有一点很有意思,以太坊出来以后,它再来制作别的货币,别人只要建立在以太法的基础上就可以了,像公链的很多货币,它都能在它的基础上创建新的货币。有个统计说明,这里面基本上全都是以太坊来进行开发的,在中国也有可以用来开发新的数字货币的,但基本上这个是被以太坊垄断的。

对于每个货币而言,你可以采集它最早的出现时间,很有意思的是,你会发现通过ico或者一些别的方式来进行发币上币的这个币种在去年这个最高点的时候其实是非常多的,到了12月以后大跌,突然间变少了,当然也有一种可能就是这些币种都没有做大,所以都没有被CoinmarketCap收录,因为它作为一个权威机构,它只是收取一些比较大型的币种,去年都跌成这样了,所以很多人都不会去买这个数字货币,所以导致了它发币可能也比较少,但总体的趋势是一直在增加,特别是今年整个投资的情况下,好多区块链的数字货币非常火。

对于这个现象其实我本身并不是特别的看好,因为大部分的数字货币都是高风险,而且很多是营销币、空气币,所以从我的观点上是不建议大家去买的。不过作为一个市场现象,我觉得是很有趣的,因为这个数字货币界变化得非常快,现在会提很多概念,比如说平台币、交易挖矿等,每个月都有新的概念,所以这个模式跟股票这种方式比,股票出来很多年了,但是它变化得很慢,受到很多政策的管制,不像数字货币它是很自由的,大家如果做研究会是一个很好的样本。

 

交易网络

接下来我们要分析交易网络,我们的交易其实可以分成两类,刚才我们讲,对于一个“交易对”来讲,它可能有两种交易,第一种是拿法币来换取一种币种,比如说我用人民币或者美元去购买比特币,这种行为对很多国家而言,是属于非法的,至少平台不能支持这类行为。

因此有个交易方式叫场外交易。也就是在国外的市场上开了一些交易的这个通道,可以点对点买,意思就是平台说我不和你买卖比特币,但是你可以找张三去买,张三手里有这个比特币,我们提供了场所,你们去交易,这个责任不在我,这个就是场外交易。场外交易是有限制的,它并不是所有币都能买,一般它提供的都是几种常见的,比如说USDT,我们刚才讲过的跟美元等值的货币,又比如说BTC,比特币现金,还有就是像以太坊这种的支持。

你要去买更小的山寨的币种,一般会在交易所通过你买到的比特币再去买,所以这个网络我觉得至少是分成三层,第一是有的国家法定货币,第二是用主流货币,最后一层才是山寨货币、小众货币这样的概念。

 

这是一个很有意思的层次,它这个网络并不是杂乱无章的,而是从最主流到非主流的一个网络。在爬取的五张表里面有一张表是交易网络,有一些软件像Gephi,就可以专门来做这个关系网络的展现,它一般会把交易网络表处理成两层。一个交易网络它有节点和边,边就是交易,点就是币种,比如说红点是美元,蓝点是LRC(莱特币),中间的线就代表交易。

所以这里面是这样的一个网络,它可以分成两张表,第一张表是专门描述点的,第二张表是描述边的。我们这个表呢其实是一个联合的大表,把它左边的点的信息和右边的点的信息全部放在边表里面,合成一张大表,可视化平台就可以去处理然后做展现这件事情。这个图还是非常非常有意思的,绿色这个点是比特币,右下角这个石绿色的点,它是以太坊,大家可以发现,大部分的山寨币要么只能跟比特币交易,要么只能跟以太坊交易,还有一些是两面都能交易。右上方这些点呢也非常有意思,它们体量有点大,但没有比特币这么大。

 

这些币种像第三世界一样,它们互相聚集在一起可以交易,像早期出来的莱特币、瑞波币、EOS这些币种。在这个图里,我们也可以看到一些边特别的粗,就是这两个队之间交易量特别大。我记得印象里好像是美元和比特币的交易,大家在国外入场,它本身支持美元购买主流数字货币,平台也可以提供这比特币的美元通道,所以它的交易量会特别大,它出厂提前他也是把这个东西换成比特币,然后再出来。

所以我们可以想象一个很有意思的问题,如果我们把所有的1600多种币种都列出来,那么1600币种之间,它可能会产生的排列组合关系是(N *( N -1))/ 2种,是个非常大的天文数字,比如说我有一百万的交易,平均下来每一个交易只能交易一块钱,这个就是交易极少,或者说深度基差,类似于有价无市,因为在上面交易的人太少了。因此交易所设计的网络,它一定不会两两之间完全打通的,这是个稀疏的网络,它只保留了主流交易之间的关系。

中心度与市值

有一个概念叫中心度和市值,什么是中心度?其实我自己一直有个观点,就是中国历史为什么会发生变迁?古代的上海在哪里?我觉得就是在敦煌这种地方。古代的陆路贸易,我们要联通西域36国,我们要对外出口东西都要从敦煌走,那么敦煌的中心度就非常高,如果变成海路贸易或者水路贸易,那么作为连接东海长江口的上海,中心度就变得非常高。

这与虚拟币交易有点相像,就是你要把价值流通到一种小币种里面去,就要通过一些大币种。我们就可以看他的中心度和它的市值的关系,也就是它能连通多少个货币之间的交易和它本身的估值,在这个里面基本上还是呈现了市值和这个中心度的一种正相关的关系,这个中心度我们用了一种出入中心度,就是说你有多少个币可以给你进行交易,那你的中心度就有多少。放大这个图,就会发现对于市值比较大的一些币种,这个正相关的关系是比较成立的。 但是对于一些小币种,这个关系其实并不是那么特别的明显。

场外交易与溢价

那最后呢其实还是有一个有意思的研究,就是对一个场外交易的网站进行了一个价格的监控。场外交易其实就像我们讲的C2C的交易,比如说淘宝就是一个C2C的网站,小群体都可以在淘宝上卖东西,场外交易也是一样的。场外交易通常是有国界限制的,中国人可能会去OTCBTC。

有一个网站叫localbitcoin,这个网站是全世界性的,所以你可以看到各国的比特币的价格是不一样的。在这个里面我们可以看到非常多的有意思的现象,就是蓝色的线是溢价率,我按照标准的汇率去算它是多少钱;然后黄色的线是交易的数量。有些国家它可能交易的很少,它价格可能会出现很大的偏离。在其中我发现有两个国家非常突出,一个是津巴布韦,一个是委内瑞拉。这两个国家比特币的价格都是超级高的,远超汇率,但是后来才发现这两个国家通货膨胀非常厉害,它不像中国美国这样稳定,资金能力雄厚,所以这些国家它的货币贬值的速度可能非常之快。

 

而美元呢,它是个主权货币,可能造成了这些小国家对美元的不信服。因为美联储代表了国家利益,会导致汇率的变化,他宁可选择比特币这种去中心化的不受国家管控的货币,而且波动率很大。

美元再怎么不靠谱,它其实还是一个很稳定的东西,比特币很不稳定,但这些人用特别特别高的溢价去买卖这个比特币。中间也会产生一些很有意思的现象,就是照理来讲这个价格很高,我可以把人民币换成比特币,然后我再去这个平台上买成委瑞内拉主权货币,最后换汇换成人民币,但这个很难,因为各个国家的外汇管制很厉害,去年有很多人做了一波中韩,韩国的比特币价格比中国的价格高了50%,有些有境外渠道的一些人呢就是做类似的套利。

但为什么溢价这么高?你知道这个事情能套利,为什么它还还是这么高?就是因为外汇管制很厉害。 对委内瑞拉这种国家,它的货币的贬值速度很快,但是我们汇率的标准可能又很老,所以这边可能会产生一些误差。那么在这个溢价里面,我还会发现很多非洲的国家溢价都比较高。

 

我今天的分享就是这些,其实比特币的分析还是有很多可以做的,比如说我们除了交易所以外的这些数字货币、虚拟货币,它都是在区块链上发生交易的,交易都会留下痕迹,所以有些人做一些反洗钱的研究,有些人做大币种、大户的研究;比如说这个区块链上某几个人是超级大户,其实数字货币某种意义上还是中心集权主义的,因为大部分的钱都在小部分的人手里,但他们的钱包是可以被追踪的,他们钱从哪来去了哪里,虽然你也不知道他是谁,但是你可以爬下来看。

数据侠门派

周宁奕,众安科技数据科学家,前阿里云datav可视化开发工程师 ,主攻webgl、webgis,数学的美学世界发起人,独立软件糊涂作者。

 

加入数据侠

“数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。了解数据侠计划详情请回复“数据侠计划”,投稿、合作请联系datahero@dtcj.com。

 

分享这篇文章到