feedback

意见

反馈

back-to-up

回到

顶部

如果“AlphaGo”来到中国A股...| 数据科学50人·刘富兵

数据科学50人

· 刘富兵

Harry Wu   06-14

刘富兵,国盛证券研究所副所长、首席金融工程分析师,多次获得国内金融工程重量级奖项。他擅长使用数据科学的方法,对A股市场进行分析和预测,曾运用海外金融物理学中的LPPL模型,多次实现对中国A股的准确预测。

金融由于其“数字化”本质,从诞生伊始就和数据有着千丝万缕的联系。作为数据储备最完整、模型应用最丰富的领域,金融是目前数据科学实践最成熟的行业之一。

传统的金融市场研究应用数学和统计学等知识,如今随着自然语言处理、图像识别、语音识别等技术的突破,大量非结构化数据(文本、图像、音频),也逐渐被应用到金融领域的数据分析中。

在数据科学时代,金融专家们不仅熟知传统的金融分析方法,还要从物理学、生物学等交叉领域汲取模型的灵感和方向,利用大量非结构化数据完善自己的分析模型。刘富兵就是这样一位数据科学领域的“金融专家”。

知名财经撰稿人傅峙峰曾编了一个段子,谷歌的AlphaGo利用人工智能交易系统在A股潜伏许久,最终净值亏损不断扩大。虽然只是个玩笑,但刘富兵觉得段子本身确实反映了金融市场的复杂性。

一切都从金融工程说起

金融工程使用数学和工程学的方式,通过数据与建立模型,进而计算金融市场的收益与风险。所以金融工程与数据科学等学科有很多交叉领域。

图片说明:刘富兵在上海的办公室接受DT财经专访

“简单来说,金融工程就是用工程的方式方法研究金融,从这个角度而言,金融工程的某一分支与数据科学的应用领域有交集。”刘富兵说道。

十几年来,刘富兵把自己的研究领域扎根在数据科学、金融物理学(DT君注:金融物理学是一门研究复杂系统的新兴交叉学科)。不过,最近几年刘富兵发现,数据、模型背后的金融含义日益重要,如果说之前的研究他更注重工程的话,那么他未来的研究将更注重工程所揭示的金融含义。

刘富兵也经历过事业的高潮和低谷。在刚开始从事金融工程的时候,他也曾绝望迷茫过。在他看来,金融工程的研究是一个很“痛苦”的过程。“比如我们建模型,需要不断循环往复地完善模型,一个又一个螺旋式突破。”

从事金融工程的人通常会经历三个阶段:初入职场的兴奋期;大量模型测试后的绝望期;以及跨越瓶颈后的稳定平和期。大部分人会止步在第二个阶段,刘富兵也不例外。

图片说明:DT君记录绘制的金融工程师职业走势图

2012年是刘富兵走出“绝望期”的关键时间点。那一年,他将金融物理学中的LPPL模型引入中国A股,并多次准确预测市场的顶部和底部。

目前刘富兵带领的国盛证券金融工程团队的研究覆盖了多因子选股、AI与大数据策略、主动量化、择时量化和FOF资产配置五大方向。其中,AI与大数据策略就是通过挖掘财经圈的舆情数据(社交、财经新闻、股吧等文本),使用机器学习技术来建立各种市场观测模型。

来自金融物理学的LPPL

2012年,刘富兵将金融物理学家 Didier Sornette 教授对地球物理和临界现象研究中常用的LPPL模型(Log-Periodic Power Law,对数周期性幂律模型)引入中国股市。起初,很多人不免疑问:这个原本用来预测地震的模型,能在A股市场上准确预测大盘走势吗?

LPPL模型起源于Sornette 教授对资本市场与物理现象的对比观察。他发现股市泡沫的形成和破裂与地震、材料断裂等物理现象非常相似,都是复杂系统的“自组织临界性行为”。

所谓复杂系统的“自组织临界性行为”是指,由大量相互作用的成分组成的系统会自然地向自组织临界态发展;当系统达到这种状态时,蝴蝶煽动一下翅膀就能造成大海啸。

以著名的“沙堆模型”为例,当我们在一平台上缓慢添加沙粒,一开始沙粒落下后不会滑落很远,但随着沙堆高度、坡度的增加,局部沙崩的规模也相应增大,一但坡度到达临界值,新添加一粒沙就可能引发大到涉及整个沙堆表面所有沙粒的沙崩。这时沙堆就处于“自组织临界态”的敏感状态——微小的局部变化可以不断被放大、进而扩延至整个系统。

图片说明:沙堆模型的演示

这个理论解释了火山爆发、物种灭绝、交通阻塞、以及金融市场中泡沫崩溃的现象。

在《股市为什么会崩盘》一书中,Sornette教授提出了这个预测市场泡沫的模型,并准确地预测了此后多次市场拐点。刘富兵介绍,在2008年的石油泡沫和房地产泡沫、2009年A股大盘、2015年的创业板等案例中,LPPL模型都成功预判出了顶部。

量化交易,让股市更“安全”了么?

美国金融市场早在上世纪就已使用LPPL模型,并在金融工程领域下的量化交易中大量地应用到数据科学。目前,华尔街的量化交易员们正在采用大数据、机器学习等方法,试图战胜市场,获取投资的超额回报。

数据显示,2017年美国股市交易量近三成来自于量化交易,而且全球首支由人工智能管理的ETF(交易所交易基金)AI Powered Equity ETF(AIEQ)也于2017年在纽约交易所问世,截至2018年5月的收益率跑赢标普500指数。

图片说明:首只人工智能基金运营管理和收益情况

但在中国,刘富兵认为基于数据科学的量化交易还相对处于起步阶段。

“美国金融工程比中国起步早了30-40年,且在基础科学上,美国更领先。西蒙斯的大奖章基金、达里奥的桥水全天候策略都是美国量化交易的集大成者,在股市中获得了超额回报。”

刘富兵介绍到,中国开始有一些基金使用大数据和机器学习来做二级市场的量化交易,收益还不错。

量化交易的背后考验的是金融工程师把研究深度和计算机技术结合的能力。公开市场资料显示,中国目前上市的20多只大数据基金中,表现最好的两只历史收益已超30%,但依旧还有十几只基金历史收益为负。

近年,越来越多的金融机构开始雇佣数据科学领域的人才,通过大数据、算法模型研究复杂系统、解决金融问题。刘富兵认为,这种以量化交易为代表的金融工程的应用,促进了市场的流动性、有效性和平稳发展。

DT君反问:“用2015年股市异常波动时量化交易引发大盘加速下跌又是怎么回事儿呢?数据科学中的量化交易模型是否让市场更不稳定了?”(DT君注:2015年A股因大量量化投资出现卖出信号,加速了市场快速下跌)

“1929年的华尔街(DT君注:1929年道琼斯指数崩盘,并造成美国十年大萧条)、荷兰郁金香泡沫、英国南海泡沫都没有量化交易,但市场不也急速下跌吗?所以市场的大涨大跌与量化交易本质上没有因果关系,归根结底还是人性问题。”刘富兵回答道。

一旦人性变成可被模型量化的时候,市场的极端行情将会被“诊断出来”,这就是他用LPPL等量化模型正在做的事儿。

大数据、AI的新时代

华尔街巨头摩根大通在2017年发布了一份名为《大数据与人工智能策略》(Big Data and AI Strategies——Machine Learning and Alternative Data Approach to Investing)的报告,其中写道:我们正见证市场向量化策略巨大的转变,交易算法、大数据、机器学习和人工智能等正在越来越多的被使用。机器学习将会在未来对市场运作至关重要。分析师、投资经理、投资总监等都需要了解机器学习技术。若不这样做,就会落伍。传统的经济数字和常规数据源正在变得与投资策略越来越不相关,因为使用新数据集和方法的投资者可以预测这些数字,并在它们发布前预先做出行动。

华尔街传奇的新兴量化对冲基金Rebellion Research创始人曾在2017年说过,人工智能正在蚕食金融业。他列出了五个最容易被取代的职位,包括经纪商、银行柜员、金融顾问、处理基本数据的后台类工作以及文案类工作人员。与大部分DT君对话过的“数据科学50人”受访者一样,刘富兵不认为机器会在可预见的未来完全取代于人类,但也不否认这种担忧的客观存在。

刘富兵认为,在未来,重复和规律化的机械工作一定会被取代的。“你看交易员、银行的大堂经理都在慢慢消失,但是人类的创新思维是在短期没办法被机器取代的。”

就在前几年,包括MIT Tech Reviews和连线杂志等多家海外科技媒体都畅想过未来的资本市场的人工智能博弈。当DT君问到未来的资本市场时,刘富兵沉默片刻说:“目前能看到和理解的是,人工智能是辅助人类的工具。”这个观点与桥水基金创始人达里奥一脉相承,达里奥在《原则》一书提到,人工智能之前是人性,在他的理解中,人机结合可能是最好的结果。

2016年AlphaGo打败了围棋冠军李世石,让人们开始遐想AI在其他领域战胜人类的可能性。正如开篇时的那个段子所述,AlphaGo真的来到A股市场会怎样呢?刘富兵和他的团队认为,AlphaGo通过机器学习中的强化学习,能吃透围棋的套路(变量数有限),但A股市场是无边界的,或者很难界定其边界(影响市场的变量无限),就目前而言,战胜市场非一朝一夕。

数据侠门派

刘富兵,上海交通大学金融工程学博士,现任国盛证券研究所副所长,金融工程首席分析师,曾任国泰君安研究所所长助理,金融工程首席分析师。2014-2017年,连续4年获得新财富金融工程第一名。

数据科学50人

数据科学50人”项目是DT财经旗下数据侠计划重点内容产品,与数据科学领域KOL挖掘数据内容的价值。我们从数据科学领域选出最具代表性的50位先锋进行深度专访,50人由DT财经独立评审并发布,第一财经数据科技及合作伙伴倾力支持。

加入数据侠

数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing004并备注“数据社群”,合作请联系datahero@dtcj.com。

 

 

分享这篇文章到