图片说明

【天风金工吴先兴团队·专题报告二十一】买卖压力失衡——利用高频数据拓展盘口数据

  报告要点

  高频数据应用于股票市场的关键点在于高频数据到低频信号的降频逻辑

  一是利用高频数据的独特性对数据进行定性,进而加工高频数据,得到低频信号;

  二是收集高频数据路径上的信息汇总到低频,得到信息含量更大的低频数据。

  运用日内成交价作为探针,探测个股挂单数据

  我们利用tick数据成交价的上下波动时,记录成交价上下挂单情况,在收盘时汇总,并剔除已成交的订单,得到扩展的盘口数据。

  依据扩展盘口数据的买盘与卖盘挂单,计算买卖盘压力,发现买卖盘压力失衡对个股超额收益影响显著

  1、在买压占优情况下短期内个股会呈现明显的正向超额收益;

  2、在卖压占优情况下短期内个股会呈现明显的负向超额收益;

  3、买卖压力失衡情况消失后,股票的超额收益呈现反向逆转,这意味着买卖压力失衡带来的超额收益仅仅为短期冲击影响,后期股价会逐步修正恢复到原状态。

  基于买压占优构建事件驱动策略,10通道策略取得年化年化19.66%的收益,并且16、17年该策略的表现较为出色,分别取得9.07%和6.68%(截止2017年4月28日)。

  从高频数据到低频策略

  提及高频数据,直观的反应都是应该应用于高频交易,的确,纯粹的高频数据对于指导低频的投资策略是没有很大的意义的。因此,为了利用高频数据中的额外信息,需要对高频数据中的交易信号降频。

  其中一种方式是利用高频数据的独特性对数据进行定性,进而加工量化数据,得到低频信号。比如积极买入与保守买入的计算,就是通过高频数据确定买卖方向,进而加总成低频的积极保守交易量,衡量两者之间的强弱关系就能得到投资者的买入情绪变化,进而辅助选股。

  另外一种方法,通过捡拾高频数据路径上遗落信息从而增厚低频数据的信息含量。比如在本篇中提到的利用高频率的股价变化作为探知日内盘口信息的媒介,汇总得到比日频盘口信息更加丰富的盘口全景图。进而利用该盘口信息来进行策略构建。

  诚然,这样的方法的挖掘难度和适用性限制了高频数据在股票市场上的应用,我们也将努力探索行之有效的方法,以期最大程度地利用高频数据的信息。

  高频盘口数据

  在每一个时刻上只能够看到一瞬间的买卖挂单数据,举例,如果以日频的盘口数据来做分析,我们能够得到的只有收盘的盘口情况,我们能够得到的最大的盘口宽度即买卖五档,这样的情形下我们能够分析的数据其实相当有限。

  事实上个股日内股价是会存在波动性的,而由于level1数据只提供买卖五档的数据,因此如果我们在每一个时间节点上观测到的盘口数据均只有五档,但是如果我们将我们每个时间点上的观测数据串联起来,我们就有可能得到超越五档的行情数据。

  而从全市场而言,我们能够获得的最高高频率的盘口数据就是tick数据。

  我们tick数据来源于天软,level1数据只提供5档买卖价,图1为该tick数据示例,由于天软的tick数据是由交易所多台服务器推送,因此数据时间间隔并不固定。各家数据提供商提供的数据也会有一定的差别,也是因为接收推送的服务器不同的结果。

  表1:tick数据示例

  

  以高频数据为“探针”

  我们看到tick数据上有很多我们在低频数据中获取不到的挂单数据,我们就需要想办法汇集这些高频数据中的信息。

  在日内的高频数据中,股票价格就像一根探针,随着成交价格的上下波动,帮助我们探知到市场上投资者在不同的价格上的挂单数据,从而获得当日完全的挂单数据。

  我们将表1中的逐条tick数据转化为如图2中挂单序列,挂单序列展示的本质就是股价运行的轨迹,而从序列中我们能得到更多的是在当前成交价上下买卖五档的挂单,而我们根据当日历史的挂单,在每一个时间点上均可以汇总得到一个当日未成交的挂单表。

  图2:挂单序列示例

  

  通过图2中对当日挂单的汇总,得到在9:30:33时刻的挂单数据,这样的方式我们就得到了一个买卖共计22档的盘口数据,这就使得我们在每一个时间点上可获知的信息含量更高了。不过这样的方式与真实挂单的区别在与,之前挂单的投资者有可能会撤单,因此汇总到最终的挂单数据可能并不是当时真实挂单,但是至少能够反映在各挂单价格曾经出现过的预期,一定程度上能够反映出筹码的分布形态。

  买卖压力

  在我们能够得到足够长的挂单数据之后,我们就可以分析个股在买盘和卖盘上筹码分布的状态,我们称之为买卖压力。

  但是不同挂单价格对当前价格的买卖压力应该是不同的,例如在买一卖一上的巨额挂单相比于买五卖五上的巨额挂单,对于当前的价格影响显然会更大,因此如果需要计算买盘与卖盘上的买卖压力,我们就应该对当前价格距离不同的挂单赋予不同的权重,离当前价格更近的挂单赋予更高的权重,而离当前价格远的挂单赋予较低的权重。

  我们定义挂单i的权重为:

  其中Close为当日收盘价,Pi为挂单价格。

  据此我们计算得到个股买卖压力:

  其中Voli为i挂单上的挂单量。

  我们用以衡量买卖压力的指标买卖压力比P:

  

  买卖压力失衡

  计算得到了买盘与卖盘的压力,我们就想思考,当买卖盘压力出现失衡的时候,股价的表现会是怎么样,于是我们用A股股票数据进行了探索。

  1.1. 数据来源

  我们使用中证500成分股,2010年以来tick数据来计算每个个股上的挂单数据。

  全天数据过于繁杂,且全日数据对未来预测性相对有限,同时也为了降低计算量,我们采用个股收盘前一个小时的tick数据来汇总盘口数据。

  如表2中所示,我们对某个股单日收盘前1小时盘口挂单数据进行了汇总,得到如下的挂单数据,我们可以看到该个股收盘价为5.43,通过这样的方式我们获得了更多档位的挂单数据。

  表2:汇总挂单示例

  

  1.2. 买卖压力失衡

  根据之前对于买卖压力的定义,我们对中证500成分股所有个股用我们的方法来计算了买卖压力比值。

  我们以某个股为例,来观察个股买卖压力分布情况。

  图3:买卖压力分布图

  

  根据个股的分布状态,我们以过去20个交易日均值±1.96倍过去20个交易日标准差,作为买卖压力失衡的界限,以向上突破为买压占优,向下突破为卖压占优。

  以个股为例展示其买卖压力波动情况如图4。

  图4:买卖压力图

  

  1.3. 超额收益

  1.3.1.

  事件驱动评估系统

  在对事件影响的评估过程中,我们发现市场行情对于股价的影响、小盘股效应对股价的影响、涨停没有买入机会等,给评估事件冲击的收益带来了很大的困难。

  为了解决这三个问题,我们设定了对应的解决方法,即制定计算真实超额收益的方法:

  1、事件发生后,从下一交易日始,选择首次开盘涨幅低于9%的首个交易日作为评估起始日T+1;

  2、计算自T+1日至T+N日,发生事件公司(A)超额对应中信一级行业收益率Ra;

  3、筛选A公司所在中信一级行业内,与A公司在T+1日市值最为接近的5家公司(以市值±30%为限),计算这些公司超额该中信一级行业的平均收益Rm;

  4、计算该公司相对同行业近市值公司收益率Ra-Rm,并计算累计收益率;

  5、所有测算剔除ST、*ST。

  1.3.2.

  超额收益测算

  通过我们的事件驱动评估系统,我们对样本池内股票出现买卖压力失衡的个股的超额收益进行了测算。

  图5:买压卖压占优超额收益

  

  我们可以看到:

  1、在买压占优情况下短期内个股会呈现明显的正向超额收益;

  2、在卖压占优情况下短期内个股会呈现明显的负向超额收益;

  3、买卖压力失衡情况消失后,股票的超额收益呈现反向逆转,这意味着买卖压力失衡带来的超额收益仅仅为短期冲击影响,后期股价会逐步修正恢复到原状态。

  1.3.3.

  买压占优分析

  在买卖压力失衡的形成过程中,当日价格的波动对挂单是会有很大的影响的,因此我们观察当日股价涨跌幅是否会对我们的买压占优产生影响。

  我们根据日涨跌幅将个股区分为三种状态:

  1、当日上涨:当日涨跌幅高于2%;

  2、当日震荡:当日涨跌幅介于-2%到2%之间;

  3、当日下跌:当日涨跌幅低于-2%。

  图6:当日涨跌对买压占优超额收益影响

  

  我们可以看到区分了当日的涨跌状态,对于我们买压占优下的超额收益影响非常明显:

  1、对于买压占优的个股当日下跌然后出现买压占优时,接下来6、7个交易日呈现明显的超额收益;

  2、而当日上涨出现买压占优时,往往呈现的是一种追涨的姿态,而不能为我们后续带来超额收益;

  3、当日震荡情形下,买压占优能够对超额收益产生的影响较为有限。

  1.4. 策略构建

  根据测算的样本池内个股的买卖压力失衡状况,我们构建选股策略,选择当日下跌过程中出现买压占优的个股,并持有10个交易日,观察历史以来策略表现,我们考察在持仓上限分别为10、20、30情况下策略表现。

  图7:策略净值与仓位(10通道)

  

  图8:策略净值与仓位(20通道)

  

  图9:策略净值与仓位(30通道)

  

  图10:收益率分年统计

  

  从净值图与分年统计表中,我们可以看到,10个通道的表现最为出色,年化取得19.66%的绝对收益与9.56%的超额收益,但是持仓数量偏少,导致策略净值的不稳定,不过值得注意的是16、17年该策略的表现较为出色,分别取得9.07%和6.68%(截止2017年4月28日)。

  但是由于个股上的买卖压稳定性欠佳,因此据此构建事件驱动策略相对风险较大。

  总结

  在本篇报告中,我们提出了关于高频数据应用于低频选股的第二个思路,即通过整合高频数据获得信息含量更高的低频数据。

  我们依据tick级别的买卖盘口数据,将日内股价作为探针,探测投资者在股票上的挂单信息,将其汇总成一个长挂单数据,从而得到想比于单独的切片挂单信息含量更大的盘口数据数据。

  通过分析我们得到的盘口数据数据,我们可以分析当前股价上下方的筹码分布情况,分析买卖双方力量大小,从而指导未来个股走势方向,同时有可能预判指数走势。

  根据得到的扩展后的盘口数据,我们将个股的买盘与卖盘分别加权得到个股当天的买盘压力与卖盘压力,进而识别个股买卖盘压力失衡触发点,我们发现:

  1、在买压占优情况下短期内个股会呈现明显的正向超额收益;

  2、在卖压占优情况下短期内个股会呈现明显的负向超额收益;

  3、买卖压力失衡情况消失后,股票的超额收益呈现反向逆转,这意味着买卖压力失衡带来的超额收益仅仅为短期冲击影响,后期股价会逐步修正恢复到原状态。

  依据这个结论,我们构建个股层面的事件驱动策略,选择在下跌过程中触发买盘占优个股,并买入持有10个交易日。10个通道的组合,我们获得了年化19.66%的收益,并且16、17年该策略的表现较为出色,分别取得9.07%和6.68%(截止2017年4月28日)。

  未来我们依据买卖盘拓展的挂单数据会在选股与择时方面进一步研究,敬请关注。

  风险提示

  历史回测不代表对未来业绩承诺

  天风金工专题报告一览

  1《FOF专题研究(三):华泰柏瑞量化A偏股混合型基金》 2017-07-24

  3 2017-07-17

  4 2017-07-11

  8 《》2017-06-12

  9 2017-06-01

  10 2017-05-25

  11 2017-05-14

  13 2017-04-16

  14 2017-03-22

  15 2017-03-10

  16 《金融工程:专题报告-基于自适应破发回复的定增选股策略》 2017-03-09

  17 《金融工程:专题报告-定增节点收益全解析》 2017-03-06

  18 2017-03-06

  19 2017-02-14

  20 2017-02-13

  关注我们

  Email:chenyi@tfzq.com

  Email:xujintao@tfzq.com

  Email:hanjinyang@tfzq.com

business.sohu.com true 量化先行者 https://business.sohu.com/20170801/n504991830.shtml report 7568 报告要点高频数据应用于股票市场的关键点在于高频数据到低频信号的降频逻辑一是利用高频数据的独特性对数据进行定性,进而加工高频数据,得到低频信号;二是收集高频数据路
商业周刊/中文版

商业周刊/中文版

以洞见和趣味服务于以新商业领袖为主的全球化新经济时代读者

面包财经

面包财经

为价值而生 | 原创 | 深度

和讯网

和讯网

新媒体的实践者、研究者和批判者。

今日全球头条

今日全球头条

全球市场,深度解读,就在凤凰iMarkets

谁谁谁

谁谁谁

金融小故事,有趣又有料