图片说明

雪球知股乎系列二:百万投资组合里的宝贝

  报告要点

  作为 “猎金系列之十五”,我们继续深耕雪球网的文本信息价值,研究用户创建投资组合带来的选股信息增量。

  从抓取的结果来看,时间窗为2014年10月16日至2017年3月20日(抓取截至日),雪球网共计有443,043位用户创建了989,886个投资组合

  通过投资组合里股票仓位求出相应的价值,构建月度价值变动因子。研究截面组合有效性,同时从月度价值变动因子中剥离价格变动产生的影响,构建有效价值变动因子。

  IC以及分位数组合测试验证了因子选股的有效性。研究其和传统的价值、成长、反转、分析师情绪以及《猎金系列十四》中的雪球关注度因子五类因子之间的相关性,结果显示和上述因子相关性较低且Fama-MacBeth回归分析也表明价值变动因子可以带来显著的信息增量。

  基于价值变动因子构建选股策略。以中证500作为对冲基准,策略年化超额收益为22.25%,夏普比率为3.27,最大回撤为6.25%

  

  1

  雪球网数据概况

  1.1 雪球网平台优势

  诚如你我所见、耳闻:我们不知不觉的发现精准定位出现在生活的每一个角落。个人的数据性、功能性概念在不断放大;私密性、自我性逐渐变得奢侈。这就是大数据时代的直接体现,也是人工智能所带来的震撼。而随着大数据和人工智能的成熟和普及,在量化界开花结果是一种必然。

  我们在《猎金系列十四》中详细介绍了互联网文本挖掘在量化领域的应用。在众多互联网平台中,我们选择雪球网作为我们进入这个领域的敲门砖。从最早专门讨论美股投资的社区“i美股”算起,雪球的整体运行时间已接近6年。在创始人方三文的多次采访中,他均提及“雪球网有超过600万人注册,每天活跃着100万用户”。

  1.2 创建投资组合的流程

  “创建投资组合”功能是雪球网在2014年底推出的新功能。本质上来讲,是为了让管理投资组合这种行为大众化。进入雪球网主页-->个人账户-->创建新组合,进入到创建投资组合的界面。然后选择“组合名字”-->“市场范围”-->“添加成分股”。这样就能在雪球网上创建一个投资组合。

  

  当创建好、完成建仓之后,就能在个人主界面下看到自己创建的所有投资组合。并且能看到后续的调仓行为明细、投资组合的历史净值等一些细节。

  

  1.3 创建投资组合功能在基金的应用

  在《猎金系列十四》中,我们提到基于雪球网构建的三个大数据基金,而这三个大数据基金都或多或少的利用了投资组合的行为数据,并且主要利用了组合的活跃性以及包含股票的冷热程度两个维度。

  

  1.4 创建投资组合的数据抓取

  根据前面雪球网创建投资组合界面介绍,我们构建相应板块(调仓明细及净值曲线,参见图表-2)的抓取方法,具体参见《猎金系列十四:雪球系列一》。总体而言,通过遍历所有活跃用户,完成投资组合的抓取。其中调仓行为明细(参见图表-4)是接下来的研究重点。

  我们以ZH184251(投资组合ID)为例,通过解析ZH184251这个投资组合的调仓行为明细,能得到网页端对应的数据,这里包含详细的调仓对象、时点、仓位、调仓行为是否成功、仓位价值等细节,参见图表-5。当然,实际上底层数据端口还包含每次调仓欲达到的仓位量以及上一次调仓欲达到的仓位量,但这不是本次研究的重点,就不予以赘述。

  

  

  2

  用户创建投资组合数据分析

  2.1 投资组合数目时间维度

  抓取的数据时间窗口为2014年10月至2017年3月20日(2017年3月20日为抓取截止日)。有443,043位用户创建了989,886个投资组合,人均创建2.23个组合,创建组合个数为1的用户占比61.4%。创建投资组合的日期自2014年10月份开始,而这与雪球网开启该功能较晚有关。

  从用户创建&取消投资组合的时间维度分布来看,15年年中创建投资组合达到高峰,而后来爆减并趋于稳定。目前来看,日创建投资组合在200左右。而从取消投资组合的维度来看,自2015年10月开始(该日是雪球网开始推出取消功能的大致时间点)取消行为进入顶峰期,目前雪球网日取消投资组合的数目在300左右。总体来看,关闭的投资组合数目达到16.6万,占比16.6%。

  

  2.2 投资组合覆盖度研究

  投资组合日调仓行为包含的股票对A股的覆盖度非常高,均值达到91.3%,且稳定性非常高。而从月度角度来看,自2015年初开始,月度覆盖度为100%。

  

  3

  基于投资组合构建选股因子

  3.1 因子构建逻辑

  每个雪球网用户创建的投资组合实际上就是一个投资产品。而目前摆在我们面前的是有近100万个基金经理管理的投资组合,只不过这些基金经理是来自五湖四海,来自大众。

  市场本身是一场零和博弈。众多专业投资者想要通过利用自己的专业投资能力获取超额收益,但结果往往事与愿违。部分投资者可能实现了这一目标,但是只是短暂的。想要长期实现超额正收益、创造巴菲特式奇迹实属不易。市场的投资者总有一种“后知后觉”的现象。当市场对某只股票的态度保持一种不变的态势的时候,市场的机会可能就此来临。而我们拥有100万左右的投资组合,那么这些投资组合的价值变动大致上可以代替、反应这种趋势和规律。我们构建价值变动因子,当因子变化幅度小的时候,就是价值来临的时刻;而该因子变动较大往往意味着机会的消失。

  我们将所有的投资组合重构成一个大的投资组合,在重构的过程之中着重考虑组合的有效性,删除关闭的投资组合,进而构建选股因子。那么需要做以下处理:1、调仓导致的仓位变动的数据回填;2、组合包含的股票数目限定;3、组合下线之后不再利用。

  3.2 仓位量回填

  根据雪球网抓取的数据特征,我们得到的是调仓行为相应时间截面上的数据,这个数据维度不是连续性的,比如张三的某个组合在2017年1月1日发生了调仓(下次调仓是17年3月1日),调仓标的是SZ000001。那么根据抓取的数据结果,我们得到1月1日SZ000001具体仓位量,但1月2日至3月1日之前是没有记录的。所以我们需要将这个变化导致的最终仓位量回填到下一次调仓行为发生之前。

  但是有些用户可能由于个人原因(比如不太活跃、甚至直接放弃组合,但是没有将其下线而已),导致两次调仓行为时间间隔特别久远,如果将这样两次调仓之间的日期全部回填,显然也是不合理的,我们需要确定一个适合的回填期限。回填期限的确定需要从用户调仓的活跃性以及价值投资的折中性两个角度考虑。如果周期过短,那么实际上是否认了价值投资的意义。如果周期过长,那么实际上是没有充分考虑用户换仓的这种行为本身的意义。

  我们研究了用户调仓的时间间隔(下次调仓与本次调仓的时间间隔),结果发现,用户调仓行为的时间间隔平均为28.7天,75%中位数为20天,而90%的调仓间隔发生在90天以内。这说明用户的调仓行为还是较为活跃的。而另一方面说明,如果我们将回填周期N设置相对较长并不会因为用户行为产生较大的影响。所以为了更好的体现价值投资的理念,我们设置回填周期N 为3个月。

  

  3.3 组合截面有效性研究

  作为互联网平台,实际上有些用户的行为是尝试性的。有时候用户可能仅仅是出于好奇心对功能进行了尝试,这样该组合包含的股票数目就特别少。那么为了保证投资组合这种行为本身的意义,我们需要对截面上组合包含的股票数目进行限定。具体做法:在横截面上观察每个有效组合包含的股票数目,如果股票数目小于N,那么我们认为该截面组合是无效的。这里我们确定N=10.这意味着如果横截面上组合包含的股票数目<=10,那么在该时点不考虑这个组合。

  当我们将N设置为10的时候,共计得到2,000+万的样本数,占截面股票样本量的55.6%。巨大的样本量完全支持我们去构建选股因子。并且月度覆盖度如仍然达到100%,也保证了因子本身的意义。

  

  3.4 价值变动因子构建流程

  根据前面的数据结构,我们构建时间周期为T的价值变动因子,数据准备如下:

  1、针对于某个投资组合,T时刻发生调仓后,对仓位量进行回填,回填期限为min[下次调仓日-当前调仓日+1天,90天],一旦用户调仓行为时间间隔超过3个月,那么T+3个月至下次调仓行为发生时刻期间该组合的标的无效(回填期限);

  2、如果在每个月末,组合包含的股票数目<=10,那么本月组合无效(截面有效性);

  3、我们前面提及,有将近16%的组合被下线/关闭,如果组合在某时刻组合关闭,那么认为该组合以后永远无效(组合下线);

  4、取每个投资组合T末的仓位量,将所有未关闭的有效投资组合关于某股票的仓位量进行加总(重构成一个投资组合);

  5、根据股票收盘价计算仓位量相应的价值大小。用T期仓位价值变动/T-1仓位价值得到仓位价值变动因子(注意,这里用的是收盘价而没有做复权处理,这是因为在雪球网里,一旦发生高送转,那么相应标的仓位量会相应变动,保证价值一致性);

  

  实际上通过上述方式计算的价值变动因子有一个严重的问题:价值的变动到底是因为用户持仓量的变动所致还是由持仓标的的价格变动所致,如果是后者那么实际上意味着这种方式和反转因子的相关性很高。所以,为了剥离价格变动产生的影响,我们进一步优化因子的计算方式,那么将步骤5 替换成步骤5’:

  5’、T期仓位量变动*T期标的价格因子/T-1仓位价值计算价值变动因子;

  

  实际上我们欲剥离的价格变动的影响,即在原来价值变动因子上-价格变动:

  

  公式(3)与公式(2)是等价的,为了便利,我们启用公式(2)计算。

  3.5 价值变动因子有效性测试

  价值变动因子定义:具体参见公式(2);

  个股数据:全市场A股,剔除交易日当天为ST、停盘、涨跌停股票;

  行业分类:中信一级行业;

  数据区间:2015年1月1日至2017年3月17日;

  构建月度频率的价值变动因子,并对其做IC检验。检测结果显示,IC均值为0.038,风险调整IC为0.562。而从IC历史走势来看,大于0的占比达到70%,证明了该因子的有效性。

  

  我们进一步测试了该因子与行业以及市值的关系。结果发现流通市值与价值变动因子相关性较弱,月度价值变动因子与流通市值秩相关性均值达到0.005。进一步检测了行业中性化以后的价值变动因子表现,IC测试显示,行业中性化以后,IC水准并没有下降,而稳定性有所大幅提升。

  

  而分位数组合的测试结果来看,组别之间的单调性一般,但是首尾组别的差异性非常大,首组表现出强势的选股能力,年化收益率达到40.38%,夏普率为0.86。多空组合年化收益率达到25.34%,夏普率为3.34,最大回撤为2.67%。

  

  

  3.6 众里寻他,只因与众不同

  前面的测试证明了行业中性化之后的价值变动因子依然有较强的选股能力。那么,和传统的价值、成长、反转、分析师情绪因子相比,是否会泯然于众呢?我们从相关性分析以及Fama-Beth回归角度进行了验证。

  测试结果显示,价值变动因子与传统因子以及《雪球系列一》中的关注度因子相关性较小。与《雪球系列一》中的关注度因子相关性较小意味着,虽然两个因子的数据源相同,均来自于雪球网,但是很好的保证了特异性。

  

  进一步我们对价值变动因子进行Fama-MacBeth 回归分析,将价值、成长、反转、分析师情绪、《雪球系列一》中的关注度这5 大风格因子以及价值变动因子作为解释变量。在我们加入各类风格因子之后,价值变动因子对股票收益的解释能力依然强悍。因而,相对于传统几大类 Alpha 因子而言,该因子确实带来信息增量,也确实是“不一样的烟火”。

  

  4

  基于价值变动因子构建选股策略

  4.1 价值变动因子选股策略构建

  选股基本条件:

  个股数据:全市场A股,剔除交易日当天为ST、停盘、涨跌停股票;

  行业分类:中信一级行业;

  数据区间:2015年1月1日至2017年3月17日;

  在全市场选股并用中证500对冲,选股流程如下:每个月最后一个交易日结束后进行组合的筛选和调整,按照中信行业对价值变动因子排序、选择每个行业因子值最低的10%比例股票建仓,按中证500权重配权。

  从对冲策略的结果来看,全样本选股策略年化超额收益为22.25%,夏普比率为3.27,最大回撤为6.25%。

  

  5 结束语

  本文是兴业定量研究团队“猎金系列之十五”。在本篇中,我们继续挖掘雪球网的信息价值,抓取用户创建的投资组合。在百万个投资组合中寻求能带来信息增量的选股因子。最终,通过定义有效投资组合,根据投资组合的价值变动,定义价值变动因子。基于该因子在全市场选股,并用中证500作为对冲基准,测试结果验证了该因子良好的选股能力。

  长坂坡,子龙将军,七进七出,百万军中取上将首级,如探囊取物。

  雪球网,兴业定量,步步为营,百万组合寻选股因子,实锦上添花。

-------是以题名!

  详情请参阅相关研究报告《雪球知股乎系列之一:和关注度因子有个约定》,或联系兴业金融工程研究团队。

  --------------------------------------

  联系人:任瞳

  电话:0755-2382 6010

  E-mail:rentong@xyzq.com.cn

  --------------------------------------

  联系人:徐寅

  电话:18602155387,021-38565949

  E-mail: xuyinsh@xyzq.com.cn

  --------------------------------------

  联系人:郑兆磊

  电话:13918491550

  微信:13918491550

  E-mail: zhengzhaolei@xyzq.com.cn

  --------------------------------------

  更多量化最新资讯和研究成果,欢迎关注我们的微信公众平台(微信号:XYZQ-QUANT)!

business.sohu.com true XYQUANT https://business.sohu.com/20170624/n498399642.shtml report 12556 报告要点作为“猎金系列之十五”,我们继续深耕雪球网的文本信息价值,研究用户创建投资组合带来的选股信息增量。从抓取的结果来看,时间窗为2014年10月16日至20
商业周刊/中文版

商业周刊/中文版

以洞见和趣味服务于以新商业领袖为主的全球化新经济时代读者

面包财经

面包财经

为价值而生 | 原创 | 深度

和讯网

和讯网

新媒体的实践者、研究者和批判者。

今日全球头条

今日全球头条

全球市场,深度解读,就在凤凰iMarkets

谁谁谁

谁谁谁

金融小故事,有趣又有料