http://www.zooglea.com

股市暴跌看数据教你如何跑赢大盘

  对投资理财感兴趣或者已经是股民的你,是否经历过震荡市场中买啥啥就跌,卖啥啥就涨的痛苦?今天的数据侠们通过历史股价和财务指标数据,为大家找到了那些具备“升值”潜力的股票。如何在没有内幕消息的情况下找对投资策略,一起来涨涨姿势吧~

  对投资理财感兴趣或者已经是股民的你,打开新浪财经首页,浏览最近两周的新闻,最直观的感受会是什么?

  通过大盘述评词云分析来看,被提到频率较高的词除了震荡、跌幅之外,还有走强、涨停和反弹,看来还是有潜藏在震荡行情中的潜力股。

  那么,错过了持有crypto coin的时机,没有内幕消息,又不想把结余工资就这么躺在余额宝或者低年收益率的货币基金里的我们,想要对股票多些了解,可不可以根据可用的数据和工作中用到的模型挑选出几只潜力股出来呢?

  大家都知道国家层面的政策风向对行业发展、个股升跌有着至关重要的影响,比如,因“煤改气”政策的密集出台,近几周供水供气板块中多股涨停。但由于政策的不可预见性,也不具有普遍适用性,所以我们暂时抛开政策层面的影响,尝试从历史股价和财务指标中找出普遍适用的一些规律,找到那些具备“升值”潜力的股票。

  不如先来看看常用财务指标预测股价升跌的准确性如何。我们从财报里选取了四个层面的指标,用Adaboost分类算法看它们预测“上证指数”中股票涨跌的准确度。

  从预测涨跌的结果来看,训练集上的准确度能达到85%,而在测试集合上也能达到78%。意思就是还满准的!

  市盈率、流通市值都是在公司研究层面中经常关注的指标,总的来看,“常用”指标还是经得起推敲的。

  股价涨跌是由很多因素相互作用的综合结果,准确来说,选用多种指标来预测股票的内在价值的方法也叫做多因子策略,作为一种最经典、应用十分广泛的选股策略,其目标就是“跑赢大盘”Beat the market。

  这不仅是最经典的做法,也是理性市场下最关键的挑战:如果不能跑赢大盘,还不如就买买ETF省心省事,佛系投资策略。

  “常用”指标之间的相关性、缺失值都会影响模型的稳定性,所以我们通过缜密的统计工具筛选变量。运用线性回归法,对股票的收益率进行回归,最终得到七个变量,这七个变量可以视为七个我们认为对于股价有极高影响力的因子。

  接着我们选用沪深300作为股票池,将挑选出的七个变量作为因子,对所有股票打分。用冒泡排序方法,选择因子得分排名在Top 10的股票进行模拟的买入卖出操作,操作的频率是每十五天操作一次,即我们的策略每隔十五天运行一次。运用近一年的历史数据(2017-01-01到2017-12-01)分不同时间段进行多次回测,来检验我们的策略。

  回测结果显示,我们的因子策略收益为49.64%,大盘的基准收益为20.79%,为大盘的2倍多,年化收益能达到56.80% (这时应该响起一点掌声)。

  由于每次运行策略时Top 10的股票都可能会有进有出,基于二百多次策略运行,我们选出以下七只经常入选的股票,当中有三只属于酒类产业:

  而“贵州茅台”表现太过抢眼,所以单独作图呈现。也就是说,我们的策略建议持续持有“茅台”,而它这一年的收益大家有目共睹。

  根据上图信息,曲线起点为开始持有该股票的价格,终点为卖出该股票时的价格,短期检验效果依旧显著。

  该策略在过去一年的回测结果中表现不错,那对于短期呢?我们以最近半年和最近三个月作为回测区间,得到如下结果:因子策略在震荡的2017年经受住了考验。

  计算综合评分的过程中,各因子得分的权重设计存在进一步改进的空间。因此之后在综合评分选股模型的使用过程中会对选用的因子、模型本身做持续的再评价和不断的改进以适应变化的市场环境。

  不同行业的指标评价标准差异很大,因为行业运营对资金的需求不一样,导致各个会计科目占比不同,特殊行业的特殊记账需求也不同,比如银行、保险和证券等等,我们会分行业进行深入研究。

  我们把数据分析的策略运用作为研究股市的起点,是想借鉴量化投资思想的纪律性,避免“非理性情绪”,而数据分析背后代表以理性的思维,观察并解释生活周遭发生的现象,进而能够将做决策的流程进行优化,投资也属于其中的一。其实投资者情绪也是投资中的研究范畴,有兴趣的童鞋可以参考胡昌生和池阳春在《金融评论》上发表的“投资者情绪:理性与非理性”这篇文章。

  凡是投资都有风险,谨慎理财信用至上,各位读者在投资的漫漫长路上也请多保重!

  期待更多数据侠干货分享、话题讨论、福利发放?在公众号DT数据侠(ID:DTdatahero)后台回复“数据社群”,可申请加入DT数据社群。

  本文数据侠Cara Q.,计算数学硕士。任职于Merkle,从事数据分析近三年。熟悉业务分析技能,从数据处理到统计建模,为客户提供营销策略。数据无处不在,希望通过挖掘数据背后隐藏的规律,了解生活,享受生活。

  本文数据侠Xiuli Z.,美库尔数据分析师,入职三年,在营销设计中了解商业,在数据分析中洞察消费者行为。喜欢阅读和烧脑电影,最近在研究分类模型,希望自己不仅仅会运用各种工具,还具有独到的insights。

  “数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。了解数据侠计划详情请回复“数据侠计划”,投稿、合作请联系。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。