如何使用大数据科学炒股?

佚名
佚名 2018-04-16 20:19:05
来源:爱提网

  我们有些人会觉得炒股那可是一个很让人我们时刻关注的事情,毕竟我们不可能会真正的对于炒股有一些不一样的看法,这就需要我们要科学炒股了,那么我们该如何使用大数据科学炒股呢?下面就一起来看看吧。

  机器学习在金融市场上的应用存在着很多短板,它的主要问题体现在三个方面:

  一是回测数据与真实市场数据之间的分布可能不同;

  二是存在着大量无法量化的变量;

  三是金融标的价格决定因素的多样性和复杂性,特别是对短期股价影响较大的公司层面消息和宏观经济政策。如前段时间的中美贸易摩擦,对于这样的突发性事件,没有办法做出提前预测,这也是美股及A股突然遭受重挫的原因。

  在第一个词云中可以看到有一个很大的“概念股”词汇,这就意味着从去年年度开始的那段时间,概念股是一个经常被提及的词汇;同样,在今年的2月至3月,概念股依旧是一个被经常提及的词汇。除去概念股、以及一些描述性词汇,还能看到在去年年底的时候,创业板、白酒、股指、银行也是相对被提及较多的一个词;但从今年开始并没有看到白酒,反而看到券商、军工、金融这些词汇。除此之外,在这两个图中,除了占比很大的“概念股”外,最为突出的是“震荡”这一词汇,这也是这段时间A股给大家的一个印象——一直处于震荡行情之中。

  概念股对金融小白而言,是个很陌生的词汇。除去查询相关概念外,我们还可以通过数据看到描述概念股时会提及哪些词汇。

  独角兽、科技、租售、新区等这些在今年的宏观政策层面经常被提及的词汇,特别是独角兽。这些词云能让我们对A股这几个月的行情有一个大致的了解,那就是他一直处于震荡之中。

  带着这样的一个背景,开始对股票做出研究。由于概念股很大程度上受到政策的影响,但由于政策的不可预见性,本次研究主要撇除政策影响,借由公司的财务数据以及由此计算得来的变量对股票的内在价值做模型的预测分析。

  主要用到的是Adaboost分类算法,用金融机构经常关注的市值数据及三大财务报表数据,对涨幅较高的股票做出预测。随后通过直接获得或者是间接计算的方法,从企业的三大财务报表中拿到财务数据以及其公司的市值数据来作为我们的数据池。

  市值数据其实就是在打开财经网站时经常会看到的一些变量,如股票换手率、公司总股本、公司流通市值、以及用来衡量公司价值的市盈率。

  在真正运行模型的时候,我们会把所有数据分成两个部分,一是训练集,一是测试集。我们会在训练集上训练我们的数据,以此来让它达到更高的精度,形成一个强的分类器,再把这个算法应用到测试集上,看看我们的模

  从结果来看,当看到上边的指标重要度时,那些重要性较高的指标确实是在机构挑选股票时经常用到的一些指标,如总股本。在对金融行业的数据做了简单测试后,我们发现,既然不能运用这种方式来获得我们想要的结果,那是否能用我们自身优势,运用数据分析的方法挑选比较重要的指标?

  用多因子策略挑优质股票

  多因子策略是业内最常用最经典的策略,正如前面所说,国家政策对行业的发展、股票的涨跌有重大的影响,但由于政策无法量化和难以预测。我们决定剔除这些因素,单纯从数据分析角度出发,利用现有财务数据,创建多因子策略,来挑选具有升值潜力的股票。

  影响股票的因素多种多样,多因子策略就是找出合适的多个因子对股票进行打分。得分最高的一些股票就是优质股票。

  首先选取了沪市和深市共2700多支股票,并且获取了2016年间这些股票的每日股价,以及对应时间区间的三大财务报表数据,财务指标以及每支股票的概念板块,形成我们的变量池,共400多个。

  随后要从400多个变量中挑选出某几个因子。先通过样本选取、变量recording、变量的筛选、缺失值的填充以及模型的选择和调整来达到初步筛选因子的目的,使变量的数目减少成了80个左右。

  紧接着使用逻辑回归,以股票的涨跌(0/1) 变量作为因变量,并且通过不断调整因子,最终得出对股价影响最大的八个因子。在这八个变量中,除了市盈率是按天变化的,其余七个变量都是按照季度进行变化的,并且他们大多数都来自三大财务报表。

  有了因子就可以构造策略,因子策略就是在所选股票池内将所挑选的因子线性组合起来,实现对每支股票进行打分,挑选出排名前十的股票,便是所需要的优质股票。

  再用回测来证明所选股票,所谓回测就是在过去的时间段内运行策略对结果进行检验。

  选用沪深300作为股票池,用冒泡排序的方法,选择因子得分Top10的股票模拟买入卖出操作,设定调仓频率为15天,即我们的策略每隔15天运行一次,并且运用2017年1月1号到本月初的历史数据,分不同时间段进行多次回测,来检验我们的策略。

  从过去一年的回测结果来看,大盘的收益率为22.55%,而我们的策略收益率为67%,足足是大盘的三倍,并且该策略的最大回撤仅为7.8%。因此可以说该策略在过去一年中有不错的表现。接着我们以过去半年和过去三个月运行该策略,短期检验效果依然显著,打败了大盘。由于这一策略是每隔15天运行一次,每次Top10股票有进有出。以过去一年的策略运行结果为例,挑选出了持有时间最长的以下九只股票,其中有三支酒类股,六只为长期绩优、回报率高的白马股。在2017年白酒家电类股票表现很强势,以贵州茅台和格力电器为代表的消费白马股成为市场关注的焦点。而白酒板块作为消费类白马股的领军品种,多支酒类股从年初涨到年尾。从后面基金的持仓情况来看,白酒股成为不少绩优基金的重仓股。另外还有两只汽车概念的股票被多次选进策略中。

  茅台的价格由去年年初的300多一路飙升到现在的700多,而它的收益也是有目共睹的。

  每支线段的起点代表这支股票被选进策略,终点代表剔除策略被卖出。但有的股票如格力电器和牧原股份有多条线段,这就代表着两支股票先前被选入策略后又被剔除,在之后的某个时间段再次入选策略。而且最终不难发现,绝大多数股票卖出时的股价是高于买入时的股价的。

  以上结果表明,多因子策略是经得住考验的,即使是在股价震荡的2017年,依然完胜大盘。

  用数据带你认识优质基金

  市场上的基金是根据投资对象来划6分类型的,而不同类型的基金有不同的风险和收益。

  股票型基金是投资于股票市场的基金,其收益率高,但是收益与风险并存,它有专门的基金经理和公司自主决定买入哪只股票来进行资产的配置。因此它的收益率与掌控它的基金经理息息相关。

  债券型基金主要投资于像国券、国债、金融债的基金,它的收益稳定风险低,适用于对资产安全性要求较高,并且希望收益稳定的人群。

  货币型基金就是以货币市场工具为投资对象,例如余额宝。

  混合型基金是指既投资于股票债券还投资于货币市场工具的基金,它的回报风险要低于股票型基金,但是要高于债券和货币型基金。

  指数型基金以特定的指数,比如说沪深300为标的指数,是一种被动型的投资方式。

  以上的内容就是小编在这里为大家总结的关于科学炒股的事情,毕竟我们如果不科学炒股的话肯定会受到影响,那么对于大数据的厉害上面也已经为大家介绍了,如果如果我们大家还有其他的问题,就请关注我们爱提网这里吧。

  推荐阅读:

  炒股需要知道哪些原则?详解炒股原则

  炒股如何补仓?

  如何看新闻炒股票?

本周热议
上海泳鑫升信息咨询有限公司:合理规划投资我们需要注意的?(二) 0
上海泳鑫升信息咨询有限公司:合理规划投资我们需要注意的?(一) 0
上海泳鑫升信息咨询有限公司:合理规划投资我们需要注意的?(一) 0
现货黄金一手多少钱?手续费是多少 0
现货黄金入金多少合适?低至30美元! 0
黄金做空怎么盈利?潜在风险分析! 0