智能选股软件下载,智能选股软件哪个好用

  

  摘要   

  

  2019年以来XGBoost中证500增强超额14.61%   

  

  自2019年3月23日起,本周本报对XGBoost中证500增强版模型进行了深度跟踪。自2011年回测以来,该模型年化超额收益为17.55%,超额收益最大收益为5.06%,信息比为3.29。今年以来获得了38.87%的绝对收益和14.61%的超额收益。上周该模型获得0.40%的绝对收益和0.51%的超额收益。   

  

  2019年以来全A选股(沪深300行业市值中性)逻辑回归表现最好   

  

  上周沪深300涨跌0.12%。上周超额收益最高的模型是SVM,上周获得了-0.01%的绝对收益和-0.13%的超额收益。最近一个月超额收益最高的模型是随机森林,其绝对收益为3.51%,最近一个月超额收益为-0.27%。2019年以来超额收益最高的模型是logistic回归,2019年以来获得了37.68%的绝对收益和2.24%的超额收益。2019年以来RankIC均值最高的车型是XGBoost,其RankIC均值为0.131。   

  

  2019年以来全A选股(中证500行业市值中性)Stacking表现最好   

  

  上周中证500涨跌幅度为-0.11%。上周有7只模型跑赢基准,超额收益最高的模型是XGBoost,上周获得0.57%的绝对收益和0.67%的超额收益。上个月超额收益最高的模型是XGBoost,其绝对收益为6.32%,上个月超额收益为0.72%。2019年以来超额收益最高的模型是叠加。2019年以来,该模型获得了36.01%的绝对收益和10.67%的超额收益。2019年以来RankIC均值最高的车型是XGBoost,其RankIC均值为0.131。   

  

  2019年以来沪深300指数内选股XGBoost表现最好   

  

  上周沪深300涨跌0.12%。上周超额收益最高的模型是SVM,上周获得0.02%的绝对收益和-0.10%的超额收益。上个月超额收益最高的模型是SVM,其绝对收益为3.33%,上个月超额收益为-0.45%。2019年以来超额收益最高的模型是XGBoost,2019年以来获得了33.24%的绝对收益和-2.20%的超额收益。2019年以来RankIC均值最高的车型是XGBoost,其RankIC均值为0.056。   

  

  2019年以来中证500指数内选股XGBoost表现最好   

  

  上周中证500涨跌幅度为-0.11%。上周有4只模型跑赢基准,超额收益最高的模型是XGBoost,上周获得0.39%的绝对收益和0.49%的超额收益。最近一个月超额收益最高的模型是朴素贝叶斯,绝对收益5.79%,最近一个月超额收益0.19%。2019年以来超额收益最高的模型是XGBoost,2019年以来获得了29.78%的绝对收益和4.43%的超额收益。2019年以来RankIC均值最高的车型是XGBoost,其RankIC均值为0.098。   

  

  2019年以来中证800指数内选股XGBoost表现最好   

  

  上周中证800涨跌0.07%。上周有4个模型跑赢基准,超额收益最高的模型是神经网络,上周获得0.27%的绝对收益和0.21%的超额收益。上个月超额收益最高的模型是SVM,其绝对收益为4.09%,上个月超额收益为-0.11%。2019年以来超额收益最高的模型是XGBoost,2019年以来获得了33.52%的绝对收益和0.55%的超额收益。2019年以来RankIC均值最高的模型是朴素贝叶斯,RankIC均值为0.077。   

  

  风险:通过人工智能模型构建选股策略是历史经验的总结,可能无效。人工智能模型解释度低,慎用。   

  

  华泰人工智能选股模型   

  

  华泰金工的人工智能选股系列报告将多种机器学习算法应用于多因素选股。目的是利用机器学习算法的非线性特征和自动学习能力,从传统的多因素数据中挖掘出能够带来更高超额收益的非线性特征。在本周的报纸中,我们跟踪了Stacking、SVM、朴素贝叶斯、Random Forest、XGBoost、Logistic回归和神经网络这七个模型在月度多因素选股中的表现。对于每个模型,我们构建了以下五个多因素选股模型,定期跟踪(对于叠加模型,目前只适用于所有一个选股)。   

  

  1.全a股选股(沪深300行业市值中性):每月调仓,全a股选股,行业中性安   

性。

2. 全A选股(中证500行业市值中性):月频调仓,在全部A股中选股,组合构建时相对于中证500指数进行行业中性和市值中性。

3. 沪深300指数内选股:月频调仓,在沪深300指数成分股中选股,组合构建时相对于沪深300指数进行行业中性和市值中性。

4. 中证500指数内选股:月频调仓,在中证500指数成分股中选股,组合构建时相对于中证500指数进行行业中性和市值中性。

5. 中证800指数内选股:月频调仓,在中证800指数成分股中选股,组合构建时相对于中证800指数进行行业中性和市值中性。

自2019年3月23日开始,本周报将对XGBoost中证500增强模型进行深度跟踪,展示更多模型相关细节。

对于所有跟踪的模型,使用如下统一回测条件:

1. 股票池处理:剔除ST、停牌、上市3个月以内的股票。

2. 特征提取:70个因子作为特征(估值、成长、动量翻转、波动率、换手率、情绪、技术、市值等)。对原始因子做中位数去极值,缺失值填充(行业平均),行业市值中性,标准化。

交易费用:单边千分之二。

XGBoost 中证 500 增强模型近期表现

本章对XGBoost中证500增强模型进行深度跟踪,展示更多模型相关细节。该模型使用XGBoost模型对全A股票进行打分,并通过组合优化构建中证500增强组合,每半个月调仓一次。

XGBoost 中证 500 增强模型持仓板块收益分析

我们关注XGBoost在大金融、周期、成长、消费4个板块上的绝对收益和超额收益表现。四大板块构成如图表1所示。对于每一个板块来说,计算该板块内中信一级行业指数收益率的平均作为该板块的收益率。

「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228

收益情况展示在图表 2 和图表 3 中。

「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228

XGBoost 中证 500 增强模型详细回测信息

XGBoost 模型自 2011 年以来的详细回测信息如图表 4~图表 6 所示。

「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228

XGBoost 中证 500 增强模型各板块持仓情况

图表7~图表10展示了模型在四大板块上的前十大持仓情况,并展示每只股票的估值、盈利能力、成长性、动量、波动率、换手率打分。打分规则如下:

1. 估值:计算个股在同行业内的PB排序,得分为10表示个股的PB排在行业内的0%~10%的位置(PB最低),得分为1表示个股的PB排在行业内的90%~100%的位置(PB最高)。

2. 盈利能力:计算个股在同行业内的ROE排序,得分为10表示个股的ROE排在行业内的90%~100%的位置(ROE最高),得分为1表示个股的ROE排在行业内的0%~10%的位置(ROE最低)。

3. 成长性:计算个股在同行业内的ROE同比增长率排序,得分为10表示个股的ROE同比增长率排在行业内的90%~100%的位置(ROE同比增长率最高),得分为1表示个股的ROE同比增长率排在行业内的0%~10%的位置(ROE同比增长率最低)。

4. 动量:计算个股在同行业内的最近一个月涨跌幅排序,得分为10表示个股的最近一个月涨跌幅排在行业内的0%~10%的位置(最近一个月涨跌幅最低),得分为1表示个股的最近一个月涨跌幅排在行业内的90%~100%的位置(最近一个月涨跌幅最高)。

5. 波动率:计算个股在同行业内的最近一个月波动率排序,得分为10表示个股的最近一个月波动率排在行业内的0%~10%的位置(最近一个月波动率最低),得分为1表示个股的最近一个月波动率排在行业内的90%~100%的位置(最近一个月波动率最高)。

6. 换手率:计算个股在同行业内的最近一个月换手率排序,得分为10表示个股的最近一个月换手率排在行业内的0%~10%的位置(最近一个月换手率最低),得分为1表示个股的最近一个月换手率排在行业内的90%~100%的位置(最近一个月换手率最高)。

图表7~图表10展示了个股调仓以来相对板块指数超额收益。

「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228

其他模型跟踪

本章展示的模型为月频调仓的模型。

各模型上周、最近一个月和2019年以来超额收益表现

「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228

各模型2019年以来和2011年以来RankIC均值

模型RankIC计算方法:在某一股票池(如沪深300)内,使用模型对所有个股进行打分,然后将打分与个股下个月收益率计算Spearman 秩相关系数,即得到该模型的Rank IC 值。

「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228

对于全A选股,2019年以来RankIC均值最高的模型是随机森林,该模型RankIC均值为0.131。

对于沪深300成分内选股,2019年以来RankIC均值最高的模型是XGBoost,该模型RankIC均值为0.057。

对于中证500成分内选股,2019年以来RankIC均值最高的模型是朴素贝叶斯,该模型RankIC均值为0.098。

对于中证800成分内选股,2019年以来RankIC均值最高的模型是XGBoost,该模型RankIC均值为0.082。

各模型2011年以来超额收益曲线

「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228

各模型2011年以来详细回测绩效

「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228

各模型RankIC详细指标

「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228

华泰人工智能选股模型简介

本报告所涉及的所有机器学模型的详细介绍,可参见华泰人工智能系列报告:

1. 人工智能选股框架及经典算法简介

2. 人工智能选股之广义线性模型

3. 人工智能选股之支持向量机模型

4. 人工智能选股之朴素贝叶斯模型

5. 人工智能选股之随机森林模型

6. 人工智能选股之Boosting模型

7. 人工智能选股之Python实战

8. 人工智能选股之全连接神经网络

9. 人工智能选股之循环神经网络模型

10. 宏观周期指标应用于随机森林选股

11. 人工智能选股之Stacking集成学习

12. 人工智能选股之特征选择

13. 人工智能选股之损失函数的改进

14. 对抗过拟合:从时序交叉验证谈起

15. 人工智能选股之卷积神经网络

16. 再论时序交叉验证对抗过拟合

17. 人工智能选股之数据标注方法实证

18. 机器学习选股模型的调仓频率实证

19. 偶然中的必然:重采样技术检验过拟合

20. 必然中的偶然:机器学习中的随机数

21. 基于遗传规划的选股因子挖掘

22. 基于CSCV框架的回测过拟合概率

机器学习模型运用到多因子选股的流程

「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228

1.数据获取:

a) 股票池:沪深300成份股/中证500成份股/全A股。剔除ST股票,剔除每个截面期下一交易日停牌的股票,剔除上市3个月内的股票,每只股票视作一个样本。

b) 训练样本长度:72个月。

2.特征和标签提取:每个自然月的最后一个交易日,计算70个因子暴露度,作为样本的原始特征;计算下一整个自然月的个股超额收益(以沪深300指数为基准),作为样本的标签。因子池如图表31所示。

3.特征预处理:

a) 中位数去极值: 设第T期某因子在所有个股上的暴露度序列为 D_i,D_m为该序列中位数,D_m1为序列 |D_i-D_m| 的中位数,则将序列D_i中所有大于D_m+5D_m1的数重设为D_m+5D_m1,将序列中所有小于D_m-5D_m1的数重设为D_m-5D_m1

b) 缺失值处理:得到新的因子暴露度序列后,将因子暴露度缺失的地方设为中信一级行业相同个股的平均值。

c) 行业市值中性化:将填充缺失值后的因子暴露度对行业哑变量和取对数后的市值做线性回归,取残差作为新的因子暴露度。

d) 标准化:将中性化处理后的因子暴露度序列减去其现在的均值、除以其标准差,得到一个新的近似服从分布的序列。

4.训练集和交叉验证集的合成:

a) 分类问题:在每个月末截面期,选取下月收益排名前30%的股票作为正例(y=1),后30%的股票作为负例(y=0)。将训练样本合并,随机选取90%的样本作为训练集,余下10%的样本作为交叉验证集。

b) 回归问题:直接将样本合并成为样本内数据,同样按90%和10%的比例划分训练集和交叉验证集。

5.样本内训练:使用机器学习模型对训练集进行训练。

6.交叉验证调参:模型训练完成后,使用模型对交叉验证集进行预测。选取交叉验证集AUC(或平均AUC)最高的一组参数作为模型的最优参数。

7. 样本外测试:确定最优参数后,以T月月末截面期所有样本预处理后的特征作为模型的输入,得到每个样本的预测值,使用预测值构建组合选股。

本报告中,我们跟踪了Stacking、SVM、朴素贝叶斯、随机森林、XGBoost、逻辑回归、神经网络7个模型在月频多因子选股的表现。对于每一种模型,我们构建了以下5种多因子选股模型,进行定期跟踪(对于Stacking模型,目前只应用于全A选股,后续会对其应用于指数内选股进行研究)。

1. 全A选股(沪深300行业市值中性):月频调仓,在全部A股中选股,组合构建时相对于沪深300指数进行行业中性和市值中性。

2. 全A选股(中证500行业市值中性):月频调仓,在全部A股中选股,组合构建时相对于中证500指数进行行业中性和市值中性。

3. 沪深300指数内选股:月频调仓,在沪深300指数成分股中选股,组合构建时相对于沪深300指数进行行业中性和市值中性。

4. 中证500指数内选股:月频调仓,在中证500指数成分股中选股,合构建时相对于中证500指数进行行业中性和市值中性。

5. 中证800指数内选股:月频调仓,在中证800指数成分股中选股,合构建时相对于中证800指数进行行业中性和市值中性。

对于所有跟踪的模型,使用如下统一回测条件:

1. 股票池处理:剔除ST、停牌、上市3个月以内的股票。

2. 特征提取:70个因子作为特征(估值、成长、动量翻转、波动率、换手率、情绪、技术、市值等)。对原始因子做中位数去极值,缺失值填充(行业平均),行业市值中性,标准化。

交易费用:单边千分之二。

「华泰金工林晓明团队」2019年中证500增强超额14.61%――人工智能选股周报20191228

风险提示

通过人工智能模型构建选股策略是历史经验的总结,存在失效的可能。

林晓明

执业证书编号:S0570516010001

相关文章