出于对机器学习的兴趣,采用逻辑回归方法建立分类模型,预测指数涨跌。
利用逻辑回归对特征的主成分进行建模,得到指数 5 分钟级别的多分类预测模型,调 仓频率为 30 分钟。
如果对整个时间序列标准化与PCA,得到的结果是引入未来数据的,于是为了避免前视偏差,采用了滚动标准化与滚动PCA的方法
滚动标准化的窗口设置为100期,滚动pca的窗口设置为测试开始日期回溯到数据集起始日期
在做双分类模型后发现交易成本的影响较大,需要降低交易频率
同时,T+1的交易制度也让做空变得较为困难
有两个方向:
-
日度择时做底仓的基础上进行日内回转
-
建立多分类模型,提高买卖点位的准确性,降低交易频率
可以看出:
-
日度择时做底仓的基础上进行日内回转的效果并不好
解决方法:引入其他ETF,做横截面的策略,然后再进行日内回转
-
日内回转吃的是波动率而不是日度择时下的价格上涨
相反地,价格上涨反而会降低波动率,检验一下
如果是这样的话,那么引入波动率预测模型,只在波动率上升时日内回转
-
尝试在日度择时下的价格上涨只做顺T
-
多分类模型的预测准确率并不高,确定标签也缺乏一个合理的标准,样本不平衡的问题也变得严重。
-
最重要的一点还是得改进特征,添加更有效的因子!!!