1. 没有feature与target的相关性分析,如何避免garbage in garbage out?
2. model有没有时效性?如果没有,那与常识不符。如果有,那如何保证一个model可以在训练集的5年内一直有效?
总结:一篇普通的灌水文章,把ML的那一套在股票上玩了一把,关键性问题一个都没解决。
【 在 Pnut 的大作中提到: 】
: 量化投资的一个核心问题是准确地预测资产价格的变化,如果能够预测资产价格的涨跌,那投资经理就可以构建更有效的投资组合来获取更大的投资收益。传统的“分析员-基金经理”模式下,分析员通过个人主观分析来预测资产未来价格,但该模式面临着以下两个挑战:首先,资产数目的急剧增加使得传统的模式需要极大的实施成本,这使得该模式不再适用;其次,分析员的主观判断受到其情绪的影响,使其预测不再准确。而量化投资模型可以解决这两个挑战,本文尝试构建量化投资模型来解决资产价格预测并进行证券投资的问题。
: 机器学习通过从大量数据中学习出可重现的模式,并利用习得的模式进行预测。由于机器学习算法具备较高的预测准确率和较好的泛化能力,模型出色的预测能力能够应用于样本外数据,该技术被广泛地应用到量化投资中,比如风险预测等,而技术分析在实际交易中被市场从业者广泛用于预测未来资产价格,相较于基本面数据,技术指标容易从市场数据中得到,且具备较强的时效性,现有的技术分析研究通常仿真单个技术指标或技术图形来验证某项技术是否有效,而考虑多个技术指标或技术分析方式的研究却相对缺乏。理论上,有效的挖掘多种技术分析方法的信息能够提供比单种技术分析方法更好的预测结果。为了更好的挖掘技术分析中的信息,本文设计了一套基于机器学习和技术指标的量化投资算法ML-TEA(machine learning and technical analysis)。该模型通过机器学习算法来挖掘多种常见的技术指标,从而预测股价数日之后的涨跌方向(上涨或下跌)再根据预测方向来构建投资组合,根据所采用机器学习技术的不同,ML-TEA共包含三种策略,分别为基于神经网络和技术分析的策略(NN-TEA)、基于支持向量机和技术分析的策略(SVM-TEA)和基于Adaboost集成的神经网络和技术分析的策略(Ada-TEA),模型构建完成后,本文通过模型的样本外投资绩效来衡量模型的有效性。
: 具体论文全文见附件。[upload=1][/upload]
--
FROM 73.15.220.*