【 在 beardao 的大作中提到: 】
: 结合了我自己的模型做特征提取,然后强化学习训练agent。效果还是很满意的,如图这个股票002761,数据取了20190101开始的,即使只是120个epochs,结果收敛的还不错,rewards是给agent的奖励,success是成功达到的次数,fail是失败的次数,miss是错失机会的次数。我这个强化学习模型不是像大多数人做的那种对一个股票进行交易的模式,而是训练agent找涨幅大,避免损失的模式。
: 这和我之前只用自己的模型操作观察到的方向是一致的,所以我对这个强化学习的结果还是觉得可信的
收敛这只能说明算法会学习,
至于学来的东西是拟合噪音, 还是规律只有通过测试集测试才行啊
--
FROM 124.126.1.*