10万实操一下,让大家开心开心。
【 在 beardao 的大作中提到: 】
: 结合了我自己的模型做特征提取,然后强化学习训练agent。效果还是很满意的,如图这个股票002761,数据取了20190101开始的,即使只是120个epochs,结果收敛的还不错,rewards是给agent的奖励,success是成功达到的次数,fail是失败的次数,miss是错失机会的次数。我这个强化学习模型不是像大多数人做的那种对一个股票进行交易的模式,而是训练agent找涨幅大,避免损失的模式。
: 这和我之前只用自己的模型操作观察到的方向是一致的,所以我对这个强化学习的结果还是觉得可信的
--
FROM 68.97.41.*