- 主题:搞定了深度强化学习
没有github,我本身就不是码农,另外提取特征这部分也不适合公开。
如果是关于DRL部分,那github一搜到处都是,我也是拿别人的DRL代码改成适合我的环境来用。只要一旦自己的环境确定好,跑通一个DRL算法,其他的DRL算法就是拷贝复制而已。
DRL使用下来,基于DQN类的算法效果最好,可能是更适合离散动作,像连续动作类的SAC,TD3,DDPG等效果没那么好,也可能跟我的特征有关系吧。
哦,不是有个开源的量化DRL,叫Fin-RL,你可以试试看,不过我就没用成功过,即使gitclone了也用不了,所以最后只能自己来
【 在 dreamburier 的大作中提到: 】
: 有没github 代码学习下
:
--
FROM 101.228.28.*
人工智能搞股市是伪命题?
股市的涨跌有多少是由突发事件驱动的,你怎么训练?把突发事件归为特征值?
比如俄乌战争爆发,乌龙指数事件,你怎么归纳?
【 在 beardao 的大作中提到: 】
: 结合了我自己的模型做特征提取,然后强化学习训练agent。效果还是很满意的,如图这个股票002761,数据取了20190101开始的,即使只是120个epochs,结果收敛的还不错,rewards是给agent的奖励,success是成功达到的次数,fail是失败的次数,miss是错失机会的次数。我这个强化学习模型不是像大多数人做的那种对一个股票进行交易的模式,而是训练agent找涨幅大,避免损失的模式。
: 这和我之前只用自己的模型操作观察到的方向是一致的,所以我对这个强化学习的结果还是觉得可信的
--
FROM 113.104.224.*
好 多谢
【 在 beardao 的大作中提到: 】
: 没有github,我本身就不是码农,另外提取特征这部分也不适合公开。
: 如果是关于DRL部分,那github一搜到处都是,我也是拿别人的DRL代码改成适合我的环境来用。只要一旦自己的环境确定好,跑通一个DRL算法,其他的DRL算法就是拷贝复制而已。
: DRL使用下来,基于DQN类的算法效果最好,可能是更适合离散动作,像连续动作类的SAC,TD3,DDPG等效果没那么好,也可能跟我的特征有关系吧。
: ...................
--
FROM 113.91.211.*
风起于青萍之末,浪成于微澜之间。我觉得机器学习会比我们更容易找出这种隐藏的征兆,当然也可能找不到。突发事件是个无数个小颗粒才造就的,而这些小颗粒可能有共性。就比如宏观上每个人都不一样,但都有红细胞,白细胞,DNA等,检查这些微观事物,可以反映疾病健康
【 在 johnfader 的大作中提到: 】
: 人工智能搞股市是伪命题?
: 股市的涨跌有多少是由突发事件驱动的,你怎么训练?把突发事件归为特征值?
: 比如俄乌战争爆发,乌龙指数事件,你怎么归纳?
--
FROM 101.228.28.*
训练完成后,你还需要拿训练结果跑回测,效果还是好才能证明有效
想做拟合太简单了,线性回归就可以,但是过度拟合最后的结果还是垃圾
--
修改:herowzz FROM 111.203.85.*
FROM 111.203.85.*
已经在实盘了,效果很好。就是每天收盘后跑数据太耗时。。。
【 在 herowzz 的大作中提到: 】
: 训练完成后,你还需要拿训练结果跑回测,效果还是好才能证明有效
: 想做拟合太简单了,线性回归就可以,但是过度拟合最后的结果还是垃圾
--
FROM 210.22.153.*
这几天亏惨了吧?
--
FROM 61.149.5.*
可以融券吧 多空都挣钱
【 在 olddognewwit 的大作中提到: 】
: 这几天亏惨了吧?
: --
: FROM 61.149.5.*
--
FROM 114.246.98.*
楼主应该没能力作融券。
【 在 blueglare 的大作中提到: 】
: 可以融券吧 多空都挣钱
--
FROM 61.149.5.*
没有亏啊,还是赚的
【 在 olddognewwit 的大作中提到: 】
: 这几天亏惨了吧?
--
FROM 101.86.215.*