- 主题:说一个不可能不引入的未来函数-测试集信息泄漏
如果按6:2:2划分数据,行情数据一般是新的20%做测试集,最老的60%做训练集,中间的20%做验证集。
a.模型用训练集和验证集反复调优
b.用测试集看效果。
如果测试集效果不理想,回到a。
问题就在这:每一次使用测试集都是对测试集的一次探测,这样每一个循环都会导致不同程度的测试集信息泄漏。这个信息泄漏无法完全避免,但要尽可能减小。
--
FROM 110.184.113.*
没错,但没有人能做到只看一次。
【 在 zhaoyounian 的大作中提到: 】
: test set只能用来“看”,不可以基于它的结果优化策略,否则就是未来函数。
: validation set才是用来评估/优化模型参数的。
--
FROM 110.184.113.*
今年已经实现55%,最大回撤-13.4,,从2018年开始前几年基本在40%到70%之间的年回报率。
【 在 hypeanut 的大作中提到: 】
: 听着可行,抽空试试。
: 顺便打听下楼主这样开发出的策略实战效果如何?
: 发自「今日水木 on 好多P」
--
修改:netvideo FROM 202.98.99.*
FROM 202.98.99.*
A股无杠杆
【 在 Nutch 的大作中提到: 】
: 做的A股?
: :
--
FROM 202.98.99.*
【 在 hypeanut 的大作中提到: 】
: 就一个要求,截屏晒个收益曲线行吗
: 发自「今日水木 on 好多P」
--
FROM 202.98.99.*
不同的交易方式要用不同的标注方法。对于选股策略,标注算法是最关键的地方,也是受交易规则影响最大的地方。
如果是固定周期换股的选股策略,一般可以用买卖一次的回报率。由于A股交易规则复杂,如果是一日周期,就算是回报率标注也不简单。如果周期长一些,有些交易细节可以忽略,就比较简单。
【 在 Bernstein 的大作中提到: 】
: 请问下,优化的时候,优化的目标是什么呢?
: 是策略的绩效?
:
--
FROM 202.98.99.*