- 主题:你们做策略的时候,是选哪种方式?
你这过滤函数就成了未来函数。
--
FROM 110.184.113.*
好数据,不好数据你是在数据产生之前还是之后判断的?如果你今天能决定明天的好数据,当然没有未来函数。
--
FROM 110.184.113.*
如果在过去90%都满足某种条件,那未来90%也满足这种条件的概率肯定远大于不满足。
这个假设是在模型有好的泛化能力的前提下才成立的,一般的条件过滤没有多少泛化能力。如果泛化能力不错,一般可以作为预测而不是过滤。
【 在 tmchzy2 的大作中提到: 】
: 如果在过去90%都满足某种条件,那未来90%也满足这种条件的概率肯定远大于不满足。
: 难道所谓的策略不就是用旧数据来评估未来数据吗? 如果用了过去数据就代表未来函数,那用旧数据回测,岂不就是100%用了未来函数?
:
--
FROM 110.184.113.*
过滤产生未来函数的例子:
1.过滤掉<10元的股票
2.过滤掉已退市的股票
--
FROM 110.184.113.*
楼主认知需要更新了,我举的两个还是无意间引入未来函数的比较一般的例子,你看不出未来函数是怎样被引入的。
--
FROM 110.184.113.*
提示一下:
例一相当于提前知道了股价会到10元以下
例二相当于提前知道了股票要退市
【 在 tmchzy2 的大作中提到: 】
: 照这么算的话,任何策略都会用到未来函数。
: 我的理解是未来函数用到了未来的数据,例如:盘中买的策略,使用到了买入当天收盘后的成交量。
: 只要不用到未来数据的,都不应该算未来函数
: ...................
--
FROM 110.184.113.*
这要看筛选规则,如果规则或调整规则参数用到过后面的数据,就会引入未来函数。
原则就是不能将当日之后的任何信息泄漏。
【 在 clivec 的大作中提到: 】
: 请教下,今天筛选昨天股票中符合例子的条件也算未来函数吗?个人只以为是对股票的筛选,万望解答,感谢。
:
: #发自zSMTH@MI 9
--
FROM 110.184.113.*
如果是只过滤掉退市公告日这后的数据就没问题。
【 在 vabc3 的大作中提到: 】
: 赞,这个好像叫“有偏见的数据”,效果上等同与未来函数
--
FROM 110.184.113.*
股票行情的每一个数据都是钱堆出来的,而且相对于股市的复杂性来说,数据量是不充足的。除非还没想到处理方法,应该尽可能充分运用数据,数据分布复杂,过滤掉大量数据一般会对数据分布产生比较大的影响,产生的负作用也未必能有充分的认识。
--
FROM 110.184.113.*
以决策的时间点为边界,只要直接或间接用到了后面的数据就引入了未来函数。未来函数和过拟合还不一样,过拟合是拟合了训练数据的局部分布特性或噪声数据,表现在训练误差很小,验证集误差大。未来函数有可能不影响训练集误差,直接减小测试集误差。
【 在 clivec 的大作中提到: 】
: 那我可能明白了,您的意思是因为近两年某行业走势不错,把这个行业作为筛选条件用于回测,其实就是一种未来函数,属于对这段期间的过拟合,是这个意思吗?
: 【 在 clivec 的大作中提到: 】
--
FROM 110.184.113.*