- 主题:你们做策略的时候,是选哪种方式?
1.用各种条件过滤不好的数据,这种方式,保留了看似很好的数据,但可能隐藏的了差的数据,但因为差的数据量不够等等原因,对结果的影响看不出来。
2.用各种条件选择出好的数据,这种方式,选出的数据可能只是在这个样本中很好的数据,并不一定符合未来数据或者其它样本的数据。
两种方式,你们一般选用哪种?
--
FROM 125.69.45.*
又没用到未来数据,怎么成未来函数了?
【 在 netvideo 的大作中提到: 】
: 你这过滤函数就成了未来函数。
--
FROM 182.149.161.*
如果在过去90%都满足某种条件,那未来90%也满足这种条件的概率肯定远大于不满足。
难道所谓的策略不就是用旧数据来评估未来数据吗? 如果用了过去数据就代表未来函数,那用旧数据回测,岂不就是100%用了未来函数?
【 在 netvideo 的大作中提到: 】
: 好数据,不好数据你是在数据产生之前还是之后判断的?如果你今天能决定明天的好数据,当然没有未来函数。
--
FROM 182.149.161.*
照这么算的话,任何策略都会用到未来函数。
我的理解是未来函数用到了未来的数据,例如:盘中买的策略,使用到了买入当天收盘后的成交量。
只要不用到未来数据的,都不应该算未来函数
【 在 netvideo 的大作中提到: 】
: 过滤产生未来函数的例子:
: 1.过滤掉<10元的股票
: 2.过滤掉已退市的股票
--
FROM 182.149.161.*
我并不这样认为,回测时,你说的这些事情是都已经发生了的,并不是还没发生。
如果你认为历史数据都是未来数据的话,那就没法讨论了。
【 在 netvideo 的大作中提到: 】
: 提示一下:
: 例一相当于提前知道了股价会到10元以下
: 例二相当于提前知道了股票要退市
: ...................
--
FROM 182.149.161.*
我觉得这是策略的问题,并不是数据的问题。
例如:某个策略是研究股价<10元的股票规律,那肯定就是要用历史上股价<10元的数据来研究,这肯定不是未来函数。
【 在 vabc3 的大作中提到: 】
: 赞,这个好像叫“有偏见的数据”,效果上等同与未来函数
--
FROM 182.149.161.*
我这里说的好的数据,是指对你策略结果好的数据,反之就是不好的数据。
【 在 fanci 的大作中提到: 】
: 什么叫好的数据,不好的数据?数据只有正确的和错误的,数据清洗还是必要的吧。
: 你是指好的标的?还是啥……
--
FROM 182.149.161.*
按照上面那位版友的说法,我从历史数据中,使用股价<10元的数据,这也是未来函数?
【 在 poggy 的大作中提到: 】
: 未来函数这么难理解吗?
: 比如,投资行业, 穿越回2009年,现在的你告诉当时的你, 砸锅卖铁也要买房,不要买股,一样
: 你知道发生的点, 和发生的点是两件事情。
: ...................
--
FROM 182.149.163.*
嗯,是的,只要数据跟后一刻没关系,就应该没用到未来函数。
所以我一直觉得那位版友说的:
“过滤产生未来函数的例子:
1.过滤掉<10元的股票
2.过滤掉已退市的股票 ” ,这很有问题。
肯定不能用现在的条件去限制历史数据,每一刻的历史数据,都应该用历史当时的状态来判断。
按照你举的例子,踢出st股,可以现在踢出现在的ST股,但在历史数据中,当时是不是st股,肯定是要判断的,肯定不能用现在是否是st的状态去判断历史数据。
【 在 poggy 的大作中提到: 】
:
: 那要看你这个小于10元是什么视角, 如果是历史当下所有小于10元的, 则没有引入未来数据,
: 就好比选男人, 如果, 你选择身高170, 年龄30的男人, 假如有90万人备选,
: ...................
--
FROM 182.149.163.*
已经发生的,已经存在的历史数据,就不存在是否是未来数据的问题,它们都是真实存在,有效的数据,而是否用到了未来函数,那是策略的问题,跟数据无关。
所以我认为不能就直接认为某个历史数据是未来数据。
【 在 netvideo 的大作中提到: 】
: 其实没有这么简单,你在进一步想一想这些过滤条件是怎么得来的,为会么这样过滤,怎么调的过滤参数。
:
--
FROM 182.149.163.*