《走近华尔街,资深量化研究员陪你聊量化》主题讲座
主讲人介绍
主持人:***先生毕业于美国斯坦福大学Electronic Engineering和Mathematics双学士,他接下来去麻省理工完成了Electronic Engineering的硕士和博士,有着非常强大的工科背景,那他在博士期间曾经参与了美国政府、J方和知名企业的多个高精尖项目,具有丰富的工程经验,由于他本人对于金融的兴趣,博士毕业后转身华尔街,进行量化策略的开发和研究,那他所工作的公司呢,是***,是一个非常顶尖的量化基金,他在量化方面有着非常资深的一个研究背景,他也是这个部门以来最年轻的华人资深量化研究员。今天的话,他会给我们带来一个非常实用的量化投资的一个实务讲座,然后结合他在工科和金融方面的经验,给大家分享一些他的一些感受。
内容声明
未经许可,禁止转载,严禁用于知识付费等一切商业用途。更多内容请关注微信公众号QTAPKU
美国是这么一个理念,就是说交易的机构对冲基金体量都很大。那么我想做什么事呢?我想换仓或者换股,把最大的这个金额在市场上制造出最小的火花,水花不留任何的痕迹,把它交易进来,这是我的目标,而国内的话正好相反。如果你要看这个所有的A股的股票数据,4000多只,你们会天天动不动就看到一个大单一下超过日交量的5%。过一会儿又会来一个大单试图操作市场,就国内是这个思路,就是说我想用最少的钱砸出最大的火花来欺骗所有的这种盲目跟随的投资者啊,所以理念上是很大差距,所以美国很早之前大概20年前就把一大单全都给它打散,形成分散小的单子在不同的电子交易市场。甚至通过不同的外分,就是说不是全是通过内部的渠道,我外分给其他一些broker券商帮我去做分担助理工作。这样的话,不让人知道他到底今天想卖什么,因为任何人现在的美股那么多流通性好的市场, 要卖出一个仓位,调整仓位都是会激起很大的火花,如果是量化模型的话很容易就能识别出这些东西。所以说在美股市场上tick级数据那么大是因为全是100股的,而国内你看看100股对应一手啊,这国内这个基本没有一手的,动不动就是几十手,你知道就是就是大概几千股的这种这种样子,所以国内数据量太小了,太小了。美国的话,苹果1毫秒可能蹦出100多个数据点,几乎是毫秒级的,这个东西,所以这个区别是非常非常大的。美国为什么那么做,学术界都一样扑在在那个上头,就是因为只有在那个上头,那么大的数据量上才有可能找到量化上的一些规律。如果说含有美国的日数据,每天收盘数据做任何的研究的话。这种数据,因为你想想年过一年,日过一日,年过一年,日过一日,这个日频率的交易数据再过一年也就多那么几个点根本不会影响,过去经济学家通过50年数据,40年数据做出的那个统计结果的结论。为什么因为增加点太少了,对之前那个结论都不会产生太大影响。所以说其实像他们fama-frech,他们做的一些多因子。那些out of sample,也都不算太长。这也是个人见解啊。就是说那种东西,一般的经济学家如果之前的这个日频率数据上没有挖掘到规律的话,那么很可能就是说我们新一代金融研究人员再去挖掘多几年的数据还是挖掘不出来,因为数据已经被学烂了,被研究透了,不可能有任何的空间。所以说现在tick级的数据是主流,国内的话同样的道理,tick级数据是主流。刚才给大家说的一个比如说就是拿过去几天A股的数据试试,过去几天领涨领跌的这个关系,来决定未来几天的持仓,这就是一个通过概率把频率升高来实现一定的多因子的效应,但这个因子是局限于量和价之间,但是如果说走的再比量和价远的话,在国内市场也不现实。或者说你这个东西就算是T+1的交易机制的限制还是可以变相实现。比如说你的股票吗?已经有一部分的持仓,对吧?比如,我现在持仓有100只股票。其中一只股票可能有1万股,那么我可以再通过,今天我可以买1万股再卖1万股,对吧?因为这个就是日内T,大家都知道,那么我们可以通过这种形式来进行更频繁的交易,比如说本来我做这些股票不动,无论我是什么样策略,哪怕我是也很很坚定的一个投资者,国内所谓的这个卧一个月卧好几周的这种阿尔法策略,那么我可以来这基础上每天做T,做T这1万股,通过你对过去价值作为独立变量因子来预测。你在中国这个市场可以缔造出很多的这个收益。如果大家看一看具体的新闻。经常会看到国内什么报道的这个地下T+1炒手交易工厂啊什么这种东西。我们大家听过没有。这样就是做高频的东西,那东西实际上就是美国高频在做的事情。这是国内团队搬出来的东西,大家觉得很low。地下之所以见不得台面,是因为他没有计算机代替他人下单,因为接口没有开放等等,但是那个实践操作啊,都是同样,你都是在做短期的预测。
然后回到刚才继续讲,刚才说到那个日内的T,对吧,这种形式地下工厂为了增加收益在干。只是他们没有系统化的意识,选择以计算机的形式来挂单,撤单,而是通过雇很多人进行那种下单。最早可能05年我们去玩什么魔兽争霸,还是什么游戏,挖那个金子对吧?通过这种比较人工的行为去做这件事情。所以这个东西我觉得还是蛮好的,觉得这种公司还很有前途,只要给他配一些互联网的人员,或者是对大数据编程,对吧,有一定的功底的人员就可能能把它实际实现自动化,这倒是一个比较能够可以做的地方。
再回到一下时间序列,重新来看一下时间序列。就在美国,时间序列是不具备预测性的,但在中国的话,时间序列可能有个独特的预测性。我是实实在在做出策略,才这么说的。我认为它有两点。接下来我看看能不能都覆盖。如果覆盖不了,那就覆盖一个。一个是涨停板跌停板,涨停板跌停板的时候就是除了隔夜的。已经出了隔夜新闻,说了什么什么内容,然后开盘之后直接涨停,这种直接刨去。在日内,因为这个行业,这个早市新闻,比如说券商今天或者报道什么华为5G概念对吧。这种东西的呢, 从开盘到一定的时间它会出现涨停板状态。然后涨停之后,它会涨停版,第一次封版,位于一个时间, 对吧?封了之后再开板。会有一个幅度。开板会后,有时还有一个开板的空间和时间,然后这样的话,一天开多少次板,每次开板的幅度是不是依次收敛的,对吧?然后这都是需要通过量和价对它的信息强度的一个估算,明白吧,是估算。相关的问题在A股市场也有一些文章已经作出了讨论,然后这个我就不展开说了。我给大家举另一个时间序列的例子啊。时间序列例子,A股,时间序列与美股时间序列不同点在哪里?如果如果是天天看tick级别的数据的话就很清楚。这个区别也是在用中国这个每日平均大单上面,大单的这个比例太高了,而且比较频繁。那大单的话,如果大家有学过传统的金融学、证券学,超过5%的ADV就是算大单了,5%为ADV什么意思?ADV就是Average daily trading volume 就是过去30天60天的平均日交易量。
然后,你只要超过百分之5,过去30天60天的平均日交易量,那可能就算大单。这种单子我们尽量会看到出现股票突然一个拉收,同时伴随着一个体量很大的买单,然后过一会儿又出现。平均起来每一股票,大家可以对基本的市场进行统计,可以看到这种的话天天的不断有在发生,基本所有股票都在发生。那这个单子的话,如果你要学历史数据去学什么呢?这个东西你可以理解。是一个偏市场操作思维的一个数据,因为正常人谁干这种事情,对吧,散户就是基于个人利益最大化。而营业部,各种东西,他是有选择,他从来不会说因为买不到那个东西而下一个大单。通常他就是做出这个单子,无非是两个产品之间做个交换,对吧,我这产品有一个持仓,我们要把这个持仓换成那个产品持仓。我自己进行一种Position transform,在公开市场进行,这是有可能或者两个不同的公司有什么这种协议,谁知道呢,所以这种东西的话当然是一种信息包含量非常大的一个数据,尽管说我们不知道它数据总量,但作为数据,具体到每一次都代表一个什么样的故事,如果你从横截面、时间序列去挖掘这个数据,你无需把一只股票追溯太久,就追溯到之前到三个月左右。就够了,为什么这么说?你要是一只股票看时间序列,追寻大单走六个月,那么咱们中国那个比较接地气的说法。那可能人家还还换装了呢。对吧?就换装了,觉得不是同一个装了。怎么样了。我们要排除这些因素,所以我们就把周期可能选入到三个月的周期,过去三个月周期呢?你可以看到。这个数据点是不缺乏的,因为这个大单的这个比例实在是太高了,你可能看一看上一次。出现了一天连续隔多少分钟,然后出现第二大单,然后出现第三大单,这三个单的形态频率有什么什么共同点。然后在统计上算一下,每当过去三个月这股票出现这个情况的时候。平均起来,第二天,第三天,未来五天是什么一个收益状况,这个东西是有很强的统计的重要性,至少我做出那个版本是有的。这个东西也是人做出来的,他不是计算机,他不会自己没事找事,他也会自己进行计划。对于z家, 他们的钱如果亏了的话,那么可能就从市场消失了,如果他们还在,股票上持续出现持续的pattern 的话,那么肯定是我认可我自己的这种简单粗暴的交易形式。这种交易形式我认为他能够带来钱,作为人是根本就不会进行进行反思的,也就是说。赚的钱可能都会归因于自己的这个能力。国内应该很少有这种人,就是说,我赚的钱,我自己心里还要反省我为什么今天赚钱。一般都是被动的,就我亏钱了,我首先自己要反省,这是给同事给公司一个交代,对吧?然后另外就说也是一个所谓的这种形式化的东西,因为你看每次写这个复盘。各种东西你也知道,还是要不停的写,因为你从来没有通过这次的行为真正改变什么。这就是我说的市场不可预测性。
就是z家也有同样的心态,如果这真的是z家行为的话,那么pattern就是会持续的,那就是下次我们看到这种情况下,我们就作为决定。然后呢,怎么样如何识别他未来的走势?包括可以有效分担风险,也可以通过横截面对吧,几千多只股票,那么多股票。为了寻找规律,简单点来说,你把它分成多少种不同的case的情况,哪种case展现出来的这个预测能力最强?你就用哪种case,然后呢,进行这个策略的实施嘛。就这个东西。跟美国还是有点不同,就是他还是在时间序列数据上有这个数据挖掘的空间,而美国在这上面是是没有的。大家有什么问题吗,可以举手?
(未完待续......)
量化交易协会——学习交流群
宗旨
本群致力于以量化交易策略研究为核心,为国内外在校学生、对冲基金及相关从业人员提供一个学习交流、经验分享、资源整合的高水平、高效率、专业性平台,目前已有高斯、图灵、牛顿、欧拉、黎曼、柯西六个微信群,如果你对量化交易充满热情,愿意分享和交流,欢迎加入我们。
群规
在监管高压下,也为了保障群可持续发展,不得已给出“两条红线,一则提醒”:
1. 交流内容不得违反国家法律法规,不要讨论可能导致封群的敏感历史、时事、人物,不能发表与官方对立的意见;
2. 不得公开或隐蔽发微信、QQ、群号、二维码等图片、文件、链接进行引流,禁止批量添加群友,禁止发布知识付费、招聘在内的任何商业推广信息;
3. 陌生人添加好友,注意甄别、安全。
进群请加好友candymind或扫描附件二维码,备注:水木量化
--
FROM 219.141.211.*