要建立一个量化策略,预测目标通常是什么?

理由
举报 取消

如果要建立一个量化策略,采用预测的方法,那么预测目标是什么? 我看了一些文献,但是很少有谈这个的,大部分的预测目标都是一个二分类(Binary Classification)问题,就是下一个时刻的涨还是跌,但是这样的分类怎么转化成策略呢?当然最简单的,就是下个时刻涨就买入或持有,跌就卖出或空仓,但是这样会不会导致频繁交易。其次,如果预测的是天级别或者时间跨度比较大的,那么在这个时间区间内什么时候执行呢?最近看到有个文献说,他用了多分类,就是大概把未来的价格时间序列分成几种模式(就是几种趋势),大概六种,然后根据这几种模式去操作。这个策略看上去还不错,不过有几个麻烦的事情,首先时间序列的模式这种东西是不是靠谱,然后如何筛选出6,7个元模式,相似性度量用什么,序列的长短怎么取。前面看到nova avon说基于指标的系统可能不是正途,要基于模型去做,如果基于模型的话,那模型如何转化成策略呢?

2017年8月7日 7 条回复 1002 次浏览

发起人:桂能 管理专家

刘涛脑残粉

回复 ( 7 )

  1. 包不同
    理由
    举报 取消

    谢谢邀请,不过我很难帮得上你。你得在实践中摸索出不同 objective 和实际策略 PnL 的关系。这绝对不是一个简单直接的单向过程,而是需要反复 iterate。

    这是一个真正的 million dollar question,所以除非是你的导师、同事、合伙人,否则你问到的任何人都很不会给你更多细节了。

  2. 陈小米
    理由
    举报 取消

    最近和一个做机器学习的朋友在交流。也就和题主类似的疑问做了些探讨。这里分享一下。

    机器学习是运用一定的样本集作为输入对模型进行训练后,达到可以对新的输入做较为准确的判断的效果。

    诚如题主所说,很多时候为了学习的准确度和简易读,会做个分类,比如按收益率的大小划分为1(涨:>3%),0(震荡-3%~3%),-1(跌<-3%)。经过实证我们发现划分的更为细致是不利于机器学习的准确性的,因为中间的模糊地带0是不太好判断出来。

    下一个问题是学习之后的模型对于新的输入判断准确率大概70%,但大部分都是0,属于无法给出交易型号的这种。这也是我们所最为头疼待解决的一个问题。

    所以讲到这,先回答第一个问题,预测目标是什么?

    通过准确率(胜率)来判断预测效果。至少是50%的胜率,能说明运用预测模型比简单猜测涨跌的准确概率要大。

    分类后如何做成策略?

    预测涨就买和预测跌就卖出,这种简单策略没有问题。交易频繁本身也没有问题,不影响策略的好坏。至于预测的周期时间跨度长短不一样,比较长时间时期间如何执行交易,一般都是滚动做预测,所以即使周期长的策略也不会出现交易的空档期。

    多个分类如何选出元模式,相似性怎么度量,序列长短选取?

    之前做过一段时间HMM,隐马尔科夫状态转换模型。元模式和序列长短的选取大致也对应了HMM模型的一些先定参数,混合正态的维度以及市场状态(不同市场模式)的个数。序列长短也是一个可控可变的参数会影响模型效果。所以一个封闭模型先定的参数如何选取能达到最佳的模型效果,这个是不能一概而论,没有标答的,甚至如果不在乎经济含义的话,去fitting参数得出最优的解也未必不可。过拟合的风险在于模型运用一段时间可能会失效,但哪里有HF真的只用一个模型而且一用十年的。短时间内或者IS一段时间能盈利,我觉得模型和参数就是ok的。

    ========================================================================

    其实遇到问题更好的方式是自己去探索,哈哈码农就要统治世界了,我之前也说过学点代码是自带工具,随想随用。

    下面贴一下朋友写的机器学习的研究,包含一些源代码的分享。可以在此基础上按照自己的思路去做些探索性的研究。

    【机器学习方法研究】——思路整理、支持向量机

    以上。

  3. 王力
    理由
    举报 取消

    题主问了好多问题, 看俺来乱答!

    1.量化策略如何评价?

    既然是策略,请按评价策略的那一套东西:比如夏普率、年化收益率、最大回撤这些去评价。

    2.预测目标是什么?

    这个具体问题具体分析。

    如果是Regression,那么目标函数就是均值、方差。。。

    如果是Classification,那么目标是准确率、敏感度、可靠性。。。。。

    很可惜,上面的这2个方法是学术界搞的。在业界,还是用问题1里面的方法来评价策略。

    3.大部分的预测目标都是一个二分类(Binary Classification)问题?

    没人规定一定得用Classification,你可以用Regression。

    只是你用了数学的方法,那么就先得确定Regression的假设。数学公式不是拿来用就可以了,它们都有前提的。

    4.分类怎么转化成策略呢?

    这个简单,预测是涨就买进,预测是跌就卖出。注意涨跌的分割线不一定是0,比如可以定义预测股票涨1.5%的,买进信号;或者期货跌30点的,卖出信号。

    5.“会不会导致频繁交易。其次,如果预测的是天级别或者时间跨度比较大的,那么在这个时间区间内什么时候执行呢?”

    这个问题俺也不知道怎么回答了。

    感觉就像有人问“怎么陨石永远都掉坑里的?”

    就像物理学解释不了世界为什么是这样的,就抛出一个“人择原理”一样。

    6.“首先时间序列的模式这种东西是不是靠谱,然后如何筛选出6,7个元模式,相似性度量用什么,序列的长短怎么取”

    常用的时间序列的模型是学术界搞出来的东西,偏数学的,注意它们的前提条件。说句打击人的话,在量化界基本没用!

    相似性度量这个也是见仁见智的。就像股市,怎么定义一个熊市?或者说,2个点的距离,除了欧式距离,就没别的法子了?

    序列的长短怎么取,这个只能说”少年,自己动手lu一发就有赶脚了” ^_^

    7.最后一段还是丢给nova avon大神自己回答吧!

  4. 空山新雨
    理由
    举报 取消

    简单的问一般用什么作为预测目标是无意义的。量化并不是简单的用数学规律去套市场。而是把市场作为一个系统,通过数学手段试图找出这个市场的一些特征,并从这些特征中找出实现盈利的方法。不同的市场有不同的特征,有一些是跨市场的共同特征,有的是个别市场或个别sector的专门特点。这些特点往往可以追溯到市场参与者,或市场制度,或交易标的特性上面。一个好的量化策略必然有其对应的市场特征和其实现盈利的市场参与对手。如果是既定的普适策略,可以看看该市场是否有其实现的条件。如果是研发新策略,没有对特定市场本质的了解是无从谈起的。

  5. joea.mao
    理由
    举报 取消

    广发证券有篇HMM研报中提到过

    基于HMM周择时策略研究涨、平、跌的择时效果 准确率 47.37%

    有个朋友用一日对数收益差、五日对数收益差、当日对数高低价差、当日成交量、对数融资余额差 5个特征向量进行了预测 样本内回测10~16年,年华大约10倍~

    基于隐马尔可夫模型的市场择时策略

  6. 抽象猴
    理由
    举报 取消

    垃圾: 从过去量价预测价格, 什麽模式不模式, 大量此类都是过拟合, 就算不是过拟合, 也没办法确定没有过拟合, 通通是垃圾

    还行: 从过去波动率预测波动率, 搞波动率期货, 或期权对冲等

    有用: 藉统计归纳外部因素, 例如天气温度对价格或波动率的影响, 你也可以自己思索有哪些因素能探讨, 抓网路上的开放资料来回归一番, 想法合理就不容易过拟合, 发挥空间比较大

    我在用的: 不讲, 留着自己溷饭吃

  7. Zheng Jiansen
    理由
    举报 取消

    具有反身性的系统还是用增强学习封装成黑箱比较好,不要去预测;

    市场的未来是不可知的,预测是搞自然科学的人做的事。

我来回答

Captcha 点击图片更换验证码