量化狙击 发布于2020-05-02
回复 8
浏览 23860
116
**一、回归法**
回归法是一种最常用的测试因子有效性的方法,具体做法是将因子在第T期的暴露度与T+1期的股票收益进行线性回归,所得到的回归系数即为因子在T期的因子收益率,同时还能得到该因子收益率在本期回归中的显著度水平——t值。我们的回归模型为
在所有截面期上,我们对因子d进行回归测试,能够得到该因子的因子收益率序列(即所有截面期回归系数构成的序列)和对应的t值序列。t值指的是对单个回归系数的t检验统计量,描述的是单个变量显著性,t值的绝对值大于临界值说明该变量是显著的,即该解释变量(T期个股在因子d的暴露度)是真正影响因变量(T+1期个股收益率)的一个因素。一般t值绝对值大于2我们就认为本期回归系数是显著异于零的(也就是说,本期因子d对下期收益率具有显著的解释作用)。
因子评价方法:a)t值序列绝对值平均值——因子显著性的重要判据;b)t值序列绝对值大于2的占比——判断因子的显著性是否稳定;c)因子收益率序列平均值,以及该均值零假设检验的t值——判断因子收益率序列是否方向一致,并且显著不为零;d)t值序列均值的绝对值除以t值序列的标准差——结合显著性和波动性,辅助判断因子是否有效、稳健。
**二、IC法**
因子的IC值是指因子在第T期的暴露度与T+1期的股票收益的相关系数,股票池、回溯区间、截面期均与回归法相同。因子值在去极值、标准化、去空值处理后,在截面期上用其做因变量对市值因子及行业因子(哑变量)做线性回归,取残差作为因子值的一个替代。这样做可以消除行业因素和市值因素对因子的影响。计算残差序列和T+1期股票收益序列的相关系数作为T期因子IC值。
因子评价方法:a)IC值序列的均值大小——因子显著性;b)IC值序列的标准差——因子稳定性;c)IR比率(IC值序列均值与标准差的比值)——因子有效性;d)IC值累积曲线——随时间变化效果是否稳定;e)IC值序列大于零的占比——因子作用方向是否稳定。
三:分层模型回测
依照因子值对股票进行打分,构建投资组合回测,是最直观的衡量指标优劣的手段。一般来说,通过回归法和计算因子IC值都无法确定因子的单调性(例如,某因子值排名在中间1/3的个股表现比前1/3和后1/3的个股表现要好),但是分层回测法是可以确定因子单调性的。分层回测法逻辑简单,结果清晰,操作方便,并且具有能区分因子单调性的独特优势,是接受度非常高的一种单因子测试手段。测试模型构建方法如下:
评价方法:回测年化收益率、夏普比率、信息比率、最大回撤、胜率等。
下面以PB为例子,分不同的时间段来看下这个因子的有效性变化:
测试时间:2010-2015
**回归法测试结果:**
t值序列绝对值平均值——判断因子的显著性是否稳定 3.6896816155
t值序列绝对值大于1.96的占比——判断因子的显著性是否稳定 0.69014084507
**IC法测试结果:**
IC 值序列的均值大小 -0.0119692782516
IC 值序列的标准差 0.116411985523
IR 比率(IC值序列均值与标准差的比值) -0.102818263925
IC 值序列大于零的占比 0.507042253521
IC 值序列绝对值大于0.02的占比 0.802816901408
通过t值的绝对值平均值可以看到pb是个显著因子,对收益有明显的预测性,但是通过IC值均值可以看到,预测的周期性非常显著,可以猜测分组预测的单调性不足。
评论
感觉比较专业,我还差的太远。佩服。
2020-05-03
好文章总是没有上来就年化翻翻那么吸引人,但是仔细品味这才是真正的量化啊,感谢分享。佩服佩服。ps:编程能力也太强了,写得好工整!
2021-09-06
sm.WLS 没有通过addconstant 引入常量项,是不对的吧
2022-01-08