基于核密度估计的异常尾部不对称度
factor.formula
异常尾部不对称度 (S_φ):
核密度估计函数:
高斯核函数:
公式解释:
- :
异常尾部不对称度,用于衡量收益分布尾部的不对称程度。正值表示右尾较重,负值表示左尾较重。该值越高,表示收益分布的非对称性越显著。
- :
实际收益分布与对称分布的差异度量,用于判断收益分布是左偏还是右偏。$E_φ = \int_{-\infty}^{-k} (f_1(x) - f_2(x))^2 dx - \int_{k}^{+\infty} (f_1(x) - f_2(x))^2 dx$,当$E_φ > 0$时,表示左尾差异大于右尾差异,收益分布表现出左偏特征;反之,$E_φ < 0$时,表示右尾差异大于左尾差异,收益分布表现出右偏特征
- :
特质收益率,表示个股收益中剔除市场和行业风险后的剩余部分。计算方式为通过线性回归模型估计:$R_{i,d} = \alpha_i + \beta_i R_{m,d} + \gamma_i R_{ind,d} + E_{i,d}$,其中 $R_{i,d}$ 为个股i在d日的收益率, $R_{m,d}$ 为市场在d日的收益率, $R_{ind,d}$ 为行业在d日的收益率,$E_{i,d}$ 即为特质收益率。
- :
尾部阈值,用于定义收益分布的极端区域。该值通常为正数,例如1.5或2,表示高于或低于均值k个标准差的区域被认为是分布的尾部。该值的选择会影响因子的敏感性,可以根据具体情况进行调整。通常情况下,较大的k值会使得因子更关注极端尾部的非对称性。
- :
实际收益率的核密度估计函数,通过非参数方法估计得到实际收益率的概率密度分布。
- :
与实际收益率分布对称的概率密度函数,通常取均值为0,方差等于实际收益率方差的对称分布,例如正态分布。
- :
用于估计核密度函数的样本量,即用于计算因子的时间窗口内的交易日数量。
- :
第i个观测的特质收益率。
- :
核密度估计的带宽参数,控制核函数的平滑程度。带宽越小,估计的分布越精细,但可能过于敏感;带宽越大,估计的分布越平滑,但可能丢失细节。通常使用Silverman的经验法则估计:$h ≈ 1.06\hat{\sigma}n^{-1/5}$,其中$\hat{\sigma}$ 为特质收益率的标准差。
- :
高斯核函数,用于权重计算样本点对目标点的影响,其中z为标准化后的距离,即 $z = \frac{r_i - x}{h}$ 。高斯核函数赋予离目标点更近的样本点更大的权重。
factor.explanation
该因子是衡量收益分布非对称性的重要指标,是对传统偏度的有效补充。它通过比较实际收益率分布与对称分布的差异,捕捉收益分布在极端情况下的不对称特征,尤其在尾部区域的非均匀性。实证研究表明,横截面上股票的收益分布尾部不对称程度与未来收益之间存在显著联系。通常情况下,尾部不对称度越高(右尾较重),未来收益可能越低,反之亦然。但该因子对未来收益的预测能力可能受到市场环境、投资者情绪、波动率等因素的影响。例如,在市场乐观情绪高涨时,尾部不对称度可能与未来收益负相关,而在市场悲观情绪低落时,尾部不对称度可能与未来收益正相关。因此,在实际应用中,需要结合多种因素进行综合分析。此外,该因子的计算使用非参数方法,可以有效避免参数选择带来的误差,更能准确的反应收益率分布的真实情况。