日内信息不对称强度因子
factor.formula
1. 计算每日收益率:
a. 个股隔夜收益率:
b. 指数隔夜收益率:
c. 逐日下午的个股收益率:
d. 逐日下午的指数收益率:
2. 计算残差项:
a. 对个股与指数的隔夜收益进行线性回归,以剔除市场整体波动的影响:
得到隔夜收益残差项:
b. 对个股与指数的下午收益进行线性回归,以剔除市场整体波动的影响:
得到下午收益残差项:
3. 计算每日隔夜与下午残差的差:
4. 构建统计量stat:
a. 计算 δ 的均值:
b. 计算 δ 的标准差:
c. 使用上述均值和标准差计算 T 统计量,以衡量隔夜和下午收益残差差异的显著性:
5. 消除动量因子影响:
a. 将统计量 stat 对动量因子(过去20日收益率)进行横截面回归,以剔除动量效应:
b. 回归得到的残差项 ε 即为日内信息不对称强度因子。
其中:
- :
第i日个股的隔夜收益率,通常指当日开盘价相对于前一日收盘价的收益率,更精确的定义可以根据实际交易数据进行调整。
- :
第i日指数的隔夜收益率,对应个股的隔夜收益率,定义应保持一致。
- :
第i日个股下午时段的收益率,通常定义为从当日下午开盘至收盘的价格收益率,具体时段定义需要根据交易所的实际交易时间进行精确调整。
- :
第i日指数下午时段的收益率,对应个股下午时段的收益率,定义应保持一致。
- :
线性回归中的截距项,代表在市场指数收益为零时,个股收益的预期值。
- :
线性回归中的回归系数,表示指数收益变化一个单位时,个股收益预期变化的幅度。
- :
第i日个股隔夜收益率回归模型的残差项,代表模型无法解释的个股隔夜收益部分。该残差项可以理解为剔除市场影响后的个股隔夜收益信息。
- :
第i日个股下午时段收益率回归模型的残差项,代表模型无法解释的个股下午时段收益部分,可以理解为剔除市场影响后的个股下午时段收益信息。
- :
第i日隔夜收益残差与下午收益残差的差值,用于捕捉日内收益模式的差异,这种差异可能反映了日内信息不对称的程度。
- :
δ的均值,表示一段时间内(例如N天)隔夜和下午收益残差差异的平均水平,代表了整体的日内收益模式。
- :
δ的标准差,衡量一段时间内隔夜和下午收益残差差异的波动程度,反映了日内收益模式的稳定性。
- :
计算均值和标准差时使用的样本量,通常指时间窗口的大小。样本量越大,统计结果越稳定。
- :
股票j的T统计量,用于评估隔夜和下午收益残差差异的显著性。绝对值越大,差异越显著,可能表明该股票受信息不对称的影响更强。
- :
股票j过去20个交易日的收益率,用于控制动量效应的影响。此处20日为一个常用的窗口期,可以根据实际情况调整。
- :
股票j的回归残差,表示剔除动量效应后,由日内信息不对称带来的独特收益信号。该值即为最终的日内信息不对称强度因子值。
factor.explanation
该因子基于知情交易者在上午交易更活跃的假设,构建了刻画股票日内信息不对称程度的量化指标。改进的APM因子使用隔夜收益率代替上午收益率,从而更好地捕捉开盘前的信息披露对价格的影响。通过线性回归剔除市场波动,并结合T统计量来衡量隔夜和下午收益残差差异的显著性。进一步通过横截面回归剔除动量效应,得到最终的日内信息不对称强度因子,该因子可用于量化选股策略中,帮助识别可能存在信息优势的股票。该因子可以和其它基本面因子,技术因子等结合使用,构建多因子模型。