高频价量相关性趋势因子
factor.formula
1. 计算每日股票分钟级别收盘价与成交量的Pearson相关系数:
2. 对每个交易日,将该日内计算得到的20个连续时间窗口对应的相关系数 \( p_t \) 进行线性回归,时间 \( t \) 作为自变量,得到回归系数 \( \beta \):
3. 将所有股票每日计算得到的回归系数 \( \beta \) 在横截面上进行标准化处理,并剔除市值、传统价量类因子(如20日反转、20日换手率、20日波动率等)的影响,得到最终的高频价量相关性趋势因子。
公式中:
- :
每日内第 ( t ) 个时间窗口(例如,第 ( t ) 分钟)计算的股票分钟收盘价与分钟成交量之间的Pearson相关系数。该相关系数衡量了在该特定时间窗口内,价格与成交量同步或背离的程度。正相关表示价格上涨时成交量也倾向于增加,反之亦然;负相关则表示价格上涨时成交量倾向于减少,反之亦然。
- :
通过线性回归得到的回归系数,反映了每日内价量相关系数 ( p_t ) 随时间 ( t ) 变化的趋势和强度。 ( \beta ) 为正值表示每日内价量相关性随时间推移趋于增强; ( \beta ) 为负值表示每日内价量相关性随时间推移趋于减弱; ( \beta ) 的绝对值越大,表示趋势越显著。
- :
回归模型中的误差项,表示实际相关系数 ( p_t ) 与回归模型预测值之间的偏差。误差项的存在是由于实际数据中存在噪声和随机波动。
- :
时间窗口的序号,取值为1到20。例如,若采用分钟数据,则 ( t=1 ) 代表第一个分钟,( t=2 ) 代表第二个分钟,以此类推。需要注意的是,这里的 ( t ) 是指每日内部的时间序列,而非跨日的时间序列。具体时间窗口的划分可根据实际数据频率和研究需要进行调整。
factor.explanation
该因子的核心逻辑在于捕捉市场微观结构中,价格与成交量之间关系的动态变化。负值的 ( \beta ) (即PV_corr_trend越小),表示当日内价格与成交量的相关性在逐渐减弱,这可能暗示着市场情绪逐渐趋于分歧,价格上涨可能并未伴随成交量的有效放大,反之亦然,这通常被认为是多空双方力量开始出现不均衡的表现,并可能预示着潜在的反转机会。另一方面,正值的 ( \beta ) (即PV_corr_trend越大),则表示当日内价格与成交量的相关性在逐渐增强,可能暗示着市场情绪的一致性,价格与成交量同时放大或减小,这通常被认为是市场趋势强化的信号。因此,该因子主要利用高频数据,通过分析每日内价量关系变化趋势,来捕捉短期市场情绪和微观结构特征,以辅助进行股票选股。通常情况下,负向的趋势( ( \beta ) 为负)可能具有更高的预测能力。