@felixice 能展开说说吗?原文只有下面的代码做了标准化。
for date in date_list:
# #对数据进行处理、标准化、去极值、中性化
factor_df = winsorize_med(factor_df, scale=3, inclusive=True, inf2nan=True, axis=0) #中位数去极值处理
se = standardlize(factor_df[date], inf2nan=True) #对每列做标准化处理。
factor_df[date] 只有一列数据,index是股票代码不是日期。例如:
code
000015.XSHG 1.000840
000016.XSHG 0.994821
000300.XSHG 0.997115
000852.XSHG 1.000690
000905.XSHG 1.000385
2021-12-29