关闭
您正在使用的浏览器版本较低,无法支持聚宽的某些特性。
为了获得更好的体验,推荐使用:
Google Chrome
或者
Mozilla Firefox
或者
IE9以上
。
返回主题列表
尝试用机器学习批量生产小盘策略
733
listen
分享到:
微信
微博
雪球
评论
answerrr
看了这些这些神奇的coef list,会不会存在过拟合?
2023-01-10
wywy1995
@jo2 主观上不希望存在,客观上不清楚
2023-01-10
jakestale
@wywy1995 思路不错的 我也在做
2023-01-10
咔咔系
发财了,wywy199。。。。实盘搞起来!!
2023-01-10
wywy1995
@咔咔系 现在高兴还有点早,先放模拟里看看吧
2023-01-10
kautz
@cwd 请问能共享您的回归代码吗?谢谢
2023-01-10
仓又加错了啊
@Ethan1234 @wywy1995 我不太理解 为什么 coef_list 的权重不算过拟合?哪怕是这个整数,就权重来说,他已经精确到3位数,或者4位数的细分地方。我不太懂机器学习,但我感觉这么细的比例来刻画历史,那未来只要略有抖动,数据走的完全不一样了。 我不知道我这里理解对不对。
2023-01-10
DreamNA
这种做法有较大过拟合的可能性。个人比较推荐的一种做法:通过一个复杂的深度学习模型,例如 Transform + CNN + LSTM 的组合,直接使用量价数据,再配合一些防止过拟合的手段,可以做出较理想的成绩。
2023-01-10
wywy1995
@DreamNA 好,谢谢建议,等我技术进步了的再尝试
2023-01-10
wywy1995
@仓又加错了啊 这个权重是求方程的解,解是根据函数计算出来的最优值,既然是最优肯定只有一个精确的数,但是精确的参数传导到选股上其实是很大一片的范围(不是从精确的参数直接就精确到某几只股票了)。回测里展示的是用A时间段求的解在B时间段上的效果,A与B时间不重叠。关键是,训练时间的选取决定了方程进而决定了方程的解,训练时间才是可能出现过拟合的地方。不过只要你站在今天往回看,都可能“不小心”选错训练集从而造成过拟合,但是没人能完全蒙上眼睛做量化。另外,机器学习我也是初学,上面那两位应该都比我懂,我给你解释不如你看看机器学习的公开课,比如吴恩达的课程。
2023-01-10
wywy1995
@仓又加错了啊 你的担心也不是没有道理,是不是过拟合我现在不敢保证,要看一年后这些个策略有多少能跑赢基准(国证2000),80%的策略跑赢了就算没过拟合,反之这种生产策略的做法就是错误的。
2023-01-10
answerrr
@wywy1995 有没可能通过调整系数把因子和调仓周期里表现优异的股票实现了最佳匹配,实际上引入了未来函数。当然我不专业就是表达一下直观感觉,因为实在不好理解这些数字背后的逻辑
2023-01-11
wywy1995
@jo2 它算不上最佳匹配,但我确实是有优化过,这些数字看不出逻辑很正常,机器学习就是这样,它只是在求方程的最优解。
2023-01-11
answerrr
@wywy1995 刚看到您下面的一段回复,测试集是18-22,是不是可以调整一下比如17-20,拿到参数再看21-22年的效果,相当于21,22跑实盘了,如果还能跑出差不多的业绩就厉害了
2023-01-11
wangww
确实牛逼,能想到这招。 不过生成下面这个协方差系数,是否意味着,有用到一定的未来信息? coef_list = [ -6.123355346008858e-05, -0.002579342458393642, -2.194257357346814e-06 ] 但是我看我做私募的朋友,也是基于数据训练得到一个结果,然后再用未训练的数据去跑,似乎是一个逻辑。
2023-01-11
wywy1995
@wangww 这个不是协方差,是使多元一次方程的损失函数最小的最优解,训练集跟预测集不重合这点可以保证,但是我不知道我看着不同的预测结果挑选训练集算不算未来信息?不过只要头脑里带着今天已知的历史信息严格来说都算未来,因为你的认知已经决定了你潜意识里就是有未来函数的,但是谁也不可能完全蒙着眼睛做量化。
2023-01-11
wangww
@wangww 明天继续研究,谢谢分享。
2023-01-11
wywy1995
@jo2 严格来说应该这么做,比如训练集10-16,验证集17-20,预测集21-22。但是实操过程你会发现这些时间段的选取在很大程度上会影响最后的结果,所以选择什么样的时间段,亦或是滚动训练验证,这些问题讨论下去会无休无止,也很难决出对错,所以应该由您自己独立思考做出适合自己的决定。
2023-01-11
南澳
能否分享下机器学习筛选因子的代码?我理解这个多元线性回归,就是筛选出3-5个因子,再用求最优的方法确定系数,这里面的系数是写死的,没有随着市场行情的改变再继续优化,想看下 能否通过机器学习自动优化和更新 因子筛选和对应的系数
2023-01-11
wywy1995
@南澳 机器学习代码不分享
2023-01-11
首页
上一页
11
12
13
14
15
16
17
18
19
20
下一页
尾页
您尚未登录,请
登录
或者
注册
聚宽发表回复。
取 消
提 交