【五福闹新春】v3.3-潮生潮落帆来去，云卷云舒山有无 - 烟花三月ETF

118

赚钱工具

22天前

月神之曈

21天前

池传暮

21天前

忆似水

搞了几天终于弄好了。大佬，我本职是java程序员，最近才开始学量化，py代码有些语法也是一边看一边学。用gemini一个函数一个函数的解释了代码之后，发现一些问题，正好我看大佬在评论区也有关于效率的问题，就优化了下。一.优化了一下代码效率的问题，2025-01-01 到 2026-03-05，原代码执行时间为11分29秒，优化后3分23秒，提升效率70.5%，以下是问题及优化的方案 1. 减少高频重复的 API 请求（核心优化）存在问题：原版在“计算全局流动性阈值”、“动态池筛选”以及“动量得分计算”时，将获取数据的 API（get_price、attribute_history）放在了 for 循环内部。这意味着如果有 100 只候选 ETF，程序就要发起 100 次网络请求，导致回测和******耗时极长。优化方案：改为批量拉取（Bulk Fetch）。直接将多只 ETF 的代码组合成列表，用一次 get_price 拉取所有标的的数据（例如 get_price(etf_set, ...)），然后在本地通过 Pandas 的 groupby 和 pivot 进行数据拆解和计算。这一改动将成百上千次 API 请求压缩到了个位数。 2. 静态信息的全局字典化与预处理存在问题：原版在遍历全市场基金以获取 ETF 名称或筛选子类型时，频繁调用单点获取函数 get_security_info(code)。由于全市场基金上万只，这种写法会造成大量不必要的查询开销。优化方案：利用 get_all_securities(['etf']) 一次性获取全市场所有 ETF 列表，并通过 df_etf['display_name'].to_dict() 直接在内存中生成包含所有 ETF 代码与名称映射的全局字典（g.etf_names_dict）。后续直接在字典中进行 $O(1)$ 的高速查询。 3. 分钟级别止损逻辑的缓存化（Cache）存在问题：策略中开启了分钟级监控（每天跑几百次）。原版在 minute_level_pct_stop_loss（当日跌幅止损）中，每分钟都会调用 attribute_history 去查持仓标的“昨天的收盘价”，造成极大资源浪费。优化方案：引入了日级别缓存机制（g.yesterday_close_cache 和 g.cache_date）。每天第一次查到某个标的昨日收盘价后，就将其存入内存缓存中，当天剩余的几百次分钟级检查直接读取内存，不再发起 API 请求。 4. 数据结构的升级（List 转 Set）存在问题：原版在买入逻辑中判断“某只 ETF 是否已经在持仓中”时，使用了列表（List）推导式 if etf not in current_positions，列表查询的时间复杂度为 $O(n)$。优化方案：在 execute_buy_trades 中，将当前的持仓标的显式转换为集合结构 current_positions = set(context.portfolio.positions.keys())，使查找时间复杂度降为 $O(1)$，进一步压榨了微秒级别的性能。 5. 停牌数据的矩阵运算化处理存在问题：原版使用单标的 attribute_history 时可以直接带上 skip_paused=True 跳过停牌日；但改为批量 get_price 提取面板数据后，返回的矩阵不可避免会包含停牌日的 NaN 值。优化方案：在单次拉取时加入了“备用垫”天数（多拉 20 天数据）。利用 NumPy 向量化运算，通过掩码 valid_mask = (~np.isnan(raw_volumes)) & (raw_volumes > 0) 一次性高效剔除 NaN 和成交量为 0 的异常/停牌数据，完美模拟了聚宽底层的 skip_paused 功能，且速度极快。二.关于其他小优化 1.优化了定时任务，原来的定时任务设计，可能上一个没执行完下一个执行的时间就到了，现在改成了两个定时任务，晨间流水线和午后交易流水线，里面串行调用原来的函数。 2.优化了get_volume_ratio当前成交量的计算，之前计算的当前成交量只是130分钟的，但是却和之前一天240分钟去对比，测试后发现效果不好，收益率跌到了342.93%。因为g.volume_threshold还是=1，改完原本能通过的 ETF 可能会被大面积误杀，就把g.volume_threshold调整为了1.8，这样成交量比和之前相比其实差别不大，稍微收紧了一些成交量的限制（属于正面调整），收益率由553.14%提升到了607.39%。主要是优化一下代码逻辑，不然之前半天的成交量和一天比有点别扭 3.优化了execute_buy_trades，先判断冷却期，处于冷却期就直接返回了，不处于冷却期的话再判断是否持有避险ETF，有的话就卖掉。exit_safe_haven_if_cooldown_ends现在不会调用，可以删除评论区写太多可能看不开，写了个帖子，帖子内容有润色还有其他的一些关于编程的建议和大模型的建议，觉得有收获可以点点赞 https://www.joinquant.com/view/community/detail/69132

21天前

Pky19966318988

21天前

Triton

20天前

jounyc

20天前

烟花三月ETF

20天前

烟花三月ETF

20天前

烟花三月ETF

20天前

jojo冒险奇遇

20天前

烟花三月ETF

20天前

烟花三月ETF

20天前

烟花三月ETF

20天前

烟花三月ETF

20天前

忆似水

@烟花三月ETF 我把成交量的改动改回去自己回测了下，发现真的还是提升了策略收益，不过我这个时间段也提升了回撤率12.18%->12.72%，不知道你的那个有没有提升回撤率。问了下gemini，是下面这么回复的，今天没时间研究原因了，后面可以研究下。除了 get_volume_ratio 的修改，这份优化代码虽然主旨是“提升运行效率”（通过批量拉取数据替代 for 循环单次拉取），但在重构的过程中，产生了几个极其隐蔽但关键的“逻辑微调”。这些微调大多数是由于“批量处理”为了对齐数据而做出的妥协。作为量化工程师，你需要特别注意以下 4 个除效率以外的逻辑变化： 1. 历史数据获取机制的变化（最核心的逻辑差异！）这是性能优化中最容易产生的“副作用”。原版逻辑：使用 attribute_history(etf, lookback, ...)。这个 API 内置了 skip_paused=True，它的特点是**“保证取够天数”**。如果你要 60 天的数据，即使这只 ETF 期间停牌了 30 天，它会自动再往前找 30 天，直到凑齐 60 根有效的 K 线交给你计算动量。优化版逻辑：为了批量提速，改用了 get_price(etf_set, count=safe_lookback, ...)，并在内存中通过 valid_mask 剔除停牌日。作者虽然加了 20 天的冗余垫（safe_lookback = lookback + 20），但这变成了**“固定时间窗口过滤”**。逻辑影响：如果某只 ETF 在近期停牌时间超过了 20 天，优化版在剔除停牌日后，剩下的有效 K 线数量就会不足（小于 lookback），从而触发 continue 被直接淘汰。而原版是不会淘汰它的，会继续计算它的动量。 2. 对“停牌”判定标准的严苛化原版逻辑：底层依赖聚宽交易所发出的“停牌标识（Paused Flag）”。优化版逻辑：在批量处理时，用了这行代码模拟停牌：valid_mask = (~np.isnan(raw_volumes)) & (raw_volumes > 0)。逻辑影响：如果某只冷门 ETF 当天根本没有停牌，但全天一笔交易都没有（成交量 = 0）。原版的 attribute_history 会正常把它当作一个 0 涨幅的交易日保留下来；但优化版会把它当作停牌日直接删掉。这会稍微改变这只 ETF 的均线和动量得分。 3. ETF 基础面大池的筛选规则变了在 calculate_global_etf_threshold 和 update_sector_pool 中获取全市场名单时：原版逻辑：先拉取所有的基金 get_all_securities(['fund'])，然后再通过 info.subtype == 'etf' 逐个确认。优化版逻辑：直接调用聚宽的新接口 get_all_securities(['etf'])。逻辑影响：聚宽底层数据库的分类标签有时会存在极少数边缘标的差异（比如某些 LOF 或跨市场 ETF 的标签变动）。这可能导致优化版一开始扫描的“全市场底池”跟原版有个位数的标的差异。 4. 分钟级止损的“价格锁死（缓存）”机制原版逻辑：在 minute_level_pct_stop_loss 中，每一分钟都会调一次 attribute_history 获取昨收价（yesterday_close）。优化版逻辑：新增了 g.yesterday_close_cache，每天早盘第一次获取昨收价后，就把它缓存到内存里，全天只读缓存。逻辑影响：虽然极大降低了 API 调用次数，但如果聚宽在盘中发生数据修正（比如某只 ETF 因为分红派息除权，早盘数据有误，10:30 聚宽底层修复了昨收价），原版策略在 10:31 就能读到修正后的正确止损价，而优化版全天都会死守早上缓存的那个错误价格。总结这就是为什么很多量化代码在做完极致的“向量化（Vectorization）”或“批量化（Batching）”后，回测结果会跟原版产生零点几个百分点的差异。性能优化往往伴随着对极端边缘场景（Edge Cases）的妥协。不过别担心，由于这个策略主要交易的是流动性极好的热门 ETF，长时间停牌和全天 0 交易的概率极低。总体而言，这四个逻辑变动对你的核心收益回撤影响微乎其微，但对于理解量化底层机制非常有帮助！

20天前

赚钱工具

20天前

赚钱工具

19天前

感恩遇见

19天前