中国科学院数学与系统科学研究院期刊网

2024年, 第44卷, 第12期 刊出日期:2024-12-25
  

  • 全选
    |
  • 系统工程理论与实践. 2024, 44(12): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 论文
  • 季康先, 许健, 刘晓亭, 孙嘉璐, 夏炎
    系统工程理论与实践. 2024, 44(12): 3765-3776. https://doi.org/10.12011/SETP2022-2222
    摘要 ( ) PDF全文 ( )   可视化   收藏
    国际循环通过产品的生产过程和市场需求两方面影响我国的经济增长. 生产过程方面, 进口中间品和国内中间品的相互替代影响经济增长; 市场需求方面, 国外对我国中间品和最终品的需求影响我国经济增长. 基于结构分解分析方法, 本文将Leontief逆矩阵变动分解为技术水平变动和进口替代, 将最终需求变动分解为国内最终需求变动和出口变动, 从而分别测算国际循环通过两个方面对我国经济增长的影响. 结果表明: 1) 在生产过程方面, 中间品的进口替代对我国经济增长的影响呈现出阶段性特征, 2000—2005年表现为进口中间品占比不断上升, 我国的经济增长对国际循环的依赖程度不断变大, 2005—2014年表现为国内中间品替代进口中间品, 我国逐渐掌握更多的中间品生产环节, 2015—2021年再次表现为进口中间品占比不断上升; 2) 在市场需求方面, 相比于国内最终需求, 出口对我国经济增长的贡献度不断下降, 我国产品对国际循环最终需求的依赖程度不断降低.
  • 岳婷, 周静, 龙如银, 张莹开, 王茜茹, 陈红
    系统工程理论与实践. 2024, 44(12): 3777-3792. https://doi.org/10.12011/SETP2024-0015
    摘要 ( ) PDF全文 ( )   可视化   收藏
    促进城市居民生活碳减排对于应对气候变化问题具有重要意义. 本文基于中国288个地级及以上城市2009—2019年的面板数据, 对城市居民生活碳排放量进行测算, 结合人口和经济特征将城市聚类为四大类型进行分析, 并对城市居民生活碳排放影响因素进行分解分析, 进一步利用BP神经网络模型和情景分析法对各类别城市居民减碳潜力进行预测. 结果表明: 1) 中国城市居民生活碳排放总量逐年递增, 其中用电碳排放占比最高, 供暖碳排放增长率最高; 2) 城市化水平、人均可支配收入、居民能源结构和人口总规模对全国城市居民生活碳排放的影响效应均为正, 居民能源强度与居民消费倾向的影响效应为负, 且对四类城市碳排放的影响具有一定差异性; 3) 四类城市居民生活领域均有较大减碳潜力, 且存在较大差异. 第二类城市的减碳潜力明显高于其他城市, 第一类城市居民生活减碳潜力整体最低, 第三、四类城市居民生活减碳潜力变化程度相似, 整体呈现先增后减的趋势. 各地可因地制宜制定与实施居民减碳相关措施.
  • 吕丹
    系统工程理论与实践. 2024, 44(12): 3793-3810. https://doi.org/10.12011/SETP2024-0525
    摘要 ( ) PDF全文 ( )   可视化   收藏
    提升企业ESG表现是实现我国经济可持续发展的重要举措. 本文以2013年发布的“宽带中国”战略的实施为准自然实验, 采用双重差分等方法考察数字基础设施对企业ESG表现的影响. 研究发现, 数字基础设施对企业ESG表现具有显著的促进作用. 作用机制检验表明, 数字基础设施对企业ESG表现的影响主要是通过提高政府环境关注度、提升企业履行社会责任的积极性、改善公司信息透明度等路径实现. 异质性分析发现, 数字基础设施对企业ESG表现的促进作用在规模较大、绿色创新能力较强的企业、高污染行业以及客户集中度较高的企业中更显著. 本文从可持续发展视角评价数字基础设施的现实作用, 为理解企业ESG表现的影响因素提供了新的经验证据, 也为加强数字基础设施建设、促进经济绿色转型提供了对策建议.
  • 贝泓涵, 胡敬怡, 杨婉玉, 盖兆亿
    系统工程理论与实践. 2024, 44(12): 3811-3828. https://doi.org/10.12011/SETP2024-0002
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着气候变化加剧和极端降水天气事件频发, 如何有效降低降水不确定性带来的风险损失成为我国经济社会发展亟待解决的难题. 本文构建了“马尔可夫-耿贝尔”降水指数测度理论模型, 结合风险中性理论提出降水指数衍生品定价方法, 并利用我国河南省郑州市、江苏省徐州市等地区的日度降水数据对模型进行验证分析. 结果表明, 本文提出的降水指数测度方法在灵活度、季节特性捕捉等方面具有明显优势; 基于风险中性的降水衍生品定价模型, 可以通过风险中性处理机制得到更加集中和稳定的定价结果, 显著提升定价精确度. 本文研究成果不仅为降水指数测度及其衍生品的应用提供了新思路, 而且为有效对冲降水不确定性风险提供了理论和实践指导.
  • 陈荣达, 俞静婧, 崔淼森, 金骋路, 汪圣楠, 陈奕扬
    系统工程理论与实践. 2024, 44(12): 3829-3850. https://doi.org/10.12011/SETP2023-2150
    摘要 ( ) PDF全文 ( )   可视化   收藏
    分析师过去表现与受雇券商行业地位共同影响着跟踪分析的上市公司信息披露质量. 本文利用2011年至2021年的分析师-公司对数据集, 通过分析师个人和券商特征层面共16个相关指标, 构建分析师网络声望并探究其对股票市场信息效率的影响. 研究发现, 分析师网络声望增加竞争性信息, 扩大意见分歧、分散投资者注意力, 进而降低股票市场信息效率. 特别地, 分析师推荐可能包含无效信息, 投资者注意力有限面对众多信息时交易活跃度降低, 股票流动性下降进而削弱市场信息效率. 此外, 媒体报道对分析师网络声望降低信息效率具有削减作用, 市场投资者情绪对分析师网络声望降低信息效率具有放大作用.
  • 赵二龙, 孙少龙, 王峰虎, 汪寿阳
    系统工程理论与实践. 2024, 44(12): 3851-3861. https://doi.org/10.12011/SETP2022-2601
    摘要 ( ) PDF全文 ( )   可视化   收藏
    分析师研报传递出的信息对投资者决策行为具有引导作用, 进而协同影响着股票价格波动. 为了量化复杂网络平台下分析师研报对投资者回报的影响关系, 本研究首先在东方财富网获取2017年1月1日至2021年12月31日期间39786条分析师研报标题文本数据. 其次, 通过文本挖掘技术构建出分析师研报标题的情感字典, 并基于SESTM模型得到对应股票情感值, 筛选出情感值大于某阈值的股票. 最后按等权重的方式进行模拟回测, 结果表明这种基于深度学习的分析师前瞻性报告标题构建完整的量化投资交易策略在交易回测时具有较高的投资收益. 本研究对于理解分析师研报前瞻性分析, 有效引导理性投资行为具有重要理论和实践意义.
  • 李晓, 刘以琏
    系统工程理论与实践. 2024, 44(12): 3862-3876. https://doi.org/10.12011/SETP2024-1010
    摘要 ( ) PDF全文 ( )   可视化   收藏
    鲜有文献研究投资者关注度分配对中国股票市场股价同步性的影响, 且结论不一致. 本文将新冠疫情作为分散投资者关注度的外生事件, 研究投资者关注度分配对股价同步性的影响. 实证结果表明: 1)在投资者关注的分配事件日, 投资者对个股的关注降低, 导致个股与市场整体收益的同步性增加; 2)分析师跟踪、研究报告覆盖、资本市场对外开放、信息透明度可以显著缓解投资者关注度分配对收益同步性的影响. 本文的实证发现为投资者关注度分配理论提供了来自中国市场的经验证据.
  • 方霞, 谭龙昕, 吴洁
    系统工程理论与实践. 2024, 44(12): 3877-3895. https://doi.org/10.12011/SETP2023-1635
    摘要 ( ) PDF全文 ( )   可视化   收藏
    数字金融加速了跨区域要素流动, 提高了地区资本配置效率, 为地区收入收敛提供了新动力. 本文以长三角地区 2014—2021年 区县数据为样本, 探讨数字金融发展中心地区能否带动低收入地区向高收入水平收敛, 实现先富地区带动后富地区发展. 研究发现, 低收入地区能够通过加强与中心地区的数字金融空间关联, 实现收入增速赶超. 从作用机制看, 学习效应、创新及创业水平提升是数字金融空间关联实现地区收入收敛的有效机制. 进一步分析发现, 数字金融发展中心地区能够突破地形限制实现空间联动, 缓解收入分配不均, 但该效应的覆盖范围有限; 高铁的开通也将对数字金融空间关联促进地区收入收敛产生裨益. 本文的研究结论为长三角地区进一步缓解地区收入差异、扎实推进共同富裕提供有益参考.
  • 张樑, 任叶瑶, 侯天雨, 丰豪放
    系统工程理论与实践. 2024, 44(12): 3896-3916. https://doi.org/10.12011/SETP2023-0390
    摘要 ( ) PDF全文 ( )   可视化   收藏
    虽有文献表明企业捐赠解耦会给企业带来负面效应, 但几乎没有研究关注企业捐赠解耦后是否以及如何调整下一阶段的捐赠水平. 基于利益相关者理论和社会比较理论, 研究了企业捐赠解耦对捐赠调整的影响, 以及管理者社会比较心理过程的调节作用. 以中国2003—2017年A股上市公司为样本进行实证检验, 研究发现: 1)企业捐赠解耦之后, 倾向于在下一阶段追加捐赠; 2)管理者社会比较心理对这一关系起调节作用. 具体而言, 管理者通过与参照点(参照组和利益相关者预期)的捐赠水平进行比较, 调整企业下一阶段的捐赠水平. 当企业出现捐赠解耦且捐赠水平低于参照组(同行业或同地区内相似企业)的捐赠水平时, 企业将提高追加捐赠的幅度; 当利益相关者对企业捐赠的预期越高时, 企业捐赠解耦与捐赠追加之间的正向关系越强.
  • 周青, 吴正熠, 陈文冲
    系统工程理论与实践. 2024, 44(12): 3917-3931. https://doi.org/10.12011/SETP2022-2270
    摘要 ( ) PDF全文 ( )   可视化   收藏
    推动经技术标准联盟本土化改造升级的制造技术标准扩散是中国企业快速占领“一带一路”市场、助力当地产业链转型升级的重要抓手. 考虑制造技术标准的产品和技术二维特性, 研究建立面向“一带一路”制造技术标准扩散的双边网络协同决策模型. 基于标准扩散中消费者、联盟、本土制造企业等不同决策主体, 通过引入合同设计与采纳机制刻画双边网络协同过程, 以构建一主多从双层多目标关联优化模型. 将联盟面向消费者的新产品定价和面向本土制造企业的采购合同设计定义为主问题, 以同时最大化存在标准竞争时新产品扩散程度、本土制造企业新技术采用量、联盟标准扩散收益等多维目标; 将考虑制造技术升级成本的本土企业采购合同接收与生产供给定义为从问题, 以最大化企业参与新技术标准的净收益. 设计嵌套NSGA-II算法求解关联优化模型并结合案例测试模型与算法的有效性.
  • 戴前智, 王毅红, 谢启伟, 雷西洋
    系统工程理论与实践. 2024, 44(12): 3932-3946. https://doi.org/10.12011/SETP2024-0439
    摘要 ( ) PDF全文 ( )   可视化   收藏
    能源环境效率评价结果会直接关系到被评价决策单元(decision-making unit, DMU)的切身利益, 因此考虑DMU间的非合作博弈关系将有助于提高能源环境效率评价结果的接受度. 本文针对能源环境系统内部的“能源利用-环境保护”两阶段典型特征, 基于“先子系统博弈后总系统集成”的思路提出非合作博弈两阶段DEA效率评价模型, 并证明了模型算法的收敛性、最优解是纳什均衡点且具有唯一性. 进一步将本文方法应用到2019年我国30个省级行政区能源环境效率评价问题中, 研究发现: 1)我国能源环境总系统效率及各阶段子系统效率均呈现区域不平衡性, 表现为“东-中-西-东北”依次递减特征; 2)多省处于“低能源利用-低环境保护”发展模式, 地区转变能源环境发展模式关键在于东部地区提高环境保护效率, 而中西及东北地区两阶段效率均需改善. 基于以上发现, 本文针对各省能源环境发展模式给出具体改进方向, 对我国提高能源环境效率水平具有积极意义.
  • 朱庆缘, 刘畅, 潘应浩, 吴杰, 李峰
    系统工程理论与实践. 2024, 44(12): 3947-3962. https://doi.org/10.12011/SETP2023-0774
    摘要 ( ) PDF全文 ( )   可视化   收藏
    以促进新能源汽车健康发展和燃油汽车节能减排的“双积分”政策为背景, 建立了包括政府、燃油汽车制造商、新能源汽车制造商和消费者在内的竞争博弈模型, 将燃油汽车生产商减排研发投入纳入模型, 对双积分政策以及政府逐步退坡的补贴的影响进行理论研究. 研究发现: 1) 在一定条件下, 政府补贴逐步退坡将更有利于燃油汽车生产商增加减排研发投入; 2) 双积分政策中的积分交易价格对燃油汽车的减排研发投入和汽车生产商的最优产量的影响具有非单调性. 因此, 政府补贴退坡背景下, 应设定较低的积分交易价格以激励燃油汽车减排研发投入和刺激新能源汽车市场需求; 3) 政府补贴退坡对碳排放量的影响是非单调的, 补贴的退坡在一定条件下会使得汽车市场碳排放量下降.
  • 王志远, 郭贤, 冉伦, 姚兆胜
    系统工程理论与实践. 2024, 44(12): 3963-3978. https://doi.org/10.12011/SETP2024-0115
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文考虑了联合充换电操作的新能源汽车换电站的选址定容问题. 换电站内部充换电操作是连接换电需求与换电站选址定容决策的关键一环, 但以往研究都忽略了对该过程的详细刻画. 本文将换电站内部充换电操作建模为多周期优化问题, 并给出了该问题最优解的结构性质. 在此基础上考虑换电需求的不确定性, 将换电站内部运营与换电站选址定容决策结合起来, 构建了分布式鲁棒优化模型和目标鲁棒式优化模型. 针对模型中难求解的多阶段问题, 本文利用线性决策准则近似求解两模型, 并将融合辅助变量的升维技术扩展到考虑情景的多阶段鲁棒优化模型中, 从理论上给出了升维前后模型之间的关系. 最后进行数值实验, 验证了本文所提模型和升维技术的有效性.
  • 张宇, 郭仁拥
    系统工程理论与实践. 2024, 44(12): 3979-3996. https://doi.org/10.12011/SETP2023-1227
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对连续时间窗的车辆共乘匹配问题, 建立了一(车主)对多(乘客)模式的最优化模型. 该优化模型同时以当前时间窗的共享率和旅程终点的预测需求密度为目标, 刻画了旅程的即时效用和潜在效用, 从而提升运营周期的总服务率和服务质量. 然后提出了一个出行需求预测算法. 在算法的特征工程阶段, 时间和空间索引特征被提取, 并以多个时间间隔生成自序列特征数据. 基于深度学习方法构建了时空自序列网络, 该网络能够同时处理时空特征和序列特征, 提供高精度的需求预测. 最后将所提模型与算法应用于真实场景, 验证了其有效性. 结果表明, 相比于传统模型, 所建立模型的匹配方案提高了9.57%的服务率, 并降低了11.54%的出行距离. 与其他预测算法相比, 所提出预测算法的预测结果最好, 其平均绝对误差为2.84, 均方误差为20.35.
  • 张延禄, 晁卓毅, 杨乃定, 杨嘉琪
    系统工程理论与实践. 2024, 44(12): 3997-4010. https://doi.org/10.12011/SETP2023-0790
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现有研究大多基于网络拓扑结构视角来评估节点重要度, 忽略了网络动态变化特征对节点重要度评估结果的影响, 而基于网络动力学视角来识别关键节点的研究主要针对的是抽象网络, 应用在现实网络中则存在一定的局限性. 鉴于此, 基于级联失效视角来识别新能源汽车研发网络的关键节点企业. 首先, 利用新能源汽车合作专利数据构建真实的新能源汽车研发网络. 接下来, 从界定节点企业初始负荷、确定节点企业容量、建立负荷分配规则三个方面提出级联失效模型, 进而采用数值仿真方法揭示蓄意攻击和随机攻击策略下新能源汽车研发网络上的级联失效过程及其规律. 最后, 通过对新能源汽车研发网络进行数值仿真, 识别出新能源汽车研发网络的关键节点企业. 该研究成果对预防因关键节点企业失效而引发的级联失效现象进而提升新能源汽车行业的安全韧性水平具有重要的参考价值.
  • 张倩, 王钟彬, 李勇建
    系统工程理论与实践. 2024, 44(12): 4011-4025. https://doi.org/10.12011/SETP2023-2160
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来, 由于平台经济的迅猛发展和疫情的冲击, 我国外卖行业取得了显著增长. 外卖服务不仅有效减轻了顾客对延迟的敏感性, 还为商家创造了更广泛的市场需求. 实践中, 多数商家采用了集中式运营, 即一个店铺同时接受外卖和堂食订单. 与此同时, 一些商家选择了分散式运营, 即在经营堂食店铺的同时, 另外开设专门的外卖店铺以接受外卖订单. 为了探究外卖渠道对商家决策的影响, 本研究在易拥塞的场景中建立了双渠道服务系统. 该系统刻画了两种运营模式下顾客的均衡策略, 并深入研究了外卖质量水平对商家利润的影响. 最终, 研究根据不同的外卖服务质量水平制定了最优的商家运营策略. 研究发现: 1) 在分散式运营模式下, 商家为外卖渠道分配的服务能力与外卖质量水平之间存在非单调关系, 即更高的外卖质量水平可能促使商家减少外卖渠道的人员配置. 2) 尽管更高的外卖质量水平能够吸引更多的顾客, 但令人惊讶的是, 本研究表明提高外卖质量可能会导致商家的利润下降, 这一现象在集中式运营和分散式运营两种情境下都有体现. 3) 虽然分散式运营可能降低订单处理效率, 但当外卖服务质量较高时, 采用该模式可以有效减轻外卖渠道对堂食渠道的蚕食效应, 进而实现更高的利润. 结果显示, 只有当外卖服务质量适中时, 集中式运营才能为商家带来最高的利润. 此外, 我们从边际成本、外卖配送费等多个角度出发, 进一步验证了该结论的稳健性.
  • 宋亚楠, 刘璐, 李婷婷, 闫相斌, 赵恩珑
    系统工程理论与实践. 2024, 44(12): 4026-4044. https://doi.org/10.12011/SETP2023-2339
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文基于指数平滑模型和Logit选择模型刻画了消费者的多期购买行为, 构建了在不同退款保证策略下两异质零售商的收益模型, 探讨了退款保证策略对体验式学习型消费者购买可能性和零售商收益的影响, 并进一步分析了AI赋能消费者决策的影响. 研究发现, 由于商品质量波动和消费者的体验式学习, 消费者关于商品平均质量的信念低于商品真实的平均质量. 不同的退款保证策略下消费者会形成不同的商品质量信念. 零售商提供且对手零售商不提供退款保证有助于消费者形成最接近商品真实平均质量的信念. 零售商并不总能从提供退款保证中获益, 当单位退货成本较低时, 提供退款保证是零售商的占优策略. 随着退货成本的提高, 两零售商退款保证策略的博弈均衡由两零售商都提供退款保证逐渐转变为都不提供. 数值算例表明, 退款保证策略的均衡存在“囚徒困境”现象. 具体地, 当退货成本较低时, 均衡是两个零售商都提供退款保证, 但此时二者收益低于都不提供退款保证时的收益. 这表明竞争会促使双方都选择提供退款保证, 尽管这并不能使零售商的收益最优. AI赋能消费者决策下, 质量波动较大的零售商的长期收益提升. 退货成本较低时, 提供退款保证仍是零售商的占优策略, 但AI赋能决策改变了零售商策略转变的阈值.
  • 杨莲, 刘文秀, 张志鹏, 石宝峰
    系统工程理论与实践. 2024, 44(12): 4045-4063. https://doi.org/10.12011/SETP2023-1977
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有违约预测模型对非均衡样本适用性不强、对具有不同信贷特征数据集可扩展性较弱的现状, 利用泰勒展开原理将交叉熵函数转化为多项式的线性组合, 并在第1 项多项式系数中添加扰动因子$\varepsilon$, 构建可以根据不同非均衡信贷数据特点进行灵活调整的BPNN-TaylorLoss违约预测模型; 利用4个真实信贷数据、7种对比模型、5 个模型评价准则验证模型性能. 研究表明: 所提模型有助于降低违约客户误判给金融机构带来的损失以及预防非违约样本误判导致的优质客户流失; 所提模型在多数信贷数据集中表现出了较为稳健的违约预测性能, 具有较好的模型可扩展性. 本文的创新与特色: 利用扰动因子$\varepsilon$对标准交叉熵函数泰勒展开式进行修正, 构建BPNN-TaylorLoss非均衡样本违约预测模型, 实现只需对与扰动因子$\varepsilon$相关的1个超参数进行微调, 即可改变现有评价模型对非均衡信贷数据集适用性不强, 以及对具有不同信贷特征数据集可扩展性较弱的现状. 本研究为非均衡样本违约风险预测提供了新的研究视角.
  • 张忠良, 龚晟琛, 汪翼, 雒兴刚
    系统工程理论与实践. 2024, 44(12): 4064-4083. https://doi.org/10.12011/SETP2023-0686
    摘要 ( ) PDF全文 ( )   可视化   收藏
    联邦学习是一种分布式机器学习技术, 使拥有有限资源的参与方在不共享私有数据的前提下能够协同训练模型, 有效保护参与方的数据隐私. 传统联邦学习系统对参与方没有严格的筛选机制, 一般采用平均策略聚合模型参数, 这容易导致劣质参与方加入联邦模型的训练过程中, 从而影响最终模型的整体性能. 针对上述问题, 提出一种基于动态规划的联邦学习参与方选择的方法 (FedWeight). 该方法采用夏普利值 (Shapley Value) 计算参与方在不同通信回合的贡献度, 以解决参与方数据质量无法直接评估的难点, 并将夏普利值作为聚合服务器动态选择优质参与方的重要衡量指标, 通过聚合优质参与方提供的模型参数, 提升模型的整体性能. 采用公开数据集MNIST、CIFAR-10、Fashion-MNIST、EMNIST和KMNIST构建不同的联邦学习场景, 实验结果表明: 利用本文所提方法可以有效地将优质参与方识别出来, 训练得到的联邦模型性能几乎不受劣质参与方的影响. 此外, 从收敛速度和模型稳定性来看, 本文方法也具有显著优势.
  • 滕辰妹, 项寅, 李善良
    系统工程理论与实践. 2024, 44(12): 4084-4096. https://doi.org/10.12011/SETP2023-0668
    摘要 ( ) PDF全文 ( )   可视化   收藏
    面临人口老龄化和慢性疾病高发的双重压力, 合理配置卫生资源以适应不断变化的卫生需求至关重要. 本研究提出了一种创新性的跨部门协同配置模型, 旨在改进不同阶段卫生需求的动态响应. 研究通过分析卫生需求阶段性变化与资源分配的关联, 揭示了卫生服务优化的关键点. 为了有效求解此模型, 研究设计并改进了遗传算法, 引入判别算子和新型编码策略, 以提升算法性能和解的适用性. 算例和灵敏度分析验证了模型具有更高的响应效率, 尤其是在预算充足时, 模型展现了在低成本下满足多样化卫生需求的潜力. 通过P值统计分析, 与现有技术相比, 所提算法在解决问题时表现出更高的精确度和效率, 展示了对未来卫生资源管理的实际应用价值.
  • 郭姝娟, 彭康真, 关泽坤, 刘一卓, 靳志宏
    系统工程理论与实践. 2024, 44(12): 4097-4112. https://doi.org/10.12011/SETP2023-0234
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文将多码头集卡路径问题和铁路运输方式相结合优化, 考虑集卡行驶时间、铁路列车最大装载容量等不确定性因素, 基于时空网络图构建了动态的多码头集卡路径优化模型. 设计基于Q学习的超启发算法(Q-learning hyper-heuristic, QHH)求解多码头运输任务的集卡车辆路径优化问题, 铁路列车开行决策及其集装箱装载量问题. QHH算法采用Q学习算法作为高层的选择策略指导超启发算法在不同环境下选择合适的底层启发式算子, 并引入随机策略, 在环境变化的情况下提高种群的多样性和加快收敛速度. 实验结果表明本文提出的QHH算法与遗传算法相比, 在小规模算例中优化方案总成本平均下降8.7%, 大规模算例优化方案中总成本平均下降比率为27.4%, 能够解决传统的元启发式算法机制单一和面向问题定制等不足. 当环境以高、中、低频率发生变化时, QHH算法均优于随机选择超启发算法, 证明了Q学习可以适应环境变化灵活的选择底层算子. 研究结果为大型集装箱港口的多码头集卡调度运营管理提供决策支持.