淘天集团自营技术运营算法团队4年2次荣膺 INFORMS“杰出实践奖”决选荣誉:以策略正则化突破DRL在库存管理中的落地瓶颈
出处:
mp.weixin.qq.com
2025年10月,淘天集团自营技术运营算法团队的研究成果《DeepStock: Reinforcement Learning with Policy Regularizations for Inventory Management》荣获运筹学与管理科学领域极具声望的 “Daniel H. Wagner 杰出实践奖”(Daniel H. Wagner Prize for Excellence in the Practice of Advanced Analytics and Operations Research)决选荣誉。值得一提的是,这是该团队继 2022 年首次入选该奖项决选名单后,第二次获此殊荣,彰显其在工业级智能决策系统领域的持续领先能力。