管理学与经济学系列前沿讲座之四叁四讲
主题
分布式鲁棒上下文多臂老虎机决策问题
活动时间
-
活动地址
线上讲座,腾讯会议形式( 会议 ID: 231-592-369 )
主讲人
周正元助理教授,纽约大学厂迟别谤苍商学院
主持人
夏俐教授,麻花传MDR免费版
嘉宾介绍:
? ? ? ?
? ? ? ?周正元,纽约大学Stern商学院运筹系助理教授。周教授在加入纽约大学Stern商学院之前,曾于2019-2020年担任IBM Research Goldstine Fellow。他本科于2013年毕业于加州大学伯克利分校,电子信息工程和数学双学位;博士于2019年毕业于斯坦福大学电子工程专业,并同时在斯坦福获取计算机硕士,统计学硕士和经济学硕士,以及数学专业辅修和管理与工程专业辅修。他的研究兴趣在于机器学习、随机优化和博弈论的交叉,并专注于利用这些领域的工具开发方法框架,以解决数据驱动的决策问题。
?
讲座介绍:
? ? ? ?利用历史观测数据进行策略学习是一个重要的研究问题,已经得到了广泛的应用。例如工作选择问题、定价问题、广告投放问题,以及患者治疗方案选择问题等。然而,现有文献基于一个关键假设,即实施所学策略的未来环境与生成数据的过去环境相同——这一假设通常是错误的,或者过于粗略。在研究中,我们提出了这个假设,目的是学习一个具有不完全观测数据的概率分布鲁棒策略。我们首先介绍一个策略评估过程,该过程允许我们评估策略的执行情况。在最坏的情况下,情况会发生变化。然后建立一个中心极限定理类来分析此策略评估方法的性能界。利用这种策略评估方法,我们进一步提出一种新的学习算法,该算法能够在基于一致收敛理论的性能保证下学习对对抗性扰动和未知协变量偏移具有鲁棒性的策略。
扫描此二维码分享