国际经济管理学院研究生workshop 2023年秋季学期第10期
时间: 2023-12-08 10:54:00
研究生workshop由首都经济贸易大学国际经济管理学院主办。主要内容:一是研究生报告前沿或经典文献,二是研究生报告自己的研究或研究设想。论坛宗旨是:为学院师生搭建一个学术交流平台,营造浓厚学术氛围;通过对经典论著或前沿文献的研讨,拓宽研究生的理论视野,提升研究生的前沿方法运用能力,帮助研究生提高论文写作质量。
本期workshop
报告人:苏欢(博士一年级)
导师:李鲲鹏
报告题目:《MARKOV CHAIN MONTE CARLO METHODS: COMPUTATION AND INFERENCE》Handbook of Econometrics,2001.
报告摘要:
This chapter reviews the recent developments in Markov chain Monte Carlo simulation methods. These methods, which are concerned with the simulation of high dimensional probability distributions, have gained enormous prominence and revolutionized Bayesian statistics. The chapter provides background on the relevant Markov chain theory and provides detailed information on the theory and practice of Markov chain sampling based on the Metropolis-Hastings and Gibbs sampling algorithms. Convergence diagnostics and strategies for implementation are also discussed. A number of examples drawn from Bayesian statistics are used to illustrate the ideas. The chapter also covers in detail the application of MCMC methods to the problems of prediction and model choice.
这一章节回顾了马尔可夫链蒙特卡洛模拟方法的最新发展。这些方法涉及高维概率分布的模拟,已经广受关注,并彻底改变了贝叶斯统计学。这一章节提供了相关马尔可夫链理论的背景,并详细介绍了基于Metropolis-Hastings和Gibbs抽样算法的马尔可夫链抽样理论和实践。同时还讨论了收敛诊断和实现策略。为了阐明这些思想,本章节使用了一些来自贝叶斯统计学的例子。此外,章节还详细介绍了MCMC方法在预测和模型选择问题上的应用。
报告人:王璞(博士四年级)
导师:李鲲鹏、李委明
报告题目:《DDG-DA: Data Distribution Generation for Predictable Concept Drift Adaptation》,AAAI,2022
报告摘要:
在现实世界的真实场景中,人们处理的数据往往是随时间顺序收集的流式数据,机器学习算法能够被广泛应用于现实世界一般依赖数据独立同分布的假设。然而,常见金融领域的数据并不满足这一条件,其规律会随着时间产生变化,这就导致传统的依赖独立同分布假设的机器学习模型难以在不同时间上同时进行有效预测。这种流数据分布以不易预测的方式发生变化的现象被称为概念漂移。
为了处理概念漂移,此前的方法是先检测概念漂移发生的时间,再调整模型以适应最新数据的分布,但是这类方法无法应对数据分布在下一个时刻继续发生变化的问题。本文发现,除了一些极端难以预料的分布突变,概念漂移常常以渐进地非随机方式演变,且这种渐进的概念漂移在某种程度上是可预测的,即概念漂移本身就存在一定的趋势和规律。而实际上这种场景在流数据中十分常见,但大多数现有研究都较少关注这一方向。因此,本文通过预测未来的数据分布来关注可预测的概念漂移,并提出了新的方法 DDG-DA(Data Distribution Generation for Predictable Concept Drift Adaptation),来有效地预测数据分布的演变,并提高模型的性能。其具体的思路是,首先训练预测器来估计未来的数据分布,然后利用它生成训练样本,最后在生成的数据上训练模型。DDG-DA 算法提出并证明了未来数据的数据分布是可预测的。