【理论学习】Single-Item Prophet Inequality
最近做的东西和先知不等式牵扯极多,不妨更个博客记录一下这个领域的经典结果。
问题
这个领域的“万法源头”自然是Single-Item Prophet Inequality,它是说:
有
玩家事前已知
在第
现在的问题是,玩家能否设计一个在线算法
或者,更明确地讲,假设我们能像先知一样提前看到所有盒子里具体会出现什么value,那么我们只accept其中最大的就好了,期望收益显然就是
我们的目标就是最大化
算法
1978年,Krengel等人给出了一个简单的阈值规则:
令阈值为
在游戏中,当且仅当
我们将上述算法记作
我们将使得
证明:
令
等价地,我们意识到
另外,令
可以注意到
最优性
这个算法被证明是最优的,也就是说,没有在线算法能保证比
证明:
考虑下面这个setting
我们有
对于任意在线
如果
如果
(即使向算法引入随机性也是如此)
因此
令