【科研点子】Price of Anachy in Delegation
经过这段时间的学习,我已经对标题所述的这个科研点子有了比较系统的想法。
代理问题的无政府代价涉及哪些空间?
空间,即全体 分布集族的空间; 空间,即全体pincipal效益函数的空间; 空间,即全体agent效益函数的空间; 空间,即全体principal可采取的策略的空间。
(注意,全体
四个空间的选取定义了一个确切的代理问题和其解决过程,记为
作为例子的一个子空间
如果不设条件,那么上面提到的这四个空间都非常非常庞大,组合起来就更大了。
出于这个领域的研究惯例和实际意义,我们对这些空间要做出缩限。
这里给出一个极简的例子:
令
令
令
那么此时,我们其实只是要遍历
即
S’上的两类无政府代价
将
令使得principal期望收益最大化的策略为
按照传统的无政府代价定义,我们有
我们考虑无信息情形,也就是principal不知道
注意,我们现在有两点可能存在的困惑——
此时(在principal的角度)其实是无法计算出
究竟是什么的,因为 是未知的。根据相关研究,principal只能确定地给出能够保证常数级别delegation gap(接下来简记为dg)的方案。 代表“有政府”的
的真正含义是有待商榷的。它可以有两个程度——一是有个开天眼的人看到了两个人的效益函数,然后强行把 设定成了最有利于整体的那个,agent仍然按照 来自己行动,在 下最大化自己的效益函数,这个比较符合delegation的设定,但是由于agent仍在追逐私利所以看起来好像不够“有政府”;二是principal和agent完全联合,制定策略来最大化全体的利益。这固然够“政府”,但此时作为联合体的两人仍停留在 就是一件很奇怪的事了,更好的策略显然是把所有元素sample完然后选择对整体最好的那个,这并不是 所能涵盖的策略,我们得换一个记号了。暂且地,我们将基于第一个程度计算的“有政府”期望收益记为 ,第二个程度记为 。
对于第一点,我们修改定义:令principal角度下delegation gap最优化的策略为
比方说,我们可以很容易地给出一个
考虑dg就要考虑最差的情形,它是什么呢?事实上就是agent的效益函数和principal刚好“相反”。(而恰好我们这个例子里agent的效益函数也确实是这样的)此时,在进行两次sample后,agent总会挑选符合阈值规则的元素里(principal视角下)最差的那个。
首先给出一个引理,设
设阈值为
求导,
令导数为
此时能保证最差情形下期望收益为
则有
还不错。
而此时的总期望收益为:
而显然
故
让我们来考虑一下这两个结果:
对于第一个结果,它事实上给出了一个能导致最好
我们还能再给出很多这样的实例,比方说
其实显然,上述构造就是在保证
那么现在就有一个非常值得一问的问题,
对于第二个结果,看起来还蛮不错的,这个代价虽然不为
该问题还有一个技术难点,那就是可行的函数空间是纷繁复杂的,这导致
一个能导致最差PoA的伪实例
Delegation问题里,如果不对问题空间做特别限制,
把
(这里给
当
则
弥补PoA的第三方方案和零知识方案
在我们的问题设定里,principal和agent存在一种不信任关系。在原始论文中,所有策略都不基于任何双方关于彼此效益函数的先验知识。
现在的问题是,如果存在一个可信的第三方(能够保密等),在什么情形下双方愿意把自己的信息交给第三方去处理?或者对于彼此的先验知识到达什么程度才能使双方产生这种意愿?
另一方面,如果不存在这样的第三方,是否还有(零知识)机制在不降低双方期望收益的情况下改良
(研究中)