不同博奕中的数学原理

时间：2018-10-15 11:22:01

关键字：巴什博奕威佐夫博奕尼姆博奕

手机看文章

扫描二维码
随时随地手机看文章

[导读]有一种很有意思的游戏，就是有物体若干堆，可以是火柴棍或是围棋子等等均可。两个人轮流从堆中取物体若干，规定最后取光物体者取胜。这是我国民间很古老的一个游戏，别看这游戏极其简单，却蕴含着深刻的数学原理。下

有一种很有意思的游戏，就是有物体若干堆，可以是火柴棍或是围棋子等等均可。两个人轮流从堆中取物体若干，规定最后取光物体者取胜。这是我国民间很古老的一个游戏，别看这游戏极其简单，却蕴含着深刻的数学原理。下面我们来分析一下要如何才能够取胜。

(一)巴什博奕(Bash Game)：

只有一堆n个物品，两个人轮流从这堆物品中取物，规定每次至少取一个，最多取m个。最后取光者得胜。

显然，如果n=m+1，那么由于一次最多只能取m个，所以，无论先取者拿走多少个，后取者都能够一次拿走剩余的物品，后者取胜。因此我们发现了如何取胜的法则：如果n=(m+1)r+s，(r为任意自然数，s≤m),那么先取者要拿走s个物品，如果后取者拿走k(≤m)个，那么先取者再拿走m+1-k个，结果剩下(m+1)(r-1)个，以后保持这样的取法，那么先取者肯定获胜。总之，要保持给对手留下(m+1)的倍数，就能最后获胜。

这个游戏还可以有一种变相的玩法：两个人轮流报数，每次至少报一个，最多报十个，谁能报到100者胜。

(二)威佐夫博奕(Wythoff Game)：

有两堆各若干个物品，两个人轮流从某一堆或同时从两堆中取同样多的物品，规定每次至少取一个，多者不限，最后取光者得胜。

这种情况下是颇为复杂的。我们用(ak，bk)(ak ≤ bk ,k=0，1，2，…,n)表示两堆物品的数量并称其为局势，如果甲面对(0，0)，那么甲已经输了，这种局势我们称为奇异局势。前几个奇异局势是：(0，0)、(1，2)、(3，5)、(4，7)、(6，10)、(8，13)、(9，15)、(11，18)、(12，20)。可以看出,a0=b0=0,ak是未在前面出现过的最小自然数,而 bk= ak + k，奇异局势有如下三条性质：

1。任何自然数都包含在一个且仅有一个奇异局势中。

由于ak是未在前面出现过的最小自然数，所以有ak > ak-1 ，而 bk= ak + k > ak-1 + k-1 = bk-1 > ak-1 。所以性质1。成立。

2。任意操作都可将奇异局势变为非奇异局势。

事实上，若只改变奇异局势(ak，bk)的某一个分量，那么另一个分量不可能在其他奇异局势中，所以必然是非奇异局势。如果使(ak，bk)的两个分量同时减少，则由于其差不变，且不可能是其他奇异局势的差，因此也是非奇异局势。

3。采用适当的方法，可以将非奇异局势变为奇异局势。

假设面对的局势是(a,b)，若 b = a，则同时从两堆中取走 a 个物体，就变为了奇异局势(0，0);如果a = ak ，b > bk，那么，取走b – bk个物体，即变为奇异局势;如果 a = ak ， b < bk ,则同时从两堆中拿走 ak – ab – ak个物体,变为奇异局势( ab – ak , ab – ak+ b – ak);如果a > ak ，b= ak + k,则从第一堆中拿走多余的数量a – ak 即可;如果a < ak ，b= ak + k,分两种情况，第一种，a=aj (j < k)从第二堆里面拿走 b – bj 即可;第二种，a=bj (j < k),从第二堆里面拿走 b – aj 即可。

从如上性质可知，两个人如果都采用正确操作，那么面对非奇异局势，先拿者必胜;反之，则后拿者取胜。

那么任给一个局势(a，b)，怎样判断它是不是奇异局势呢?我们有如下公式： ak =[k(1+√5)/2]，bk= ak + k (k=0，1，2，…,n 方括号表示取整函数)奇妙的是其中出现了黄金分割数(1+√5)/2 = 1。618…,因此,由ak，bk组成的矩形近似为黄金矩形，由于2/(1+√5)=(√5-1)/2，可以先求出j=[a(√5-1)/2]，若a=[j(1+√5)/2]，那么a = aj，bj = aj + j，若不等于，那么a = aj+1，bj+1 = aj+1+ j + 1，若都不是，那么就不是奇异局势。然后再按照上述法则进行，一定会遇到奇异局势。

(三)尼姆博奕(Nimm Game)：

有三堆各若干个物品，两个人轮流从某一堆取任意多的物品，规定每次至少取一个，多者不限，最后取光者得胜。

这种情况最有意思，它与二进制有密切关系，我们用(a，b，c)表示某种局势，首先(0，0，0)显然是奇异局势，无论谁面对奇异局势，都必然失败。第二种奇异局势是(0，n，n)，只要与对手拿走一样多的物品，最后都将导致(0，0，0)。仔细分析一下，(1，2，3)也是奇异局势，无论对手如何拿，接下来都可以变为(0，n，n)的情形。

计算机算法里面有一种叫做按位模2加，也叫做异或的运算，我们用符号(+)表示这种运算。这种运算和一般加法不同的一点是1+1=0。先看(1，2，3)的按位模2加的结果：

1 =二进制01

2 =二进制10

3 =二进制11 (+)

0 =二进制00 (注意不进位)

对于奇异局势(0，n，n)也一样，结果也是0。

任何奇异局势(a，b，c)都有a(+)b(+)c =0。

如果我们面对的是一个非奇异局势(a，b，c)，要如何变为奇异局势呢?假设 a < b< c,我们只要将 c 变为 a(+)b,即可,因为有如下的运算结果: a(+)b(+)(a(+)b)=(a(+)a)(+)(b(+)b)=0(+)0=0。要将c 变为a(+)b，只要从 c中减去 c-(a(+)b)即可。

例1。(14，21，39)，14(+)21=27，39-27=12，所以从39中拿走12个物体即可达到奇异局势(14，21，27)。

例2。(55，81，121)，55(+)81=102，121-102=19，所以从121中拿走19个物品就形成了奇异局势(55，81，102)。

例3。(29，45，58)，29(+)45=48，58-48=10，从58中拿走10个，变为(29，45，48)。

例4。我们来实际进行一盘比赛看看：

甲:(7,8,9)->(1,8,9)奇异局势

乙:(1,8,9)->(1,8,4)

甲:(1,8,4)->(1,5,4)奇异局势

乙:(1,5,4)->(1,4,4)

甲:(1,4,4)->(0,4,4)奇异局势

乙:(0,4,4)->(0,4,2)

甲:(0.4,2)->(0,2,2)奇异局势

乙:(0,2,2)->(0,2,1)

甲:(0,2,1)->(0,1,1)奇异局势

乙:(0,1,1)->(0,1,0)

甲:(0,1,0)->(0,0,0)奇异局势

甲胜。

取火柴的游戏

题目1：今有若干堆火柴，两人依次从中拿取，规定每次只能从一堆中取若干根，

可将一堆全取走，但不可不取，最后取完者为胜，求必胜的方法。

题目2：今有若干堆火柴，两人依次从中拿取，规定每次只能从一堆中取若干根，

可将一堆全取走，但不可不取，最后取完者为负，求必胜的方法。

嘿嘿，这个游戏我早就见识过了。小时候用珠算玩这个游戏：第一档拨一个，第二档拨两个，依次直到第五档拨五个。然后两个人就轮流再把棋子拨下来，谁要是最后一个拨谁就赢。有一次暑假看见两个小孩子在玩这个游戏，我就在想有没有一个定论呢。下面就来试着证明一下吧

先解决第一个问题吧。

定义：若所有火柴数异或为0，则该状态被称为利他态，用字母T表示;否则，

为利己态，用S表示。

[定理1]：对于任何一个S态，总能从一堆火柴中取出若干个使之成为T态。

证明：

若有n堆火柴，每堆火柴有A(i)根火柴数，那么既然现在处于S态，

c = A(1) xor A(2) xor … xor A(n) > 0;

把c表示成二进制，记它的二进制数的最高位为第p位，则必然存在一个A(t),它二进制的第p位也是1。(否则，若所有的A(i)的第p位都是0，这与c的第p位就也为0矛盾)。

那么我们把x = A(t) xor c,则得到x < A(t).这是因为既然A(t)的第p位与c的第p位同为1,那么x的第p位变为0,而高于p的位并没有改变。所以x < A(t).而

A(1) xor A(2) xor … xor x xor … xor A(n)

= A(1) xor A(2) xor … xor A(t) xor c xor … xor A(n)

= A(1) xor A(2) xor… xor A(n) xor A(1) xor A(2) xor … xor A(n)

= 0

这就是说从A(t)堆中取出 A(t) – x 根火柴后状态就会从S态变为T态。证毕

[定理2]：T态，取任何一堆的若干根，都将成为S态。

证明：用反证法试试。

若

c = A(1) xor A(2) xor … xor A(i) xor … xor A(n) = 0;

c’ = A(1) xor A(2) xor … xor A(i’) xor c xor … xor A(n) = 0;

则有

c xor c’ = A(1) xor A(2) xor … xor A(i) xor … xor A(n) xor A(1) xor A(2) xor … xor A(i’) xor c xor … xor A(n) = A(i) xor A(i’) =0

进而推出A(i) = A(i’)，这与已知矛盾。所以命题得证。

[定理 3]：S态，只要方法正确，必赢。

最终胜利即由S态转变为T态，任何一个S态，只要把它变为T态，(由定理1，可以把它变成T态。)对方只能把T态转变为S态(定理2)。这样，所有S态向T态的转变都可以有己方控制，对方只能被动地实现由T态转变为S态。故S态必赢。

[定理4]：T态，只要对方法正确，必败。

由定理3易得。

接着来解决第二个问题。

定义：若一堆中仅有1根火柴，则被称为孤单堆。若大于1根，则称为充裕堆。

定义：T态中，若充裕堆的堆数大于等于2，则称为完全利他态，用T2表示;若充裕堆的堆数等于0，则称为部分利他态，用T0表示。

孤单堆的根数异或只会影响二进制的最后一位，但充裕堆会影响高位(非最后一位)。一个充裕堆，高位必有一位不为0，则所有根数异或不为0。故不会是T态。

[定理5]：S0态，即仅有奇数个孤单堆，必败。T0态必胜。

证明：

S0态，其实就是每次只能取一根。每次第奇数根都由己取，第偶数根都由对

方取，所以最后一根必己取。败。同理, T0态必胜#

[定理6]：S1态，只要方法正确，必胜。

证明：

若此时孤单堆堆数为奇数，把充裕堆取完;否则，取成一根。这样，就变成奇数个孤单堆，由对方取。由定理5，对方必输。己必胜。 #

[定理7]：S2态不可转一次变为T0态。

证明：

充裕堆数不可能一次由2变为0。得证。 #

[定理8]：S2态可一次转变为T2态。

证明：

由定理1，S态可转变为T态，态可一次转变为T态，又由定理6，S2态不可转一次变为T0态，所以转变的T态为T2态。 #

[定理9]：T2态，只能转变为S2态或S1态。

证明：

由定理2，T态必然变为S态。由于充裕堆数不可能一次由2变为0，所以此时的S态不可能为S0态。命题得证。

[定理10]：S2态，只要方法正确，必胜.

证明：

方法如下：

1) S2态，就把它变为T2态。(由定理8)

2) 对方只能T2转变成S2态或S1态(定理9)

若转变为S2, 转向1)

若转变为S1, 这己必胜。(定理5)

[定理11]：T2态必输。

证明：同10。

综上所述，必输态有： T2,S0

必胜态： S2,S1,T0.

两题比较：

第一题的全过程其实如下：

S2->T2->S2->T2-> …… ->T2->S1->T0->S0->T0->……->S0->T0(全0)

第二题的全过程其实如下：

S2->T2->S2->T2-> …… ->T2->S1->S0->T0->S0->……->S0->T0(全0)

下划线表示胜利一方的取法。是否发现了他们的惊人相似之处。

我们不难发现(见加黑部分)，S1态可以转变为S0态(第二题做法)，也可以转变为

T0(第一题做法)。哪一方控制了S1态，他即可以有办法使自己得到最后一根(转变为

T0),也可以使对方得到最后一根(转变为S0)。

所以，抢夺S1是制胜的关键!

为此，始终把T2态让给对方，将使对方处于被动状态，他早晚将把状态变为S1.

有了上面的知识接下来我们来看看组合博弈(n堆石子)

一、巴什博弈

1、问题模型：只有一堆n个物品，两个人轮流从这堆物品中取物，规定每次至少取一个，最多取m个，最后取光者得胜。

2、解决思路：当n=m+1时，由于一次最多只能取m个，所以无论先取者拿走多少个，后取者都能够一次拿走剩余的物品，后者取胜，所以当一方面对的局势是n%(m+1)=0时，其面临的是必败的局势。所以当n=(m+1)*r+s，(r为任意自然数，s≤m)时,如果先取者要拿走s个物品，如果后取者拿走x(≤m)个，那么先取者再拿走m+1-k个，结果剩下(m+1)(r-1)个，以后保持这样的取法，那么先取者肯定获胜。总之，要保持给对手留下(m+1)的倍数，就能最后获胜。

3、变形：条件不变，改为最后取光的人输。

结论：当(n-1)%(m+1)==0时后手胜利。

4、题目练习：HDOJ：2188 2149 1849

二、威佐夫博奕

1、问题模型：有两堆各若干个物品，两个人轮流从某一堆或同时从两堆中取同样多的物品，规定每次至少取一个，多者不限，最后取光者得胜。

2、解决思路：A：设(ai,bi)(ai ≤bi ,i=0，1，2，…,n)表示两堆物品的数量并称其为局势，如果甲面对(0，0)，那么甲已经输了，这种局势我们称为奇异局势。前几个奇异局势是：(0，0)、(1，2)、(3，5)、(4，7)、(6，10)、(8，13)、(9，15)、(11，18)、(12，20)。任给一个局势(a，b)，如下公式判断它是不是奇异局势： ak =[k(1+√5)/2]，bk= ak + k (k=0，1，2，…,n 方括号表示取整函数)。(证明见百度百科)

3、满足上公式的局势性质：

(1)任何自然数都包含在一个且仅有一个奇异局势中。

由于ak是未在前面出现过的最小自然数，所以有ak > ak-1 ，而 bk= ak + k > ak-1 + k-1 = bk-1 > ak-1 。所以性质成立。

(2)任意操作都可将奇异局势变为非奇异局势。

若只改变奇异局势(ak，bk)的某一个分量，那么另一个分量不可能在其他奇异局势中，所以必然是非奇异局势。如果使(ak，bk)的两个分量同时减少，则由于其差不变，且不可能是其他奇异局势的差，因此也是非奇异局势

(3)采用适当的方法，可以将非奇异局势变为奇异局势。

假设面对的局势是(a,b)，若 b = a，则同时从两堆中取走 a 个物体，就变为了奇异局势(0，0);如果a = ak ，b > bk，那么，取走b – bk个物体，即变为奇异局势;如果 a = ak ， b < bk ,则同时从两堆中拿走 ak – ab – ak个物体,变为奇异局势( ab – ak , ab – ak+ b – ak);如果a > ak ， b= ak + k,则从第一堆中拿走多余的数量a – ak 即可;如果a < ak ，b= ak + k,分两种情况，第一种，a=aj (j < k),从第二堆里面拿走 b – bj 即可; 第二种，a=bj (j < k),从第二堆里面拿走 b – aj 即可。

4、结论：两个人如果都采用正确操作，那么面对非奇异局势，先拿者必胜;反之，则后拿者取胜。

5、练习：poj 1067

三、Fibonacci博弈

1、问题模型：

有一堆个数为n的石子，游戏双方轮流取石子，满足：

(1)先手不能在第一次把所有的石子取完;

(2)之后每次可以取的石子数介于1到对手刚取的石子数的2倍之间(包含1和对手刚取的石子数的2倍)。约定取走最后一个石子的人为赢家。

2、解决思路：

当n为Fibonacci数时，先手必败。即存在先手的必败态当且仅当石头个数为Fibonacci数。

证明：根据“Zeckendorf定理”(齐肯多夫定理)：任何正整数可以表示为若干个不连续的Fibonacci数之和。如n=83 = 55+21+5+2，我们看看这个分解有什么指导意义：假如先手取2颗，那么后手无法取5颗或更多，而5是一个Fibonacci数，那么一定是先手取走这5颗石子中的最后一颗，同理，接下去先手取走接下来的后21颗中的最后一颗，再取走后55颗中的最后一颗，那么先手赢。

反证：如果n是Fibonacci数，如n=89：记先手一开始所取的石子数为y

(1)若y>=34颗(也就是89的向前两项)，那么一定后手赢，因为89-34=55=34+21<2*34。

(2)y<34时剩下的石子数x介于55到89之间，它一定不是一个Fibonacci数，把x分解成Fibonacci数：x=55+f[i]+…+f[j]，若，如果f[j]<=2y，那么对B就是面临x局面的先手，所以根据之前的分析，后手只要先取f[j]个即可，以后再按之前的分析就可保证必胜。

3、练习题目：NYOJ 取石子游戏

四、尼姆博弈

1、问题模型：有三堆各若干个物品，两个人轮流从某一堆取任意多的物品，规定每次至少取一个，多者不限，最后取光者得胜。

2、解决思路：用(a，b，c)表示某种局势，显证(0，0，0)是第一种奇异局势，无论谁面对奇异局势，都必然失败。第二种奇异局势是(0，n，n)，只要与对手拿走一样多的物品，最后都将导致(0，0，0)。

搞定这个问题需要把必败态的规律找出：(a,b,c)是必败态等价于a^b^c=0(^表示异或运算)。

证明:(1)任何p(a,b,c)=0的局面出发的任意局面(a,b,c’);一定有p(a,b,c’)不等于0。否则可以得到c=c’。

(2)任何p(a,b,c)不等于0的局面都可以走向 p(a,b,c)=0的局面

(3)对于 (4,9,13) 这个容易验证是奇异局势

其中有两个8，两个4，两个1，非零项成对出现，这就是尼姆和为零的本质。别人要是拿掉13里的8或者1，那你就拿掉对应的9 中的那个8或者1;别人要是拿掉13里的4，你就拿掉4里的4; 别人如果拿掉13里的3，就把10作分解，然后想办法满足非零项成对即可。

3、推广一：如果我们面对的是一个非奇异局势(a，b，c)，要如何变为奇异局势呢?假设 a < b< c,我们只要将 c 变为 a^b,即可,因为有如下的运算结果: a^b^(a^b)=(a^a)^(b^b)=0^0=0。要将c 变为a^b，只从 c中减去 c-(a^b)

4、推广二：当石子堆数为n堆时，则推广为当对每堆的数目进行亦或之后值为零是必败态。

5、练习：hdoj 1847

五、公平组合博弈(Impartial Combinatori Games)

1、定义：

(1)两人参与。

(2)游戏局面的状态集合是有限。

(3)对于同一个局面，两个游戏者的可操作集合完全相同

(4)游戏者轮流进行游戏。

(5)当无法进行操作时游戏结束，此时不能进行操作的一方算输。

(6)无论游戏如何进行，总可以在有限步数之内结束。

2、模型：给定一个有向无环图和一个起始顶点上的一枚棋子，两名选手交替的将这枚棋子沿有向边进行移动，无法移动者判负。事实上，这个游戏可以认为是所有公平组合游戏(Impartial Combinatori Games)的抽象模型。其实，任何一个ICG都可以通过把每个局势看成一个顶点，对每个局势和它的子局势连一条有向边来抽象成这个“有向图游戏”。

3、解决思路：

现在，假定我们给出两个游戏G1 和 G2。如果我们只知道单个游戏的P-状态和N-状态我们能够正确地玩好游戏和G1 + G2吗?答案是否定的。不难看出两个P-状态的和总是P-状态，P-状态和N-状态的和总是N-状态。但是两个N-状态的和既可能是P-状态也可能是N-状态。因此，只知道单个游戏的P-状态和N-状态是不够的。

为了正确地玩好游戏和我们需要推广P-状态和N-状态，它就是Sprague-Grudy函数(或者简称为g函数)

4、Sprague-Grudy定理：

令N = {0, 1, 2, 3, ...} 为自然数的集合。Sprague-Grundy 函数给游戏中的每个状态分配了一个自然数。结点v的Grundy值等于没有在v的后继的Grundy值中出现的最小自然数.

形式上：给定一个有限子集 S ⊂ N,令mex S(最小排斥值)为没有出现在S中的最小自然数。定义mex(minimal excludant)运算，这是施加于一个集合的运算，表示最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。

对于一个给定的有向无环图，定义关于图的每个顶点的Sprague-Garundy函数g如下：g(x)=mex{ g(y) | y是x的后继 }。

5、性质：

(1)所有的终结点所对应的顶点，其SG值为0，因为它的后继集合是空集——所有终结点是必败点(P点)。

(2)对于一个g(x)=0的顶点x，它的所有后继y都满足g(y)!=0——无论如何操作，从必败点(P点)都只能进入必胜点(N点)//对手走完又只能把N留给我们。

(3)对于一个g(x)!=0的顶点，必定存在一个后继点y满足g(y)=0——从任何必胜点(N点)操作，至少有一种方法可以进入必败点(P点)//就是那种我们要走的方法。

6、应用：

(1)可选步数为1-m的连续整数，直接取模即可，SG(x) = x % (m+1);

(2)可选步数为任意步，SG(x) = x;