賀佳圓
(中國農(nóng)業(yè)大學(xué),北京 100083)
在所有的體育比賽中,棒球無疑是最突出智力競賽的項目之一。棒球運動是一項以跑、跳、投、打、接等技術(shù)動作構(gòu)成的、在特定技術(shù)和戰(zhàn)術(shù)基礎(chǔ)上進行的團隊體育運動[1]。它在世界上影響較大,被譽為“競技與智慧的結(jié)合”。棒球運動在美國、日本尤為盛行,被稱為“國球”。早期中國棒球主要受美國棒球影響較多,之后逐漸轉(zhuǎn)向日本學(xué)習(xí),中國棒球與美國、日本的交流多以技術(shù)動作為主,涉及力量訓(xùn)練方面比較少[2]。雖然棒球在中國并不普及,但卻是一項體力與智力高度結(jié)合的運動:棒球運動不僅能夠發(fā)展體能素質(zhì),還可以促進智力發(fā)育,培養(yǎng)集體主義精神,非常適合在當(dāng)代青年中普遍開展。
在一場棒球賽中,棒球球員分為進攻、防守兩方。場上投球手是防守方,擊球手是進攻方。進攻方的目的就是通過揮棒打出投球手投出的球從而得分,防守方的目的就是阻止進攻方得分。無論是哪個角色,想要在棒球運動中取得勝利,除了對項目特征有深刻認(rèn)識、進行力量和技巧訓(xùn)練以外,還要懂得通過博弈論來制定最優(yōu)策略。
我們知道,如果一件事情的結(jié)果只依賴于一個參與者,這叫做決策論。在此基礎(chǔ)上,如果結(jié)果依賴于多于一個參與者的決策,便為博弈論。在棒球比賽中,比賽的結(jié)果不僅取決于投球手的投球技術(shù)和策略,也取決于擊球手的擊球技術(shù)和策略,因此棒球比賽的過程也是博弈的過程。
在棒球比賽中,投球手希望以智取勝擊球手。對某個擊球手,投球手的最佳策略可能總是投出快球,但對于另一個擊球手,投球手可能總是投出弧線球更好。而對于第三個擊球手,投球手的最佳策略可能是以某種隨機的方式混合地投出快球和弧線球。
擊球手可以猜測投球手要么投出快球,要么投出弧線球。如果他預(yù)計投球手投出快球,按照投球手實際擲出的是快球或是弧線球,他擊球?qū)⒎謩e得到0.400或是0.200分;如果他預(yù)計是弧線球,按照投球手實際擲出的是快球或是弧線球,他擊球?qū)⒎謩e得到0.100或是0.300分。在這個例子中,投球手希望使擊球手的平均得分最小,而擊球手希望自己的平均得分最大,因此投球手和擊球手的沖突是完全的,沒有參與者在不傷害其他參與者的前提下能夠使自己得到改善,投球手和擊球手之間注定是一個完全沖突博弈的關(guān)系。
可以看出在這種情況下,如果擊球手預(yù)計是快球,那么投球手應(yīng)該擲出弧線球。如果擊球手預(yù)計是弧線球,那么投球手應(yīng)該擲出快球。正如表1中所示,投球手需要采用兩種策略,即快球和弧線球。從擊球手的角度看,如果投球手總是投出快球,擊球手將轉(zhuǎn)換到總是預(yù)計快球的策略,而如果投球手總是投出弧線球,擊球手將轉(zhuǎn)換到總是預(yù)計弧線球的策略。擊球手也需要采用兩種策略,這意味著一個參與者總是可以通過單方面改變策略使得自己得到改善,投球手和擊球手的較量沒有純策略解,兩人都沒有占優(yōu)策略。那么,對擊球手和投球手而言,最佳混合策略是什么?
我們首先考慮擊球手的決策,他希望選擇猜測快球或者弧線球的組合,使擊球平均分最大。令x表示擊球手猜測是快球的比例,1-x表示猜測是弧線球的比例,我們有EV(投球手投快球)=0.400x+0.100(1-x),EV(投球手投弧線球)=0.200x+0.300(1-x),令它們相等并求解,得到0.400x+0.100(1-x)=0.200x+0.300(1-x),解得x=0.5。因此,擊球手應(yīng)該猜測50%的快球和50%的弧線球。我們可以通過計算投球手采用快球策略或者弧線球策略時對應(yīng)的擊球手的期望值來確定擊球平均分:EV(投球手投快球)=0.400x+0.100(1-x)=0.400*0.5+0.100*0.5=0.250。這表明,如果擊球手50%的時間猜測快球,無論投球手采用純快球策略還是純弧線球策略,他都能得到0.250的分?jǐn)?shù)。令y表示投球手?jǐn)S出快球的比例,1-y表示投球手?jǐn)S出弧線球的比例,由于無論投球手?jǐn)S出快球還是弧線球,結(jié)果分?jǐn)?shù)都是0.250,所以我們有擊球平均分的期望值:A=0.250y+0.250(1-y)=0.250,因此,無論投球手采用何種策略,只要擊球手采用自己的最優(yōu)策略,他都能得到0.250的分?jǐn)?shù)。
我們再來考慮投球手的決策,他希望選擇擲出快球或者弧線球的某種組合,使擊球平均分最小。同理,我們給出擊球手的策略的期望值,EV(擊球手采用快球策略)=0.400y+0.200(1-y),EV(擊球 手 采 用弧線 球策略)=0.100y+0.300(1-y),令它們相等并求解,得到0.400y+0.200(1-y)=0.100y+0.300(1-y),解得 y=0.250。因此,投球手應(yīng)該擲出25%的快球和75%的弧線球,與前面一樣,擊球平均分0.250,這可以通過計算期望值驗證,EV(擊 球 手 采用 快 球 策 略)=0.400y+0.200(1-y)=0.400*0.25+0.200*0.75=0.250。無論擊球手采用純快球策略還是純弧線球策略,擊球平均分都是0.250,如果擊球手采用混合策略而投球手堅持25%的時間擲出快球,75%時間擲出弧線球,擊球平均分的期望值都是A=0.250x+0.250(1-x)=0.250,所以,無論擊球手采用何種策略,只要投球手采用自己的最優(yōu)策略,他都能使擊球平均分是0.250,投球手的結(jié)果不再依賴于擊球手的策略。
我們可以將上述博弈過程一般化,得到一個適用于任何簡單情形的博弈模型。我們假設(shè)擊球手預(yù)計投球手投出快球,按照投球手實際擲出的是快球或是弧線球,他擊球?qū)⒎謩e得到a或是b分;如果他預(yù)計是弧線球,按照投球手實際擲出的是快球或是弧線球,他擊球?qū)⒎謩e得到c或是d分。我們按照前文的思路,可以得到EV(投球手投快球)=ax+c(1-x),EV(投球手投弧線球)=bx+d(1-x),令它們相等并求解,得到x=(d-c)/(a-b+d-c),因此,擊球手應(yīng)該猜測(d-c)/(a-b+d-c)的快球和[1-(d-c)/(a-b+d-c)]的弧線球。對于投球手而言,EV(擊球手采用快球策略)=ay+b(1-y),EV(擊球手采用弧線球策略)=cy+d(1-y),令它們相等并求解,得到y(tǒng)=(d-b)/(a-c+d-b),因此,投球手應(yīng)該擲出(d-b)/(a-c+d-b)的快球和[1-(d-b)/(a-c+d-b)]的弧線球。這個博弈模型適用于投球手和擊球手在知道擊球手的預(yù)判和投球手實際投出的球所對應(yīng)的得分時,能夠自動形成雙方的最優(yōu)策略。
在這場投球手和擊球手的較量中,需要注意的一點是,即使對手并不通過推理得到其最優(yōu)解,你也需要知道他策略的最優(yōu)混合方式,以便你能從他的草率行為中占到最大的便宜[3]。
我們注意到保密是很重要的,在前文的例子中,擊球手必須猜測投球手以50%的概率混合擲出快球和弧線球,但投球手沒有必要弄清楚擊球手的擊球模式。擊球手可能會利用時鐘或者隨機數(shù)發(fā)生器來決定什么時候猜測是快球。例如他利用時鐘的秒針,每當(dāng)秒針位于0-30秒時,就猜測是快球。
從前面的分析中,我們看到擊球手從他的最優(yōu)解中得到了有用的信息,即他可以通過一個策略保證他希望得到的結(jié)果,無論他面對的投球手采用什么樣的策略,這是一種很重要的“保證能夠得到的結(jié)果”的想法,在日常生活中也有著極為廣泛的應(yīng)用。但是我們也從前面的分析中得出,如果觀察到投球手希望最小化擊球手的擊球平均分,擊球手可能會從這個有用的信息中得到啟示從而確定投球手的最優(yōu)策略,如果投球手采用了最優(yōu)策略,擊球手不可能得到比他所能保證的擊球平均分更好的分?jǐn)?shù),在我們上面的舉例中就是0.250的平均分。但是如果投球手不采用最優(yōu)策略,擊球手就可以通過改用他的純快球策略或者純弧線球策略來增加自己的分?jǐn)?shù),以從投球手的草率行為中占到最大的便宜。從這個意義上講,投球手的最優(yōu)策略代表了擊球手的一個臨界點,如果投球手不采用最優(yōu)策略,擊球手也可以不采用他的最優(yōu)混合策略,從而使得自己的擊球平均分超過0.250,這是他所能保證得到的分?jǐn)?shù)。最重要的一點在于,投球手并不一定是一個理性的參與者(即自身利益最大、持續(xù)地有意圖的行動、不對動機妄加猜測、不考慮道德問題、只研究合法問題、盈利函數(shù)有多重標(biāo)準(zhǔn)的參與者),因此擊球者可以從非理性的投球者身上占到便宜。
在實際中,每個參與者的球技肯定會發(fā)生變化。例如,針對某個特定的擊球手,如果所有的投球手的最優(yōu)混合策略是只擲出弧線球,那么這個擊球手很可能會改進他擊打弧線球的能力,這就會使投球手對應(yīng)的擊球手的最優(yōu)混合策略發(fā)生改變,相應(yīng)的擊球平均分也會發(fā)生變化。
每個參與者的策略可能會有拓展,比如與不同的投球手(力量型投球手、技巧型投球手、策略型投球手等)博弈,擊球手采用不同策略的得分是不同的。除此之外,投球手還可能投出快球、叉指快速球、弧線球、變速球等,擊球手知道這些投球方式,且必須為這些投球方式做好適當(dāng)準(zhǔn)備。當(dāng)每個參與者的策略增多時,我們可以建立線性規(guī)劃的模型,找出最優(yōu)解來得到投球手和擊球手的策略。
投球手和擊球手的較量是一個有混合策略的完全沖突博弈,棒球賽的魅力就表現(xiàn)在投球手與擊球手在較量時發(fā)生的智力對策上,這也是吸引我研究這次博弈的原因。在棒球賽中,巧妙運用博弈模型可以使自身的優(yōu)勢放大,得分的可能性增加,為本隊獲勝提供有利條件。同時,這種博弈的思想和最優(yōu)策略的計算方法對于其他體育比賽以及經(jīng)濟、生活等方方面面也具有極大地適用性。