カウンタ

compteur (depuis le 1er décembre 2009)39824

電子講義集(全卓樹)

電子講義集(全卓樹) >> Article details

2010/08/01

量子ゲーム理論(1)

Tweet ThisSend to Facebook | by:T_Zen
量子ゲーム理論
[PDF版]←こっちが常に最新版

¥section*{要旨}
本稿では筆者の研究を中心に,量子ゲーム理論の現状レヴューを行なう.量子ゲーム理論とは,通常のゲーム理論の戦略を表現する連結確率を,ヒルベルト・ベクトル(量子波動関数)から生成される量子連結確率で置き換えて拡張したものである.量子連結確率には量子的エンタングルメントに由来して,通常の連結確率にはない環境パラメータが含まれている.量子戦略の内実を精査する事で,そのなかに通常の戦略を環境パラメータで変形した修正された擬古典戦略と,量子干渉に由来すして古典戦略としては決して表せない純量子的成分との,二つを見出すことができる.前者には例えば利他的戦略が含まれ,これがディレンマ・ゲームの量子的な改善とされるものの物理的説明を与える.後者は多くの場合小さな補正項を提供するだけであるが,ハーサニィ型不完備情報ゲームにおいて擬古典的な寄与を消去すると,ナッシュ均衡利得全体をベル不等式の破れ分だけ与える事が示せる.量子ゲーム理論の数理的進化生物学への適用可能性についても論じる.

{¥ キーワード}: 量子力学,ゲーム理論,エンタングルメント,利他性,ハーサニィ理論

¥section{序}

時たま「量子ゲーム」という言葉を耳にするのだが一体これは何なのか,こういう質問をうけることがある.検索をすると私のウェブサイトの解説が上の方に出てくるためのようだ.既に5年ほども前のものである.もっとアップトゥデイトな,そして出来たら画面のページを繰らなくても良いまとまった解説はないのか.こういう要望に答えたいと考えていたところ,友人の関わってる学会誌からの依頼を受けたので,ちょうど良い機会と考え,この解説を書いてみた.本稿の構成は次の通りである.

 2 古典ゲーム理論のおさらい
 3 処罰ルール,利他戦略
 4 量子戦略と利他性
 5 ハーサニィとベル:量子的利得の分離
 6 量子的進化の可能性


¥section{古典ゲーム理論のおさらい}

社会科学の諸分科を,検証可能でかつ新現象の予言を行えるまで定量化数理化しようというのは,現代の大きな潮流であろう.社会科学の定量化数理化という場合に,そこには二段階が考えられる.その第一段階は統計の導入であって,例えば統計的諸量間の関係をしらべてそれを論ずるマクロ経済学などが代表的である.そして現在進行中の第二段階がゲーム理論の導入であって,たとえば経済現象を,経済活動を行う要素間のダイナミクスから導こうとするミクロ経済学は,必然的にゲーム理論的な設定を基盤としたものとならざるを得ない.ゲーム理論に基づく社会現象,経済現象,心理現象,生態系の「ミクロ」な第二世代型研究は,通常系の中の二つの個体を取り出して,それらの相互作用を調べる「二体モデル」となっている.ここで一方の個体を系全体の平均でおきかえる近似操作をおこない,二体間のダイナミクスを直接考えないで済ます「一体モデル」を考えることができる.多くの場合,それがちょうど第一世代の「マクロ」社会科学になっているのである.

ゲーム理論の中心概念は「効用関数の最大化」というものである.今二名の独立した意思決定者$A$と$B$(プレイヤーとよぶ)がいて,それぞれに2つの行動の選択肢$(a_0, a_1)$と$(b_0, b_1)$が与えられてあるとする.それぞれは自分にとっての望ましい結果を表す効用関数$¥Pi_A$と$¥Pi_B$を最大化しようと行動の選択をするというモデルを考える.

行動の選択は確定的とも限らない.可能な選択肢を混ぜて取るという事も多くある.これはこの行動の選択(ゲームプレイという)が何度も行われる状況を考えている,とも言えるし,または多数のプレイヤーのペアからなる大きな系を考えて,その系全体の様子を見ていると考えても良い.プレイヤー$A$が選択肢$(a_0, a_1)$を選ぶ確率をそれぞれ$p=(p_0,p_1)$として,プレイヤー$B$が$(b_0, b_1)$を選ぶ確率$q=(q_0, q_1)$としてみる.この選択を表す確率を単に「戦略」とも呼ぶ.全確率は1となるという確率の性質から$p_0+p_1=1$,$q_0+q_1=1$が成り立つ.もし$¥Pi_A$が$A$の選択肢$p$だけに,$¥Pi_B$が$B$の選択肢$q$だけに依るならば,各々が自分だけの行動で自分の効用関数を最大化すればよく,これは二人を同時に考える必要もないので話は簡単である.問題は$A$の効用関数$¥Pi_A$が,$A$の選択$p$と$B$の選択$q$の両方に依存し,$B$の効用関数$¥Pi_B$についても同様の場合である.すなわち

Tex
Tex.

そうすると,それぞれの選択は,次の条件

Tex
Tex

で与えられると考えられる.この$¥Pi_A$と$¥Pi_B$を同時に最大化する選択の組$¥{p^¥star, q^¥star¥}$の事を「ナッシュ均衡」と称する.ナッシュ均衡を求める事が「ゲーム理論の解を求める」こととなるが,これは一般にはそんなに単純ではない.上記のプレイヤー二名に各二戦略ある「$2 ¥times 2$型」のゲームは,解が簡単に解析的に求まる例となっている.選択肢が二つではなく$n$個ある場合への拡張は$p=(p_0,p_1,...p_n)$,$q=(p_0,p_1,...,q_n)$ と考えれば良く,上の形式をそのまま維持できるので簡単であるが,解を求めるのは一般に$n$が大きいほど困難になって行く事は,容易に想像されよう.

結局ゲーム理論は$¥Pi_A(p, q)$と$¥Pi_B(p, q)$の関数形が与えられると問題が定まる訳であるが,この関数形そのもののかわりに,それが「ゲームテーブル」というものを通じて間接的に与えられる事が多い.両プレイヤーの行動が$¥{a_i, b_j¥}$の時$¥Pi_A = A_{i,j}$, $¥Pi_B = B_{i,j}$ だとするとこの$A_{i,j}$, $B_{i,j}$をゲームテーブルと呼ぶ.ゲームテーブルは行列表記して,例えば二戦略ゲームだと

TexTex

と書くことにする.選択$¥{a_i, b_j¥}$が行われる連結確率$P_{i,j}$は,両プレイヤーの選択が独立なので$P_{i,j}=p_i q=j$と積で与えられ,その結果効用関数は

Tex , Tex

で与えられる.こうして選択確率$p$,$q$で効用関数が陽に表現されると,ナッシュ均衡は偏微分条件

  Tex , 
  Tex

として線形な条件に書き下すことができる.

話が少し抽象的形式的になったので,例を二つばかりあげてみよう.その最初は

Tex , Tex

というゲームテーブルである.ここでは戦略要素は3つある.これはゲームテーブルが$A$と$B$で$A_{i,j}=B={j,i}$となっていて,両プレイヤーにとって「対称」であって,これは両者にとって「公平」なゲームである事を意味する.もし$A$と$B$の選択$a_i$,$b_j$が同じで$i=j$なら「引き分け」で両者の効用は0,もし$i=j+1 ({¥rm mod¥ } 3)$なら$A$の効用が$1$で$B$ は$-1$となって$A$の「勝ち」,もし$i=j-1 ({¥rm mod¥ } 3)$なら$A$の効用が$-1$で$B$ は$1$となって$A$の「負け」である.これは何のことはない,じゃんけんである.$A$の選択効用関数は$A$,$B$おのおのの戦略$p=(p_0,p_1,p_2)$,$q=(q_0,q_1,q_2)$によって

Tex
Tex

と与えられ,簡単な計算でナッシュ均衡は

Tex , Tex

と求まり,ナッシュ均衡での効用関数の値(利得と呼ぶ)は

Tex
Tex

となって,我々の経験的によく知っている事実が確認されるのである.すなわち,じゃんけんではクーチョキパーをでたらめに等確率で出すのがベストで,平均的にいうとじゃんけんに勝ち負けはない.

第二の例として戦略要素2の,

Tex  ,   Tex  ,

というゲームテーブルを考える.これもまた両プレイヤーにとって「公平」な対称ゲームである.$A$の選択効用関数は$A$,$B$おのおのの戦略$p=(p_0,p_1)$,$q=(q_0,q_1)$によって

Tex
Tex

と与えられ,簡単な計算でナッシュ均衡は

Tex
Tex

と求まり,ナッシュ均衡での利得は

Tex
Tex

となる.明らかに戦略$¥{ p=(0,1), q=(0,1)¥}$は両者に公平に利得3をもたらすので,両者ともにとって好ましい結末なのだが,これは相手の裏切り$¥{ p=(0,1), q=(1,0)¥}$または$¥{ p=(1,0), q=(0,1)¥}$を誘発するのでナッシュ均衡ではあり得ず,互いに損なのでどちらも避けたいディフェンシブな戦略$¥{ p=(1,0), q=(1,0)¥}$がナッシュ均衡となってしまうのである.このゲームは「囚人のディレンマ」と呼ばれる有名なものである.

Quantum Game Theory 1
15:10 | Impressed! | Voted(0) | Comment(0) | ePhysics