abst1

松本啓史科学技術振興事業団今井量子計算機構プロジェクト

統計学における適応的実験計画,学習理論における能動学習はともにデータの取り方を適応的に選択できる状況での統計的推測を扱っている. 同種の問題は量子力学に従う系で未知状態を (量子相関を用いない条件の下で)統計的に推測する際にも表れ, 最適な量子測定の選択が問題になる. 量子系の統計的推測の理論は Helstromにより始められ, 1980年代の後半に長岡が適応的推定法を導入して以来, 漸近理論の整備が急速にすすんでいる.

本研究では適応的実験計画での推定量を厳密に定式化した上で, その誤差の大偏差型の限界,すなわちBahadur型の限界を論じる.推定量の実用性を無視し, 原理的な限界の厳密な導出に焦点を置いた.

本研究のテーマである「適応的実験計画での二種類の Bahadur 型限界」については著者らによる, 先行研究があるが,その文献には若干の不備があり, また議論に不十分なところがある. 本研究では,基礎的なところから出発してその文献の不備を修正した上で, その後の発展について若干触れた.

通常の（実験を動かさない）確率分布族のパラメータ推定の場合, 推定量が真値から $\epsilon$ 以上ずれる確率の漸近的な減少率が Bahadurの限界で上から押えられ（Bahadurの不等式）, しかも最尤推定量はこの限界を達成することが知られている. この議論の特徴は,不等式が各点での推定量の真値への収束を仮定するだけ証明され,その他の正則性条件が全く必要ないことである. その帰結として,Bahadurの不等式は検定論のSteinの補題から導かれ, 比喩的には推定は二つのわずかに異なる確率分布の間の検定と見ることができる.

ところが,Bahadurの議論を適応的な実験計画に拡張すると,各点での推定量の収束だけを仮定した場合の限界 $B^w(\theta)$ と「漸近的一様性」を課した場合の限界 $B^s(\theta)$ とでは異なり,一般には $B^s(\theta) \le B^w(\theta)$ となる.

以下その詳細を述べる. 本研究では実験結果の確率分布は実験

と実験対象の状態 $\rho$ の関数となる状況を扱う. 未知パラメータ $\theta \in \Theta \subset \mathbb {R}^d$ でパラメトライズされた状態族 ${\cal S} \equiv \{ \rho_{\theta} \vert \theta \in \Theta \subset \mathbb {R}^d\}$ のパラメータ推定を問題にし,その一次漸近論を扱う. 状態 $\rho_\theta$ にある実験(測定)

を施したときのデータ $\omega$ の従う確率分布を ${\rm P}_\theta^M( \,{\rm d} \omega)$ , その分布による確率変数

の期待値を ${\rm E}_\theta^M(X)$ または ${\rm E}_\theta^M\, X$ と記す. また,実験

の集合を ${\cal M}$ と記す.

場合によっては,複数の実験を確率的に混合して用いることが有用である. このような戦略は ${\cal M}$ 上の確率分布 $\mu$ で記述される. 以下 ${\cal M}$ 上の確率分布全体の集合を $P({\cal M})$ で表し, $P({\cal M})$ の要素も実験という.混乱の恐れのあるときは ${\cal M}$ の要素を基本実験, $P({\cal M})$ の要素を混合実験とよんで区別する. 状態 $\rho_\theta$ に実験 $\mu\in P({\cal M})$ を施したときのデータ $\omega$ の従う確率分布 $\int_{\cal M} {\rm P}_\theta^M ( \,{\rm d} \omega) \mu (\,{\rm d} M)$ を ${\rm P}_\theta^\mu( \,{\rm d} \omega)$ と記す.

次に漸近理論を扱うために,実験回数

の適応的な実験のもとでの未知パラメータ $\theta$ の推定量を定式化する.

番目までの測定値 $\vec{\omega}_{k-1}\equiv (\omega_1, \ldots , \omega_{k-1})$ に依存して

番目の実験 $\mu_k(\vec{\omega}_{k-1})$ を選ぶ. このような実験の系列の決め方を ${\cal E}_n=\{\mu_k(\cdot)\}_{k=1}^n$ で,それによって得られるデータの系列 $\vec{\omega}_n$ の確率分布

${\rm P}_\theta^{\mu_1}(\,{\rm d} \omega_1 ) {\rm P}_\theta^{\mu_2(\vec{\omega}... ...mega_2 ) \cdots {\rm P}_\theta^{\mu_n(\vec{\omega}_{n-1})}(\,{\rm d} \omega_n )$ を

${\rm P}_\theta^{{\cal E}_n}(\,{\rm d} \vec{\omega}_n)$ で表す.

回同じ実験 $\mu$ を繰り返す戦略は $\mu\times n$ と書く. $\vec{\omega}_n$ から推定値 $T\in\mathbb {R}^d$ への関数を $T_n(\vec{\omega}_n)$ と表し,

回の実験に対する推定量を組 $({\cal E}_n,T_n)$ で定義する. そして,確率分布族 $\{ {\rm P}_\theta^\mu \vert \theta \in \Theta\}$ の Fisher 情報行列を $J_{i,j}^{\mu}(\theta)$ と略記する.

推定量の列 ${\cal E}\equiv \{({\cal E}_n,T_n)\}_{n=1}^{\infty}$ が以下の条件 (I)をみたすとき弱一致とよぶことにする.

$\displaystyle \beta ({\cal E}, \theta , \epsilon)$	$\displaystyle \equiv$	$\displaystyle \mathop{\varlimsup}_{n \to \infty}\frac{-1}{n}\log {\rm P}_{\theta}^{{\cal E}_n}\{ T_n \notin U_{\theta,\epsilon}\}$	(1)
$\displaystyle \alpha({\cal E}, \theta)$	$\displaystyle \equiv$	$\displaystyle \mathop{\varlimsup}_{\epsilon \downarrow 0}\frac{1}{\epsilon^2} \beta ({\cal E}, \theta , \epsilon).$	(2)

推定量の系列 ${\cal E}$ が弱一致性 (I)を持つならば以下の不等式(3)が成立し, 弱一致性 (I)に加えて条件 (II)～ (IV)を充たすなら以下の不等式(4)が成立する.

$\displaystyle \alpha({\cal E}, \theta_1)$	$\displaystyle \le$	$\displaystyle B^w(\theta_1) ,$	(3)
$\displaystyle {\alpha}({\cal E}, \theta_1 )$	$\displaystyle \le$	$\displaystyle B^s(\theta_1) .$	(4)

$\displaystyle B^w(\theta)$	$\displaystyle \equiv$	$\displaystyle \inf_{\Vert \xi \Vert =1 } \sup_{\mu \in P({\cal M})} \frac{1}{2} J_{i,j}^{\mu} (\theta) \xi^i \xi^j ,$
$\displaystyle B^s(\theta)$	$\displaystyle \equiv$	$\displaystyle \sup_{\mu \in P({\cal M})} \inf_{\Vert \xi \Vert =1} \frac{1}{2} J_{i,j}^{\mu} (\theta) \xi^i \xi^j .$

予稿の付録で示した通り,両者の限界は各々の意味で達成可能である. しかし, 直観的に自然な推定量の限界は $B^s(\theta)$ であると思われる.第1の理由は, $B^s(\theta)$ の導出に必要な(II)～(IV)の自然さである.第2に, $B^s(\theta)$ は確率分布族のBahadurの限界の最小化として特徴付けられる. 第3に, $B^s(\theta)$ を全ての点で一様に達成する推定量は構成できたが,本研究で構成した $B^w(\theta)$ を達成する推定量は, 一点でのみ良い効率を達成するに過ぎない.

さらに,全ての点で $B^w(\theta)$ を達成する推定量は存在しないと著者らは予測している.もしそれが正しければ, $B^s(\theta)$ が推定量の効率の本来の限界といえる. ただし,適応的実験計画でも未知パラメータが1次元ならば $B^s(\theta)=B^w(\theta)$ であるから, 未知パラメータが多次元であることがこの議論で本質的である.

2つのBahadur型の限界が一致するための必要十分条件を予稿の節3では求めた. 2つの限界の一致・不一致は座標系に依存するので, 特定の座標の下での一致, 任意の座標の下での一致, 両者が一致する座標が存在のための必要十分条件を全て導いた. 興味深いことに,線形の入出力関係という単純な例で,入力の制限を変えるだけで上記のすべてのケースが現れる. パラメータのとり方に依存しない距離を使って大偏差型の評価を行なう場合には, 両限界の一致・不一致は距離の定義に依存する. この流儀の議論での2つの限界の一致条件は本研究で導いた定理の自明な書換えで得られる.

確率分布の推定でモデルが非正則な場合や, 量子相関の利用を許した場合の量子推定では, パラメータが1次元であっても, ここで述べた意味での推定と検定のギャップが現れる. これらの場合,本研究で述べた適応的実験計画とは異なった事情が働いていおり, 全く別の議論が必要である.