こんにちは!ukacheeです!
現在統計検定1級に向けて絶賛勉強中なわけですが、1級は付け焼き刃な知識だと本当に太刀打ちできないので、統計の各種手法に対して真の理解が必要になると実感しています。
そこで、過去問を解きながら逐一その問題に解くのに必要な知識の説明を入れながら進めていこうと思います。
今回は2019年度の統計応用の社会科学(第3問)、理工学(第4問)で出題された時系列解析の問題の問1を元に解説して行きます。
2021年11月の1級が開催されるまでは、2019年の過去問を公式サイトから入手できるので、是非ダウンロードしてみてください!
大問の内容
【設問】
時系列データは \( (\ldots, X_{-1}, X_0, \ldots, X_n, \ldots)\) 1次の自己回帰(\(AR(1)\))モデル
\[ X_t = \phi X_{t-1} + \epsilon_t \tag{1} \]に従うとする。ここで\( \epsilon_t \)は互いに独立に\( N(0, \sigma^2) \)に従う確率変動項であり、定常性の条件\( |\phi | <1 \)を仮定する。 \( (X_0, \ldots, X_n) \) につき以下の各問に答えよ。
ARモデルの問題ですね。
ここで、なぜ定常性の条件が\( |\phi | <1 \)であるかを思い出してみましょう。
例えばもし\( \phi \)が2の時だとどうなるでしょうか。今回のモデル(1)の場合、\(X_t = 2 X_{t-1} + \epsilon \)となり、前の項よりほとんど2倍増加することになり、発散していくことがわかります。
発散しないようにする、つまり定常性を持つためには\( |\phi | <1 \)である必要があります。
ちなみに厳密な定常性の定義は「時間によらず期待値、自己共分散が一定である」という性質です。
数式で表すと、
任意の時間\( t \)と時間差\( j \)に対して、\[ E(X_t) = \mu \tag{2} \] \[ Cov(X_t, X_{t-j}) = \gamma_j \tag{3} \]
ここで、\( \mu, \gamma_j \)は定数を表し、
これら2つの条件を満たす時、その確率過程は定常性を持つと言えます。
逆に言えば、定常性を仮定するような問題ではこれらの性質を使用することができ、この後も使用します!!
問題1
【問1】
モデル(1)における\( (X_0, \ldots, X_n) \)の自己共分散行列 \( T={\tau_{ij}} \)の各成分は\[ \tau_{ij}=\frac{\sigma^2}{1-\phi^2}\phi^{|i-j|}\quad (i, j = 1,\ldots,n) \]で与えられ、自己相関行列は\( R = \{\rho_{ij}\} = \{\phi^{|i-j|}\} \)となることを示せ。
AR(1)の期待値と分散
復習もかねて、AR(1)モデルの期待値と分散を出してみましょう。
(1)式の両辺に期待値をとると、\[ E[X_t] = \phi E[X_{t-1}] + E[\epsilon_t] \]
ここで今回設問より定常性を仮定しているため、式(2)の性質を利用できます。
つまり、\( E[X_t] = E[X_{t-1}] (= \mu) \)であるので、これを代入すると、\[ E[X_t] = \frac{E[\epsilon_t]}{1-\phi}=0 \]が導出されます。
続いて分散です。
(1)式から\[ V(X_t) = \phi^2 V(X_{t-1}) + V(\epsilon_t) \]と変形できます。
定常性の仮定しているため(3)式を利用でき、時間差が0の時、\[ Cov(X_t, X_t) = Cov(X_{t-1},X_{t-1}) = \gamma_0 \]\[ V(X_t) = V(X_{t-1}) = \gamma_0 \]となります。
これを利用すると、\[ V(X_t) = \frac{\sigma^2}{1-\phi^2} \]
と示せます。
AR(1)の自己共分散と自己相関係数
では、本題にはいっていきましょう。
1次の自己共分散(式(3)で言えば、\(j=1\)の時)を求めてみましょう。\(\epsilon_t\)と\(X_t\)は独立であることと、共分散の性質\( Cov(aX, Y) = a Cov(X,Y)\)を利用すると
\[ Cov(X_t, X_{t-1}) = Cov(\phi X_{t-1} + \epsilon_t, X_{t-1}) = \phi Cov(X_{t-1}, X_{t-1})\]となります。
つまり、1次の自己共分散は分散の\( \phi \)倍であるとわかります。
これを一般に\( p \)次の場合では、\( Cov(X_t, X_{t-p}) = \phi^p V(X_t) \)となります。
今回の問題では、時間差は\( i-j\)で表現でき、\( i, j\)の大小はわからないため絶対値を使用すると、
\[ \tau_{ij} = Cov(X_i, X_j) = V(X_i) \phi^{|i-j|} = \frac{\sigma^2}{1-\phi^2}\phi^{|i-j|} \]と表現できる。
自己相関係数は、
\[ \rho_{ij} = \frac{Cov(X_i, X_j)}{\sqrt{V(X_i)}\sqrt{V(X_j)}} = \phi^{|i-j|} \]
となります。
問題2以降について
問2以降は時系列の問題というより、ほとんど行列の問題になります。
そのため、ここでは解説は控えさせていただきます。
まとめ
統計検定1級2019(統計応用)社会科学第3問(理工学第4問)の問1を丁寧に解説しました。
この問題は時系列解析の基本性質を押さえているいい問題なので、よく理解しておくと良いと思います!
コメント