自己相関のある時系列データの分散

読んだ。

Introductory Time Series with R (Use R!)

Introductory Time Series with R (Use R!)

  • 作者: Paul S.P. Cowpertwait,Andrew V. Metcalfe
  • 出版社/メーカー: Springer
  • 発売日: 2009/06/09
  • メディア: ペーパーバック
  • 購入: 2人 クリック: 2回
  • この商品を含むブログを見る
AR, MA, ARIMA, ARCH, 状態空間モデル、回帰分析などひと通り網羅している。
 
自己相関があるときの時系列データを何も考えずに解析すると、誤差を過小評価するため信頼区間が狭くなりすぎる傾向にあるため、有意な結果を導きやすいから注意しましょう、という話をちゃんと式で書いてあったので写経する。
 
時系列データ\{x_t:t=1,\dots,n\}に対してE(x)=\mu, Var(x)=\sigma^2/n である。ラグk で自己相関があるとするとCor(x_t, x_{t+k})=\rho_k である。k=0 つまり\rho_k は自分との相関なので\rho_k=1 である。
自己相関があるときの分散は
\begin{align}Var(x)&=Var[\frac{x_1+\dots+x_n}{n}]\\&=Var(x_1+\dots+x_n)/n^2\\&=Cov(\sum_{i=1}^n x_i, \sum_{j=1}^n x_j)/n^2\\&=\frac{1}{n^2}\sum_{i=1}^n\sum_{j=1}^n Cov(x_i, x_j)\\&=\frac{1}{n^2}\begin{bmatrix}\rho_{0}\sigma^2+\rho_{1}\sigma^2+\dots+\rho_{n-2}\sigma^2+\rho_{n-1}\sigma^2+\\\rho_{1}\sigma^2+\rho_{0}\sigma^2+\dots+\rho_{n-3}\sigma^2+\rho_{n-2}\sigma^2+\\\vdots\\\rho_{n-2}\sigma^2+\rho_{n-3}\sigma^2+\dots+\rho_{2}\sigma^2+\rho_{1}\sigma^2+\\\rho_{n-1}\sigma^2+\rho_{n-2}\sigma^2+\dots+\rho_{1}\sigma^2+\rho_{0}\sigma^2\end{bmatrix}\\&=\frac{1}{n^2}\left[1+2\sum_{k=1}^{n-1}(1-\frac{k}{n})\rho_k\right]\end{align}
となり、\left[1+2\sum_{k=1}^{n-1}(1-\frac{k}{n})\rho_k\right] だけ自己相関のない場合より分散が大きい。
自己相関があるのに、自己相関がないとして計算すると、この分だけ分散を過小評価するから、信頼区間は本来の広さより狭めにでる、つまり見かけ上、正確だったり検定して有意になりがちになるので注意しましょう。