空間的自己相関 (くうかんてきじこそうかん、英語: spatial autocorrelation )とは、空間的な意味での自己相関 のことである。ある地域における事象が、周辺の他の地域における事象の影響を受けて相互作用が発生する場合、空間的自己相関があるという。
空間的自己相関は、計量地理学 において重要な課題の1つである。
指標
空間的自己相関の指標では、グローバルな[ 注釈 1] ものとローカルなものの2種類がある。グローバルな指標は、分析対象地域全体の一般性の探求のために用いられる。地理学ではモランのI統計量 (英語版 ) とゲイリーのC統計量 (英語版 ) がよく用いられる。一方、ローカルな指標は、分析対象地域における局所的なクラスターの抽出などに用いることができる。
モランのI統計量
モランのI統計量 は、Moran (1948) により提案され、Cliff and Ord (1981) により改良された統計量である。この統計量では、空間的自己共分散を標準化している。モランのI統計量は、式(1 )で表される。
I
=
n
W
∑ ∑ -->
i
=
1
n
∑ ∑ -->
j
=
1
n
w
i
j
(
x
i
− − -->
x
¯ ¯ -->
)
(
x
j
− − -->
x
¯ ¯ -->
)
∑ ∑ -->
i
=
1
n
(
x
i
− − -->
x
¯ ¯ -->
)
2
{\displaystyle I={\frac {n}{W}}{\frac {\sum _{i=1}^{n}\sum _{j=1}^{n}w_{ij}(x_{i}-{\bar {x}})(x_{j}-{\bar {x}})}{\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}}}
(1)
なお、
n
{\displaystyle n}
は小区域数、
x
i
{\displaystyle x_{i}}
は区域
i
{\displaystyle i}
の属性値、
x
¯ ¯ -->
{\displaystyle {\bar {x}}}
は平均、
w
i
j
{\displaystyle w_{ij}}
は重み係数[ 注釈 2] であり、
W
=
∑ ∑ -->
i
=
1
n
∑ ∑ -->
j
=
1
n
w
i
j
{\displaystyle W=\sum _{i=1}^{n}\sum _{j=1}^{n}w_{ij}}
とする。
モランのI統計量を用いることで、ある属性の凝集の程度を知ることができる。ここで
I
>
0
{\displaystyle I>0}
のとき、
I
{\displaystyle I}
がより大きくなるほど、隣接する小区域と属性が似通うことになるため、面フィーチャ分布は凝集型となっていく。逆に、
I
<
0
{\displaystyle I<0}
のときは、
I
{\displaystyle I}
がより小さくなるほど、隣接する小区域と属性が相異なることになるため、面フィーチャ分布は均等型となっていく。
I
≈ ≈ -->
0
{\displaystyle I\approx 0}
のときは、それぞれの小区域の属性は他の小区域とは関係がなく、面フィーチャ分布は完全ランダム型となっていく。
ゲイリーのC統計量
ゲイリーのC統計量 は、Geary (1954) により提唱された統計量である。式(2 )で表される。
c
=
n
− − -->
1
2
W
∑ ∑ -->
i
=
1
n
∑ ∑ -->
j
=
1
n
w
i
j
(
x
i
− − -->
x
j
)
2
∑ ∑ -->
i
=
1
n
(
x
i
− − -->
x
¯ ¯ -->
)
2
{\displaystyle c={\frac {n-1}{2W}}{\frac {\sum _{i=1}^{n}\sum _{j=1}^{n}w_{ij}{(x_{i}-x_{j})}^{2}}{\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}}}
(2)
ここで
c
<
1
{\displaystyle c<1}
のときは
x
i
{\displaystyle x_{i}}
は正の空間的自己相関をもち、
c
=
1
{\displaystyle c=1}
のときは
x
i
{\displaystyle x_{i}}
はランダムに分布し、
c
>
1
{\displaystyle c>1}
のときは
x
i
{\displaystyle x_{i}}
は負の空間的自己相関をもつ。
ローカルな空間的自己相関測度
Getis and Ord (1992) により提唱された測度であり、式(3 )・式(4 )で表される。
G
i
{\displaystyle G_{i}}
は、
x
j
{\displaystyle x_{j}}
に
x
i
{\displaystyle x_{i}}
が含まれない場合であるが、
G
i
∗ ∗ -->
{\displaystyle G_{i}^{*}}
では、
x
j
{\displaystyle x_{j}}
に
x
i
{\displaystyle x_{i}}
も含まれる。
G
i
=
∑ ∑ -->
j
=
1
n
w
i
j
x
j
∑ ∑ -->
j
=
1
n
x
j
{\displaystyle G_{i}={\frac {\sum _{j=1}^{n}w_{ij}x_{j}}{\sum _{j=1}^{n}x_{j}}}}
ただし
j
≠ ≠ -->
i
{\displaystyle j\neq i}
(3)
G
i
∗ ∗ -->
=
∑ ∑ -->
j
=
1
n
w
i
j
x
j
∑ ∑ -->
j
=
1
n
x
j
{\displaystyle G_{i}^{*}={\frac {\sum _{j=1}^{n}w_{ij}x_{j}}{\sum _{j=1}^{n}x_{j}}}}
(4)
ここで
w
i
j
{\displaystyle w_{ij}}
は区域
i
{\displaystyle i}
と区域
j
{\displaystyle j}
の区域間結合の強さを意味し、距離逓減関数で求められることが多い。
ローカル・モラン統計量
ローカル・モラン統計量 は、近接する地区
i
{\displaystyle i}
、地区
j
{\displaystyle j}
における属性値
x
i
{\displaystyle x_{i}}
、
x
j
{\displaystyle x_{j}}
を利用して
x
{\displaystyle x}
の空間的自己相関を評価するための指標である。Anselin (1995) により提唱された統計量であり、モランのI統計量のローカル統計量バージョンにあたる。ローカル・モラン統計量
I
i
{\displaystyle I_{i}}
は、式(5 )で表される。
I
i
=
(
x
i
− − -->
x
¯ ¯ -->
)
∑ ∑ -->
j
=
1
n
w
i
j
(
x
j
− − -->
x
¯ ¯ -->
)
{\displaystyle I_{i}={(x_{i}-{\bar {x}})}\sum _{j=1}^{n}w_{ij}{(x_{j}-{\bar {x}})}}
(5)
ローカル・モラン統計量は、地理的事象の詳細な分布を厳密に捉える手段として利用することができる。
このほか、ローカル・モラン統計量を拡張させたものとして、2変量ローカル・モラン統計量 がある。これは、2変量
x
{\displaystyle x}
・
y
{\displaystyle y}
について、
x
i
{\displaystyle x_{i}}
と
y
j
{\displaystyle y_{j}}
の空間的自己相関を評価するための指標となり、式(6 )で求められる。
I
x
y
i
=
z
x
i
∑ ∑ -->
j
=
1
n
w
i
j
z
y
j
{\displaystyle I_{xy}^{i}=z_{x}^{i}\sum _{j=1}^{n}w_{ij}z_{y}^{j}}
(6)
ただし、
z
x
i
{\displaystyle z_{x}^{i}}
・
z
y
j
{\displaystyle z_{y}^{j}}
は
x
i
{\displaystyle x_{i}}
・
y
j
{\displaystyle y_{j}}
を標準化させた後の値、
w
i
j
{\displaystyle w_{ij}}
は2区域
i
{\displaystyle i}
・
j
{\displaystyle j}
の地域間結合の強さを示す値である。
ローカル・ゲーリー統計量
ローカル・ゲーリー統計量 は、Anselin (1995) により提唱された統計量であり、ゲーリーのC統計量のローカル統計量バージョンにあたる。ローカル・ゲーリー統計量
c
i
{\displaystyle c_{i}}
は、式(7 )で表される。
c
i
=
∑ ∑ -->
j
=
1
n
w
i
j
(
x
i
− − -->
x
j
)
2
{\displaystyle c_{i}=\sum _{j=1}^{n}w_{ij}{(x_{i}-x_{j})}^{2}}
(7)
検定
空間的自己相関の有無の判定においては、仮説検定 を行うと良い。空間的自己相関が存在しないという帰無仮説を立て、帰無仮説を棄却することで空間的自己相関が存在すると判定することになる。
モランのI統計量を用いて空間的自己相関の有無を判定するときの検定統計量 は、式(8 )で表される。なお、
E
-->
(
I
)
{\displaystyle \operatorname {E} (I)}
は
I
{\displaystyle I}
の期待値 、
Var
-->
(
I
)
{\displaystyle \operatorname {Var} (I)}
は
I
{\displaystyle I}
の分散 である。
z
=
I
− − -->
E
-->
(
I
)
Var
-->
(
I
)
{\displaystyle z={\frac {I-\operatorname {E} (I)}{\sqrt {\operatorname {Var} (I)}}}}
(8)
ゲイリーのC統計量の場合は、検定統計量は式(9 )で表される。
z
=
c
− − -->
E
-->
(
c
)
Var
-->
(
c
)
{\displaystyle z={\frac {c-\operatorname {E} (c)}{\sqrt {\operatorname {Var} (c)}}}}
(9)
ローカルな空間的自己相関測度で、仮説検定を行うときの標準化変量は、式(10 )・式(11 )で表される。
Z
-->
(
G
i
)
=
G
i
− − -->
E
-->
(
G
i
)
Var
-->
(
G
i
)
{\displaystyle \operatorname {Z} (G_{i})={\frac {G_{i}-\operatorname {E} (G_{i})}{\sqrt {\operatorname {Var} (G_{i})}}}}
(10)
Z
-->
(
G
i
∗ ∗ -->
)
=
G
i
− − -->
E
-->
(
G
i
∗ ∗ -->
)
Var
-->
(
G
i
∗ ∗ -->
)
{\displaystyle \operatorname {Z} (G_{i}^{*})={\frac {G_{i}-\operatorname {E} (G_{i}^{*})}{\sqrt {\operatorname {Var} (G_{i}^{*})}}}}
(11)
研究史
空間的自己相関は、当初は空間データにおける統計分析を行ううえでの前提条件を満たしているかどうかの確認方法として用いられていた。空間データについて統計分析を行う場合、距離減衰効果により近隣の個体標本間での相互作用の影響を受ける特徴をもつため、観測地間での独立性の前提が成立しないという問題があり、例えば回帰分析 を行うときの残差で、絶対値が大きい値が集中する傾向にあった。これらは最小二乗推定値に悪影響を及ぼすため、非ランダム性の存在を表す指標を考案することで、空間的自己相関の影響を除去し、悪影響を回避することを試みていた。当時は空間的自己相関についてネガティブなイメージが強かったといえる。
一方、Cliff and Ord (1973) の刊行後は、空間的自己相関は地理学の研究課題として重視されるようになった。空間パターンが形成される原因としての空間的自己相関の影響や、空間的自己相関が空間パターンの構造や形成プロセスなどの分析で利用できることが明らかになっていった。空間パターンの説明変数としての重要性が認識されるようになり、ポジティブなイメージに変化していった。
ここまではグローバルな空間的自己相関の研究が行われていたが、Getis and Ord (1992) 以降、ローカルな空間的自己相関の研究が進行するようになった。
脚注
注釈
^ 計量地理学においては「グローバル」は分析対象地域全体を、「ローカル」は分析対象地域の一部分をさす用語である。
^ 重み係数 は主に、二進的重み係数と一般化重み係数の2つがある。二進的重み係数 は、区域
i
{\displaystyle i}
と区域
j
{\displaystyle j}
が接しているか否かで判定され、接している場合は
w
i
j
=
1
{\displaystyle w_{ij}=1}
、接していない場合は
w
i
j
=
0
{\displaystyle w_{ij}=0}
となる。一般化重み係数 は、区域間距離
d
i
j
{\displaystyle d_{ij}}
と、区域同士の共有する境界線の長さ
l
i
j
{\displaystyle l_{ij}}
を用いて2区域間の相互作用を表すもので、
w
i
j
=
l
i
j
∑ ∑ -->
j
∈ ∈ -->
J
l
i
j
1
d
i
j
{\displaystyle w_{ij}={\frac {l_{ij}}{\sum _{j\in J}l_{ij}}}{\frac {1}{d_{ij}}}}
で表される(ただし
J
{\displaystyle J}
は区域
i
{\displaystyle i}
と接する区域の集合)。
出典
参考文献
Anselin, L. (1995). “Local indicators of spatial association: LISA”. Geographical Analysis 27 : 459-476. doi :10.1111/j.1538-4632.1995.tb00338.x .
Cliff, A.D.; Ord, J.K. (1973). Spatial Autocorrelation . Pion
Cliff, A.D.; Ord, J.K. (1981). Spatial Processes: Models and Applications . Pion
Geary, R.C. (1954). “The Contiguity Ratio and Statistical Mapping”. The Incorporated Statistician 5 : 115-141. doi :10.2307/2986645 .
Getis, A.; Ord, J.K. (1992). “The analysis of spatial association by use of distance statistics”. geographical Analysis 24 : 189-206. doi :10.1111/j.1538-4632.1992.tb00261.x .
Moran, P.A.P. (1948). “The interpretation of statistical maps”. Journal of the Royal, Statistical Society B.10 : 243-251. doi :10.1111/j.2517-6161.1948.tb00012.x .
奥野隆史 「空間的自己相関論(I) ―測度と検定について―」『人文地理学研究』第5巻、1981年、165-182頁、hdl :2241/00155206 。
奥野隆史「計量地理学の新しい潮流―主としてローカルモデルについて―」『地理学評論』第74巻第8号、2001年、431-451頁、doi :10.4157/grj1984a.74.8_431 。
小泉諒「東京大都市圏における職業構成の空間的パターンとその変化」『季刊地理学』第62巻第2号、2010年、61-70頁、doi :10.5190/tga.62.61 。
田中和子「空間的自己相関研究の展望とパターン検定の改良」『地理学評論』第55巻第5号、1982年、313-333頁、doi :10.4157/grj.55.313 。
田中和子 著「グローバル・ローカルモデル」、人文地理学会 編『人文地理学事典』丸善出版、2013年、204-205頁。ISBN 978-4-621-08687-2 。
張長平 「空間データ基盤を用いた不整形な小区域データの空間分析ツール開発」『地理学評論』第72巻第3号、1999年、166-177頁、doi :10.4157/grj1984a.72.3_166 。
張長平「空間データ分析と地理情報システム」『地学雑誌』第109巻第1号、2000年、1-9頁、doi :10.5026/jgeography.109.1 。
張長平『増補版 地理情報システムを用いた空間データ分析』古今書院、2009年。ISBN 978-4-7722-3124-4 。
張長平『都市の空間データ分析』古今書院、2010年。ISBN 978-4-7722-5249-2 。
丸山祐造 著「空間統計学入門」、村山祐司 、柴崎亮介 編『GISの理論』朝倉書店〈シリーズGIS〉、2008年、85-101頁。ISBN 978-4-254-16831-0 。
宮澤仁「関東地方における介護保険サービスの地域的偏在と事業者参入の関係」『地理学評論』第76巻第2号、2003年、59-80頁、doi :10.4157/grj.76.59 。
森田匡俊、奥貫圭一、塩出志乃「老年人口密度を考慮した高齢化率の空間的分布パターンの把握に関する研究」『地理学評論』第85巻第6号、2012年、608-617頁、doi :10.4157/grj.85.608 。