Mean and medianEdit

生態学的誤謬の例として、個体の尤度を考えるとき、集団平均が単純な解釈であると仮定することである。

たとえば、ある集団の平均点がゼロより大きい場合、その集団のランダムな個人がマイナス点よりプラス点の可能性が高いことを意味しません(プラス点よりマイナス点が多い限り、個人がマイナス点を持つ可能性は高くなる)。 同様に、あるグループの人々の平均IQが一般集団より低いと測定された場合、そのグループの無作為に選ばれたメンバーが一般集団の平均IQより低いIQを持つ可能性が高い、と結論づけるのは誤りです。 数学的には、これは分布が正の平均を持ちながら負の中央値を持つことがあるという事実からきています。 この性質は、分布の歪度と関連している。

次の数値例を考えてみよう:

  • グループA:80%の人が40点、20%の人が95点を取った。 平均点は51点です。
  • グループB: 50%の人が45点、50%の人が55点でした。 平均点は50点。
  • AとBからランダムに2人を選ぶと、4つの結果が考えられる:
    • A – 40、B – 45(Bの勝ち、40%の確率 – 0.8 × 0.5)
    • A – 40, B – 55 (Bの勝ち、40%の確率 – 0.8 × 0.5)
    • A – 95, B – 45 (Aの勝ち、10%の確率 – 0.2 × 0.5)
    • A – 95, B – 55 (A win, 10%の確率 – 0. 0.5)2×0.5)
  • グループAの平均スコアは高いが、80%の確率でAのランダム個体はBのランダム個体より低いスコアを出す。

個人と集団の相関編集

エミール・デュルケイムにさかのぼる研究は、プロテスタント主体の地域はカトリック主体の地域より自殺率が高いことを示唆している。 Freedmanによれば、デュルケムの研究結果が、個人レベルで、宗教とその人の自殺のリスクとを結びつけているという考えは、生態学的誤謬の一例であるとのことである。 1051>

同様に、個人レベルでは、富が共和党に投票する傾向と正の相関があるとしても、富裕な州は民主党に投票する傾向があることが観察される。 例えば、2004年、共和党のジョージ・W・ブッシュ候補は最も貧しい15州を制し、民主党のジョン・ケリー候補は最も裕福な11州のうち9州を制した。 しかし、年収20万ドル以上の有権者の62%がブッシュに投票し、年収1万5000ドル以下の有権者の36%しかブッシュに投票していない。個人の豊かさをコントロールしても、投票選好が州の総資産に影響されれば、集計レベルの相関は個人レベルの相関と異なることになる。 もし、個人の富をコントロールしても、投票選好が州全体の富に影響されるなら、集合レベルの相関は個人レベルの相関とは異なるだろう。投票選好の真の原動力は自己認識された相対的富である可能性があり、自分が隣人よりも裕福だと思う人は共和党に投票する可能性が高いかもしれない。 この場合、ある個人は自分が豊かになれば共和党に投票する可能性が高くなるが、隣人の富が増えれば(その結果、より豊かな状態になれば)民主党に投票する可能性が高くなるのであろう。

しかし、州レベルと個人レベルの富に基づく投票習慣の観察された違いは、上述したように、高い平均と高い可能性の間の一般的な混乱によって説明することも可能である。 州は、より多くの裕福な人々(すなわち、年間所得20万ドル以上のより多くの人々)を含むので裕福であるのではなく、むしろ少数の超富裕層を含むので、生態的誤謬は、裕福な州の個人がより裕福である傾向があると誤って仮定することに起因しています。

ロビンソンのパラドックス編集

ウィリアム・S・ロビンソンは1930年の国勢調査で、各州とコロンビア特別区の非識字率と米国外で生まれた人口の比率を計算した1950年の論文である。 つまり、移民の比率が高い州ほど、平均的な識字率は低くなることが示された。 しかし、個人を対象とすると、その相関は+0.12であった(移民は平均して先住民よりも非識字率が高い)。 ロビンソンは、州の人口レベルで負の相関があるのは、移民が先住民の識字率が高い州に定住する傾向があるためであることを示した。 彼は、集団レベル、つまり「生態学的」なデータに基づいて、個人に関する結論を推論することに注意を促している。 2011年、Robinsonが算出した生態学的相関は、誤った州レベルのデータに基づいていることが判明した。 上記の-0.53という相関は、実際には-0.46である。 ロビンソンの論文は画期的だったが、「生態学的誤謬」という言葉ができたのは1958年のセルヴィンの論文からである。

形式的問題編集

集計量の相関(あるいは生態学的相関)は個別量の相関と等しくはない。 個人レベルの2つの量をXi, Yiとする。 大きさNのグループにおける集合量の共分散の式は

cov ( ∑ i = 1 N Y i , ∑ i = 1 N X i ) = ∑ i = 1 N cov ( Y i , X i ) + ∑ i = 1 N ∑ l ≠ i cov ( Y l , X i ) {\displaystyle \operatorname {cov} left(\sum _{i=1}^{N} Y_{i},\sum _{i=1}^{N} X_{i}right)=THUM _{i=1}^{N} OPERATORNAME {cov} (Y_{i},X_{i})+sum _{i=1}^{N}sum _{l}neq i}operatorname {cov} (Y_{l},X_{i})}.

集計された2つの変数の共分散は、同じ個体内の2つの変数の共分散だけでなく、異なる個体間の変数の共分散にも依存します。 言い換えれば、集計された変数の相関は、個人レベルでは関係ない横断的な効果を考慮する。

相関の問題は、当然、集計された変数の回帰の問題を伴う:したがって、相関の誤りは、因果関係の影響を測定したい研究者にとっては重要な問題である。 結果Y i {displaystyle Y_{i}}が存在する回帰モデルから始めます。

はX i {displaystyle X_{i}}によって影響される。

Y i = α + β X i + u i , {displaystyle Y_{i}=alpha +beta X_{i}+u_{i},}

cov = 0. {displaystyle \operatorname {cov} =0.} } } {Displaystyle {Displaystyle} {U_{i}+U_{i}, {Displaystyle {U_{i}+U_{i}, {Displaystyle {U_{i}+U}, {Displaystyle {U_{i

集計レベルの回帰モデルは、個々の式を合計することで得られる。

∑ i = 1 N Y i = 1 N X i + β ∑ i = 1 N u i , {displaystyle \sum _{i=1}^{N}Y_{i}=alpha \cdot N+thebeta \sum _{i=1}^{N}X_{i}+thenu_{i} ,}

cov=0となります。 {displaystyle \operatorname {cov} ¢left}neq 0.}.

集計レベルでは、リグレッサーと誤差が相関することを防ぐことはできません。 したがって、一般に、集計データで回帰を実行しても、個別データで回帰を実行した場合と同じモデルは推定されない。

The aggregate model is correct if and only if

cov = 0 for all i . {displaystyle \operatorname {cov} \left=0quad {text{ for all }}i.}} .

これは、X iを制御すると{displaystyle X_{i}} …

, ∑ k = 1 N X k {displaystyle \sum _{k=1}^{N}X_{k}}}.

は、Y i {displaystyle Y_{i}} を決定しない。

.

集計と個人推論の選択Edit

集計モデルに興味があれば、集計データで回帰を行うことは何も問題ない。 例えば、ある州の知事の場合、警察力の増加の政策的含意に興味があれば、州レベルでの警察力と犯罪率の回帰を行うことは正しいことです。 しかし、市議会が州レベルの相関から市レベルの犯罪率に警察力増強の影響を推論すると、生態学的誤謬が生じる。

ある政策に対する集合的影響を理解するために、集合回帰か個別回帰かを選択することは、以下のトレードオフに依存する。 研究者の中には、生態学的相関は公共政策行動の結果についてより良いイメージを与えるので、この目的では個人レベルの相関よりも生態学的相関を推奨する者もいる(Lubinski & Humphreys, 1996)。 他の研究者は、特にレベル間の関係が明確にモデル化されていない場合には、これに反対する。 生態学的誤謬を防ぐために、個人データを持たない研究者は、まず個人レベルで何が起こっているかをモデル化し、次に個人レベルとグループレベルがどのように関連しているかをモデル化し、最後にグループレベルで起こっていることが関係の理解にプラスになるかどうかを検討することができる。 例えば、州の政策の影響を評価する場合、政策の影響は政策そのものよりも州によってあまり差がなく、生態学的相関が高いにもかかわらず、政策の違いが結果にうまく反映されないことを示唆していることを知ることは有用である(Rose, 1973)

コメントを残す

メールアドレスが公開されることはありません。