読書メモ:Wei and Xie (2025)
要約
世代間移動は、20世紀半ば以来、社会学および人口学の核心的なテーマ。世代間移動研究の重要な研究課題に移動効果、すなわち移動が個人に与える影響に関心が当てられてきた。
- 例:移動は心理的なペナルティを引き起こす(解離仮説)
しかし、個人レベルの移動効果には、出身階層–到達階層–移動の間の数学的依存性に関連する識別可能性の限界がある。
- 例:親を大卒、子を大卒と操作すると、必然的に非移動という状態が導かれる
本研究は、分析のレベルを個人から社会へ移行させることで、移動効果の研究を再概念化する。社会レベルでは、出発地と到達地の周辺分布が固定されていても、移動は依然として操作可能である。本研究は処置が再割り当てされる反実仮想シナリオを作成する「因果的介入」というアプローチを導入する。具体的には、反実仮想的な移動表を因果的介入として用い、移動レジームを操作したときのアウトカムの分布の変化を研究する。
- 個人レベルのアプローチは「出身階層と到達階層を一定に保ったまま、ある個人の移動状態を変更したとき何が起こるのか」と問うのにたいし、社会レベルの移動効果は「新たな移動スキームにしたがって個人を特定の到達階層へ割り当てた場合、個人には何が起こるか?」と問う。
SMEは、識別問題への対応としてだけでなく、機会均等化を目的としたアファーマティブ・アクションなどの政策介入への高まる要求に応えるものである。SMEは、既存の政策評価ツール(IV、MTE、PRTE)では考慮されない、「個人を特定の到達階層へ誘導すると同時に、そこから排除する」ような介入を考慮することで、このギャップを埋める。
SME:エスティマンド、識別、推定
エスティマンドの設定
SMEは、移動介入が結果の人口分布に与える効果である。「移動介入」とは、移動レジームの仮想的な操作を指し、研究目的である仮想の移動表(マクロ要素)と、介入後の個人が処置を受ける傾向スコアの計算(ミクロ要素)の二つから構成される。
SMEのもっとも基本的なエスティマンドは移動レジームへの介入後の結果\(Y^\phi\)と実際の結果\(Y\)の差である1:
\[ SME = E [ Y^\psi - Y] \]
特定の出身階層\(O\)における介入効果は以下のように表現する:
\[ SME(O) = E [ Y^\psi - Y \mid O] \]
分散やジニ係数など、より広範な分布的効果についても計算できる。ここで\(\mathcal{v}()\)はジニ係数やタイル尺度などの特定の計算方法を、\(f_{Y}(Y)\)は\(Y\)の確率密度関数をそれぞれ指す:
\[ SME^* = \mathcal{v} \left(f_{Y^\psi}(Y^\psi) \right) - \mathcal{v} \left(f_{Y}(Y) \right) \]
移動レジームへの介入の定義
本研究ではカテゴリカルな地位、および相対移動にのみ焦点を当てている。移動レジームとなる反実仮想的な移動表は、周辺分布を固定し、オッズ比を操作することによって生成される。生成方法として、(1)あらかじめ定められた移動レジームに変換する理論モデル(例:ログリニアモデルにおいて関連項 (\(\lambda_{o,d}\)) を除去し、完全な流動性=出身階層と到達階層の無相関を推定する)を用いる方法と(2) 反復比例フィッティング (IPF) アルゴリズムを用いて、比較するレジームのオッズ比を抽出・挿入する「比較ケース」アプローチがある。
個人レベルでは、出身階層を条件づけて、到達階層とその他の共変量との関連が介入によって影響を受けない(周辺分布は普遍)という再分配ルールを提案する。既存のメカニズムが維持される最大維持不平等(MMI)仮説を反映している。数式で表現すると以下のようになる:
\[ \frac{P^\psi (d \mid x, o)}{P^\psi (d^\prime \mid x, o)} / \frac{P^\psi (d \mid x^\prime, o)}{P^\psi (d^\prime \mid x^\prime, o)} = \frac{P (d \mid x, o)}{P (d^\prime \mid x, o)} / \frac{P (d \mid x^\prime, o)}{P (d^\prime \mid x^\prime, o)} \]
| 表記 | 意味 | 補足説明 |
|---|---|---|
| \(P\) | 観察された確率(Probability) | 介入前の確率分布を示す。 |
| \(P^\psi\) | 介入後の確率(Post-intervention Probability) | 移動介入 (\(\psi\)) が行われた後の確率分布を示す。 |
| \(d\) | 到達階層(Destination) | 処置(treatment)を指す。 |
| \(d^\prime\) | 到達階層(Destination)の別のカテゴリ | \(D\) の取りうる値のうち、\(d\) とは異なる別のカテゴリを指す。 |
| \(x\) | 共変量(Covariate)の特定の状態 | 出身階層 \(O\) 以外の共変量(例:SATスコアや潜在能力)を指す。 |
| \(x^\prime\) | 共変量(Covariate)の別の状態 | \(X\) の取りうる値のうち、\(x\) とは異なる別の状態を指す。 |
| \(o\) | 出身階層(Social Origin) | 親の重要な社会的特徴(例:親の学歴、社会階層)を指す。 |
| \(\mid\) | 条件付き確率(Conditional Probability) | 縦線記号の後に続く変数によって条件付けられた確率を示す。 |
| \(P^\psi (d \mid x, o)\) | 起源 \(o\) と共変量 \(x\) の条件の下で、介入後に到達地 \(d\) を受ける確率(介入後の傾向スコア (PIPS) の構成要素)。 | |
| \(/\) | 割り算、またはオッズ比の比較 | 数式内の分数で示されるオッズを比較している。 |
介入効果は処置オッズ\(\delta^{d, d^\prime \mid o}\)として表現できる。
\[ \frac{P^\psi (d \mid x, o)}{P^\psi (d^\prime \mid x, o)} = \delta^{d, d^\prime \mid o}\frac{P (d \mid x, o)}{P (d^\prime \mid x, o)} \]
\[ \delta^{d, d^\prime \mid o} = \frac{P^\psi (d \mid o)}{P^\psi (d^\prime \mid o)} / \frac{P (d \mid o)}{P (d^\prime \mid o)} \]
ここから、個々人の介入後の傾向スコアが得られる。介入後の傾向スコアはもともと傾向スコアの高い(低い)者にはそこまで効果をもたらさず、真ん中のもので最も大きいとする非線形効果をうまく反映できている。
\[ P^\psi (d \mid x, o) = \frac{\delta^{d, d^\prime \mid o} P(d \mid x, o)}{\sum^D \delta^{d, d^\prime \mid o} P(d \mid x, o)} \]
識別
無視可能性(潜在アウトカムが処置前の共変量\(L\)を条件として処置から独立している)とSUTVA(潜在アウトカムがその人自身の処置によってのみ定義され、他の人々の処置や移動レジームに影響されない)の仮定を必要とする。それぞれ以下のように仮定される。
\[ \text{無視可能性}: Y(d) \perp\! D \mid L \]
\[ \text{SUTVA}: Y(d) = Y(d^{\prime}) \]
以上の仮定のもと、SMEは共変量\(L\)の各層\(l\)におけるCATEの重み付き和として表現できる。
\[ SME = \int \sum_D (P(D^\psi = d \mid l) - P(D = d \mid l)) \tau_{d,1}(l) dP(l) \]
| 表記 | 意味 |
|---|---|
| \(\mathbf{SME}\) | 社会移動効果 (Social Mobility Effect) の平均値。移動介入が結果の人口分布に与える効果の期待値 \(\mathbf{E[Y^\psi - Y]}\) である。 |
| \(\mathbf{\int dP(l)}\) | 共変量 \(L\) の分布 \(P(L)\) 全体での積分(平均値の計算)を意味する。 |
| \(\mathbf{\sum_D}\) | 到達地(処置)\(D\) の全てのカテゴリ \(d\) についての合計を意味する。 |
| \(\mathbf{l}\) | すべての共変量 \(L\)(社会的起源 \(O\) とその他の共変量 \(X\) の和集合)の特定の状態を指す。 |
| \(\mathbf{D}\) | 到達地(Destination)または処置(Treatment)を指す。ここでは多項処置(複数のカテゴリ)として扱われる。 |
| \(\mathbf{d}\) | 到達地(処置)\(D\) の特定のカテゴリを指す。 |
| \(\mathbf{D^\psi}\) | 介入後の到達地(処置) を指す。 |
| \(\mathbf{P(D^\psi = d \mid l)}\) | 共変量 \(L\) が \(l\) である条件の下で、介入後に到達地 \(d\) となる確率を指す。 |
| \(\mathbf{P(D = d \mid l)}\) | 共変量 \(L\) が \(l\) である条件の下で、観察された到達地 \(d\) となる確率(観察された傾向スコア \(P(D \mid L)\))を指す。 |
| \(\mathbf{\tau_{d,1}(l)}\) | 条件付き平均処置効果 (CATE) を指す。ベースライングループ(\(d=1\))に対するカテゴリ \(d\) の処置効果(\(\tau_{d,1} = Y(d) - Y(1)\))であり、共変量 \(l\) を条件とする。 |
移動レジームへの介入によって処置の割り当てが変更された集団(シフト分)に限定してCATEを測定し、その平均を全体で取っている、と解釈できる。これは、個人が処置を割り当てられる可能性の変化が、その層における処置効果の異質性(CATE)と結びついた結果を社会レベルで集計していることを示している。これは、川の流れを変える(移動体制を操作する)と、その流れが変わった場所(傾向スコアがシフトした層)で、川の深さ(CATE)に応じた影響が全体に及ぶ、というイメージ。
推定
観察された傾向スコア \(P(D|L)\) と観察された条件付き期待値 \(E[Y|D, L]\) をOLSやロジスティック回帰、Lassoやランダムフォレストなどのアルゴリズムから推定する。
ほかの手法との関係
割愛。以下はNotebookLMの文章。
SMEとLATEおよびCATEとの関係
SMEは局所平均処置効果(LATE)と関連しており、SMEは、コンプライア―(介入によって処置を受ける人々)間のLATEと、デファイア―(介入によって処置から外れる人々)間のLATEとの加重平均差として表現される。SMEは、処置の総数が固定されている、より現実的な政策介入の結果をターゲットとする。
SMEは、単純な介入(全員を特定のステータスに割り当てるなど)の下では、OとDによって定義される条件付き平均処置効果(CATE)と等価であり、これらのCATEは、個人レベルでの上方または下方移動効果として解釈できる。
我々の提案する介入(処置の総数を制御し、介入前の傾向を考慮に入れるもの)は、従来の個人レベルの因果的推定値よりも多様で現実的な政策を模倣できるため、政策評価において有利である。
識別の仮定違反に対する救済策
識別仮定が侵害された場合(未観測の交絡因子による不可知性違反や、介入によるシステム不変性の侵害であるSUTVA違反)には、SMEの識別は困難になる。
感度分析は、不可知性の違反によって生じるバイアスを理解するのに役立つ。
限界介入効果は、移動性がごくわずかに増加する効果を定量化するもので、介入がシステムを乱す可能性が低いため、SUTVA違反への懸念を軽減するのに役立つ。
実証研究への応用:出生率と所得不平等
応用例1:平均出生率に関するSME
GSSデータ(1972–2018)を用いて、社会移動が出生率に与える影響を分析した。介入シナリオとして父親と息子の階層の無相関を選択した。完全な無相関を課す極端な介入でも、全体効果はわずかに負で非有意であり、平均出生率に対する影響は無視できるほど小さいことが示唆された。
ただし、この効果はgainer(介入による受益者)の負の効果とgiver(介入によって不利益を被った者)の正の効果が打ち消し合った結果といえる。
この介入により、父の教育や自身の教育による出生率のグループ間の格差は穏やかに減少した。
応用例2:所得格差に関するSME
PSIDデータ(2009–2019年の労働所得)を用いて、社会非移動が所得格差に与える影響を検証した。
全体的な平均所得に対するSMEは無視できるほど小さかったが、低学歴の出身者の所得は有意に増加し、高学歴の出身者の所得は有意に減少した。
所得分散全体への影響は、varianceとGini係数、90/10比率の減少は非有意であったものの、80/20比率は介入によって有意に減少した2。
- 介入の強度はほとんど結果に影響しない。
議論と結論
本研究は、識別不可能な個人レベルの移動効果から、社会レベルの社会移動の結果へと焦点を移すことを提案した。完全な移動介入は出生率への影響はほとんどなく、所得格差への影響は結論が出ていないものの、出生率と所得のグループ間の格差は有意に減少することがわかった。因果的解釈が誤っている場合でも、この推定手順は、社会的固定化に起因する人口結果分布の記述的な分解など、価値のある記述的推定値を提供する。本研究は、明確に定義され、古典的な社会学理論と密接に連携する社会レベルの移動効果にさらなる注意を払うよう求めている。