コンテンツにスキップ

Statistical Learning Laboratory

2. 因子とは

tomoshige/website

2. 因子とは

第2章因子とは何か

因子とは、観測された複数の変数に共通して影響を与える、直接観測できない潜在的な変数のことを指します。
因子分析では、これらの潜在因子を推定することにより、変数間の相関パターンを解明し、背後にある共通の構造を明らかにしようとします。

潜在因子の役割

次元圧縮:
多くの観測変数が、実際には少数の因子によって支配されていると仮定することで、複雑なデータをよりシンプルな構造に要約できます。たとえば、心理学的検査では、複数のテスト項目が「記憶力」や「注意力」といった少数の基礎的な因子によって説明される場合があります。
共通性の説明:
ある因子が高い負荷量を持つ変数は、その因子が背後にある共通の要因であることを示唆します。これにより、表面的には異なるように見える観測変数の間に、実は共通の要因が存在することを理解できます。

具体的な事例

知能検査における一般因子（g因子）:
スペアマンは、複数の知能検査の結果に共通する「一般知能」を示す因子が存在すると仮定しました。各検査項目（例えば、言語理解、数理能力、空間認識など）の成績は、この共通因子の寄与と、個別の能力や測定誤差によって説明されると考えられます。
マーケティングリサーチにおける潜在セグメント:
アンケート調査により収集された消費者の嗜好や購買行動のデータに対して因子分析を実施すると、背後に「品質重視」や「価格重視」などの潜在因子が抽出される場合があります。これにより、消費者の購買決定に影響を与える主要な要因を把握することが可能となります。
健康診断データの解析:
複数の生体指標（血圧、血糖値、コレステロール値など）に対して因子分析を行うと、これらの指標に共通して影響を与える「生活習慣」や「遺伝的素因」といった因子が抽出されることがあります。これにより、健康リスクの背後にある潜在的な因子を特定し、予防策の策定に役立てることができます。

因子の数学的定義

数学的には、因子は次のようなモデルで表されます。

\[ x_i = \lambda_{i1} f_1 + \lambda_{i2} f_2 + \cdots + \lambda_{im} f_m + \epsilon_i,\quad (i = 1, 2, \dots, p) \]

\(x_i\)：観測変数
\(f_j\)：潜在因子
\(\lambda_{ij}\)：因子 \(f_j\) が変数 \(x_i\) に与える影響（因子負荷量）
\(\epsilon_i\)：その変数固有の誤差または特有因子

このモデルは、観測変数の分散が共通因子による部分と、特有因子による部分に分解できるという前提に基づいています。因子負荷行列を通して、各因子がどの程度各変数に寄与しているかが数値的に示されるため、因子分析はデータの構造理解において非常に強力な手法となっています。