5. 回転基準と結果の解釈
第5章 回転と分析結果の解釈
本章では、因子分析の結果をより明確かつ解釈しやすくするために行われる「回転」の概念と、その後の分析結果の解釈方法について詳しく説明します。ここでは、回転の目的、直交回転と斜交回転の違い、数学的な展開、そして具体例を通して、得られた因子負荷行列の読み取り方や実務上の解釈のポイントを解説します。
5.1 はじめに
因子分析の初期段階では、統計的最適性を重視した推定により因子負荷行列が得られます。しかし、得られた負荷行列は必ずしも「単純構造(simple structure)」を示しておらず、各観測変数が複数の因子に対して中程度の負荷量を持つような場合もあります。
この状態では、どの因子がどの変数に主に影響を及ぼしているのかの解釈が困難になるため、回転という手法を用いて、因子負荷行列の構造を解釈しやすい形に再配置します。
5.2 回転の目的と重要性
5.2.1 回転の目的
-
解釈性の向上:
回転を行うことで、各因子に対して高い負荷量を持つ変数と低い負荷量を持つ変数が明確になり、各因子の意味を把握しやすくなります。 -
単純構造の実現:
「単純構造」とは、各変数ができるだけ一つの因子に強く寄与し、他の因子にはほとんど寄与しない状態を指します。回転はこの単純構造を実現するために用いられます。 -
解釈の一致:
分析者が異なる場合でも、回転後の因子負荷行列により、同じデータから似た解釈が得られる可能性が高まります。
5.2.2 なぜ初期の解だけでは不十分なのか
- 初期解の問題点:
初期の因子負荷行列は、最尤法や主因子法などで得られるため、統計的最適性はあるものの、解釈の容易さという点では必ずしも最良ではありません。 - 構造の曖昧さ:
例えば、ある変数が複数の因子に対して中程度の負荷を示している場合、その変数がどの因子に主に関連しているのかが不明瞭となります。
5.3 直交回転と斜交回転の詳細
因子分析での回転には大きく分けて「直交回転」と「斜交回転」の2種類があり、それぞれにメリット・デメリットおよび実際の応用での利点があります。ここでは、各手法の代表的な基準について、Varimax(直交回転)とPromax(斜交回転)に加え、直交回転のQuartimax基準および斜交回転のQuartimin基準やGeomin基準についても説明します。
5.3.1 直交回転 (Orthogonal Rotation)
概要:
直交回転は、回転後の因子が互いに直交(すなわち相関がゼロ)となるように回転を行う方法です。代表的な手法には、Varimax、Quartimax、Equamax などがあります。
Varimax:
- 各因子における負荷量の分散を最大化することで、極端な高値と低値を強調し、単純構造を実現します。
- メリット: 解釈がシンプルで、各変数がどの因子に強く関連しているかが明確になります。
- デメリット: もしデータの背後で因子間に相関がある場合、その関係を無視してしまう可能性があります。
Quartimax:
- Quartimax は、行ごとの単純性、すなわち各観測変数(行)の負荷量の単純性を最大化することに焦点を当てた回転方法です。
- メリット: 各変数が一つの因子に極端に寄与するように変換されるため、全体として単純な構造が得られやすく、一般因子の抽出傾向が強く出ることが多いです。
- デメリット: 結果として、一つの大きな一般因子が支配的になる傾向があり、複数の明確な因子構造が見えにくくなる場合があります。
Equamax:
- Varimax と Quartimax の中間的な性質を持ち、各因子と各変数の単純性を同時に追求します。
実際の応用例:
心理学的検査など、変数ごとに明確な特徴が存在し、各変数が特定の因子に集中することが期待される場合、直交回転は適用しやすいです。Quartimax は、全体として単純な構造を得るために利用されることがありますが、場合によっては一般因子が強調されすぎるため注意が必要です。
5.3.2 斜交回転 (Oblique Rotation)
概要:
斜交回転は、回転後の因子間の相関を許容する方法です。代表的な手法には、Promax、Direct Oblimin、Quartimin、Geomin などがあります。
Promax:
- 初めに直交回転(通常は Varimax)を行い、その結果に対してパワー変換を適用して、斜交性を導入します。
- メリット: 実際のデータで因子間の相関が存在する場合、より現実的な因子構造を反映できます。
- デメリット: 因子間の相関が生じるため、各因子の独立した解釈が難しくなる場合があります。
Direct Oblimin:
- 回転パラメータ(delta値)を調整することで、因子間の相関の度合いを制御できる柔軟な方法です。
- メリット: 回転の自由度が高く、データの特性に応じた調整が可能です。
- デメリット: パラメータ設定により結果が大きく変化することがあり、解釈には注意が必要です。
Quartimin:
- Quartiminは、斜交回転の一手法で、負荷量行列の「複雑さ」を最小化することを目的とします。
- メリット: 変数が複数の因子にわたって中程度の負荷を示す場合、比較的シンプルな構造に再配置され、解釈しやすくなります。
- デメリット: 直交回転ほど単純な独立性は得られず、因子間の相関が残るため、解釈がやや複雑になる場合があります。
Geomin:
- Geomin回転は、負荷量の小さい要素の幾何平均(またはその類似指標)を最小化する方法です。
- メリット: 細かな負荷量を抑え、大きな負荷量を際立たせることで、変数が明確にどの因子に寄与しているかを示す単純構造を導出します。
- デメリット: 回転基準が複雑なため、解釈の一貫性を保つために、ユーザーが回転パラメータを慎重に選ぶ必要があります。
実際の応用例:
健康診断データや消費者調査など、因子間に自然な相関が存在すると予想される場合、斜交回転は有用です。Quartimin や Geomin は、変数が複数の因子にわたる中程度の寄与を示す場合に、よりシンプルな解釈を促すために選択されることがあります。
まとめ:
- 直交回転:
Varimax、Quartimax、Equamax などがあり、因子間の独立性を保持するため、解釈が直感的でシンプルな構造が得られますが、現実の相関関係を反映しにくい場合があります。
- 斜交回転:
Promax、Direct Oblimin、Quartimin、Geomin などがあり、因子間の相関を許容することで、実際のデータ構造をより忠実に反映できますが、解釈が複雑になる可能性があります。
実際の解析では、理論的な前提やデータの特性に応じ、どちらの回転手法が適切かを判断することが重要です。各手法のメリットとデメリットを十分に理解した上で、目的に合わせた回転方法を選択することで、因子分析の結果がより意味のあるものとなります。
5.4 数学的展開と回転行列
本節では、回転行列の数学的基礎と、どのようにして初期の因子負荷行列 $ \Lambda $ をより解釈しやすい形に変換するか、その具体的な手順を詳しく説明します。
5.4.1 基本概念
因子分析では、初期の因子負荷行列 $ \Lambda $ が得られた後、その解釈を容易にするために「回転」を施します。回転後の因子負荷行列は、回転行列 $ T $ を用いて次のように定義されます。
-
直交回転の場合:
$ T $ は直交行列となり、つまり $ T^\top T = I $(単位行列)を満たします。この場合、回転後の因子間は互いに独立です。 -
斜交回転の場合:
$ T $ は必ずしも直交ではなく、因子間の相関を許容します。回転後の因子間の相関行列は、
$$ \Phi = T^\top T $$ として求められます。
5.4.2 直交回転における数学的最適化(Varimaxの例)
直交回転は、因子負荷量の「単純構造」を実現するために、各因子に対して高い負荷量と低い負荷量の差を最大化します。たとえば、Varimax回転では以下の目的関数を最大化します。
ここで、 - $ \lambda^*_{ij} $ は回転後の因子負荷量、 - $ p $ は観測変数の数、 - $ m $ は抽出された因子の数です。
この目的関数は、各因子の負荷量の分散を最大化することで、極端な値(高いまたは低い)を強調し、単純構造に近づける役割を果たします。直交回転では、回転行列 $ T $ が直交性 $ T^\top T = I $ を保つため、変換後の負荷行列 $ \Lambda^* $ の全体的な分散は保持され、因子間の独立性が維持されます。
5.4.3 斜交回転におけるPromax回転の具体的手法
斜交回転は、実際のデータで因子間に存在する相関を反映するために用いられます。Promax回転は、その一例であり、以下のステップで行われます。
ステップ1: 初期直交回転
まず、Varimaxなどの直交回転を用いて初期の因子負荷行列 $ \Lambda $ を得ます。
ステップ2: ターゲット行列の作成
各要素にパワー変換を適用して、ターゲット行列 $ \Lambda_t $ を作成します。具体的には、各要素について
を計算します。ここで、 - $ \operatorname{sgn}(\lambda_{ij}) $ は $ \lambda_{ij} $ の符号を保持し、 - $ k $ は通常 3 や 4 といった正の整数です。
この変換により、大きな負荷量はさらに強調され、小さな負荷量はより小さくなります。
ステップ3: 変換行列 $ T $ の推定
次に、ターゲット行列 $ \Lambda_t $ にできるだけ近づけるため、変換行列 $ T $ を以下の最小二乗問題として求めます。
ここで、$ | \cdot |_F $ はフロベニウスノルムを示します。最小二乗解は、解析的に次の形で求められます。
この $ T $ は直交性を満たさない非直交行列となり、これにより因子間の相関が導入されます。
ステップ4: 回転後の因子負荷行列の算出
最終的に、回転後の因子負荷行列は
として得られ、さらに因子間の相関は
として求められます。
5.4.4 まとめと重要ポイント
-
基本式:
回転操作は $ \Lambda^* = \Lambda T $ という単純な線形変換で表現されます。 -
直交回転 vs 斜交回転:
- 直交回転:
$ T $ は直交行列($ T^\top T = I $)であり、因子間の独立性を保持します。Varimaxなどが代表的です。 -
斜交回転:
$ T $ は非直交行列となり、因子間の相関 $ \Phi = T^\top T $ を反映します。Promax回転はその典型例です。 -
パワー変換の役割:
ターゲット行列 $ \Lambda_t $ の作成により、大きな負荷量はさらに強調され、小さな負荷量は縮小されるため、各変数がどの因子に主に寄与しているかが明確になります。 -
最適化問題としての回転行列:
回転行列 $ T $ の推定は、フロベニウスノルムによる最小二乗問題として定式化され、その解が回転後の因子負荷行列 $ \Lambda^* $ を決定します。
このように、数学的展開と回転行列の詳細な理解は、因子分析の結果をより明瞭に解釈するための基盤となります。各ステップの意味とその背景を把握することで、得られた因子負荷行列の変換過程とその解釈に自信を持って臨むことができるでしょう。
5.5 分析結果の解釈
因子分析の結果を正しく解釈することは、データから意味のある知見を抽出する上で極めて重要です。しかし、単に因子負荷量の数値を見るだけではなく、現実的な懸念やデータの特性、理論的背景を考慮に入れる必要があります。ここでは、解釈の具体的なポイント、潜在的な問題点、および実例を交えながら詳しく説明します。
5.5.1 因子負荷量の解釈
- 高い負荷量と低い負荷量の判断:
一般に、0.70以上の負荷量は「高い」と見なされ、0.30未満の値は弱いと判断されます。ただし、これらの閾値はデータの種類や研究分野によって異なることもあります。 -
例:
心理学的検査で、ある項目が「記憶力因子」に対して0.80の負荷量を示している場合、その項目は記憶力に大きく寄与していると判断されます。一方、同じ項目が「注意力因子」に対して0.25の負荷量しか示さないなら、記憶力が主要な要因と解釈されます。 -
複数因子に中程度の負荷:
ある変数が複数の因子に中程度の負荷を持つ場合、その変数は一つの明確な概念に絞りにくいことを意味します。こうした場合、項目自体の内容や理論背景を再評価する必要があります。 - 懸念:
例えば、アンケート項目が「サービスの質」と「価格」に同程度(例えばそれぞれ0.45)の負荷を示す場合、その項目がどちらの側面をより反映しているかが不明瞭です。結果として、因子の命名や解釈に混乱が生じる可能性があります。
5.5.2 因子の命名と理論的検証
- 因子の命名:
回転後の因子負荷行列から、各因子に最も関連する変数を確認し、理論や先行研究に基づいて名称を付けます。 -
例:
心理学的検査の場合、項目1~3が「記憶」に強く寄与していれば、その因子は「記憶力因子」と命名されます。 -
理論との整合性:
得られた因子構造が既存の理論や仮説と整合しているかを確認します。理論と大きく乖離する場合は、因子数の選定や回転手法の再検討、あるいはデータ自体の質や測定の問題が考えられます。 -
外部変数との関連:
因子得点を用いて、外部の変数(例:業績、健康指標、購買行動など)との相関や回帰分析を行い、因子の妥当性を確認することも有用です。
5.5.3 現実的な懸念とその対策
- 測定誤差と特有因子:
各観測変数には固有の誤差(特有因子)が存在します。誤差が大きいと、因子負荷量が実際の構造を反映していない可能性があります。 -
対策:
測定の信頼性や妥当性を確認するために、信頼性係数(例:Cronbach's α)や検証的因子分析(CFA)を併用する。 -
因子の重複と解釈の不明瞭さ:
複数の因子が似たような変数群を含む場合、因子の意味が重複してしまい、どちらが主要な構造を反映しているか判断しにくくなります。 -
対策:
回転前後の因子負荷行列を比較し、因子数の見直しや、場合によっては項目の削除・修正を検討する。 -
サンプルサイズの問題:
サンプルサイズが小さい場合、因子分析の結果が不安定になる可能性があります。 - 対策:
十分なサンプルサイズを確保する、またはブートストラップ法などの再標本抽出法で結果の安定性を評価する。
5.5.4 具体例による解釈
例1: 心理学的検査の因子解釈
ある知能検査で、以下のような回転後の因子負荷行列が得られたとします。
項目 | 記憶力因子 | 注意力因子 | 処理速度因子 |
---|---|---|---|
項目1 | 0.82 | 0.25 | 0.10 |
項目2 | 0.78 | 0.20 | 0.15 |
項目3 | 0.80 | 0.30 | 0.05 |
項目4 | 0.15 | 0.85 | 0.20 |
項目5 | 0.10 | 0.80 | 0.25 |
項目6 | 0.20 | 0.82 | 0.30 |
項目7 | 0.05 | 0.10 | 0.88 |
項目8 | 0.10 | 0.15 | 0.90 |
- 解釈:
- 項目1~3は「記憶力因子」に高い負荷を示しており、記憶力の測定に寄与していると解釈される。
- 項目4~6は「注意力因子」に強く関連している。
- 項目7~8は「処理速度因子」を主に反映している。
- 懸念:
仮に項目3が注意力因子にも中程度の負荷を示していた場合、項目3は「記憶力」と「注意力」の両方に影響されている可能性があり、項目の内容や測定の方法を再検討する必要がある。
例2: マーケティング調査における因子解釈
消費者調査の結果、以下の回転後の因子負荷行列が得られたとします。
項目 | 品質重視因子 | 価格重視因子 |
---|---|---|
製品の耐久性 | 0.90 | 0.20 |
製品のデザイン | 0.85 | 0.25 |
製品の性能 | 0.88 | 0.15 |
価格の妥当性 | 0.30 | 0.82 |
割引・プロモーション | 0.20 | 0.85 |
購入後のサービス | 0.70 | 0.40 |
- 解釈:
- 「品質重視因子」は、製品の耐久性、デザイン、性能などの項目で高い負荷を示し、消費者が品質に強い関心を持っていることを示唆する。
- 「価格重視因子」は、価格の妥当性や割引の有無に対して高い負荷を示し、消費者の価格に対する敏感さを反映している。
- 懸念:
購入後のサービスが両因子に中程度の負荷を示す場合、消費者が品質と価格の両方を考慮している可能性があり、この項目の解釈には慎重な検討が必要となる。
5.5.5 解釈プロセスのポイント
-
数値だけでなく内容を確認する:
単に負荷量の大きさだけでなく、各項目の内容や背景知識も考慮に入れて、因子の意味付けを行います。 -
複数の指標を用いる:
因子負荷量、因子得点、因子相関行列など、複数の統計指標を組み合わせることで、より堅固な解釈を試みます。 -
理論との整合性を検証する:
得られた因子が先行研究や理論とどの程度一致しているかを評価し、必要に応じてモデルの見直しを行います。
5.6 まとめ
-
回転の意義:
回転は因子負荷行列を解釈しやすい形に再配置し、単純構造を実現するための重要なステップです。 -
直交回転 vs 斜交回転:
直交回転には Varimax、Quartimax、Equamax などがあり、因子間の独立性を保ちつつシンプルな解釈を提供します。
斜交回転には Promax、Direct Oblimin、Quartimin、Geomin などがあり、因子間の相関を反映し、より現実的な構造を抽出する一方、解釈が複雑になる可能性があります。 -
数学的背景:
回転操作は \( \Lambda^* = \Lambda T \) として定式化され、直交回転の場合は \( T^\top T = I \) を、斜交回転の場合は \( \Phi = T^\top T \) を満たすことで、各基準に基づいた回転が実現されます。 -
結果の解釈:
回転後の因子負荷行列を基に、因子の命名、変数の寄与度の確認、視覚的表示などを通じて、実務や理論に即した解釈を行います。