諸注意
- 問題本文は公式サイトまたは公式問題集を参照してください
- 統計検定2級の資格を持つ方を前提に解説していきます
問題7-1
ウォード法ではクラスター間の距離をどのように定義するか答えよ。
選択肢
① 2つのクラスターの重心間の距離
② 2つのクラスターの個体同士で最も距離の近い個体間の距離
③ 2つのクラスターの個体同士で最も距離の遠い個体間の距離
④ 2つのクラスター内の偏差平方和の和と、結合した後のクラスター内の偏差平方和との差の絶対値の平方根
⑤ 2つのクラスター間の全ての個体の組み合わせにおける距離の平均
答え 選択肢 ④
解説
前提知識
ウォード法
階層的クラスタリングの一種。最初に、各データを1つのクラスターとして扱い、最も類似しているクラスター同士を順々に結合していく手法。ウォード法における『最も類似している』とは、クラスター同士を結合した時の偏差平方和の和が最も小さいクラスター同士を指します。
ウォード法
『「2つのクラスター内の偏差平方和の和」と「結合した後のクラスター内の偏差平方和」との差の絶対値の平方根』が最も小さいクラスターを順々に結合していきます。
したがって、選択肢④が正解になります。
問題7-2
5種類の寿司ネタ(まぐろ, サーモン, うに・いくら, 貝類, 白身)の好みを5件法『1.好きではない から 5.好きである まで』を用いて15名にアンケートを行った結果、以下の特徴を持つデンドログラムを得た。この時、A, B, Cの3名がア, イ, ウのいずれかの解答を行った。A, B, Cとア, イ, ウの適切な組み合わせを答えよ。
デンドログラムの特徴
AとBの距離が近く、AとBの遠くにCが存在する
まぐろ | サーモン | うに・いくら | 貝類 | 白身 | |
(ア) | 5 | 3 | 2 | 4 | 5 |
(イ) | 3 | 4 | 5 | 5 | 3 |
(ウ) | 4 | 5 | 5 | 4 | 4 |
選択肢
① A:(ア), B:(イ), C:(ウ)
② A:(ア), B:(ウ), C:(イ)
③ A:(イ), B:(ア), C:(ウ)
④ A:(ウ), B:(ア), C:(イ)
⑤ A:(ウ), B:(イ), C:(ア)
答え ⑤ A:(ウ), B:(イ), C:(ア)
解説
距離
ウォード法における距離は類似性を表しています。問題文よりAとBの距離が近いため、AとBのアンケートの回答結果は類似していることが分かります。逆に、Cは(A, B)と距離が遠いため、アンケートの回答結果が大きく異なることが分かります。
アンケートの回答結果(ア), (イ), (ウ)を見ると、(イ)と(ウ)は全ての項目の点数が近しい値になっています。ここから、AとBは(イ)と(ウ)のどちらかであることが分かります。そこから残った回答結果(ア)がCであることが分かります。(特に、うに・いくらの乖離が大きい)
したがって、選択肢においてCと(ア)が唯一一致する選択肢⑤が正解になります。
問題7-3
同じデータに対して主成分分析を適用したところ、以下の主成分ベクトルを得た。この時、主成分負荷量のマップ(横軸: PC1, 縦軸: PC2)として適切なものを答えよ。
PC1(第1主成分) | PC2(第2主成分) | |
まぐろ | 0.824 | 0.450 |
サーモン | -0.763 | 0.580 |
うに・いくら | -0.662 | 0.703 |
貝類 | 0.878 | 0.290 |
白身 | 0.906 | 0.313 |
選択肢割愛
答え 選択肢④
解説
値の読み取り
主成分ベクトル(テーブル)より、PC1, PC2の値はそれぞれ以下の符号を持ちます。
PC1(マイナス符号) | PC1(プラス符号) | |
PC2(プラス符号) | サーモン, うに・いくら | まぐろ, 貝類, 白身 |
PC2(マイナス符号) |
グラフ化
したがって、選択肢4が正解になります。