【解説】統計検定準1級 2018年問題7

諸注意

  • 問題本文は公式サイトまたは公式問題集を参照してください
  • 統計検定2級の資格を持つ方を前提に解説していきます

問題7-1

ウォード法ではクラスター間の距離をどのように定義するか答えよ。

選択肢

① 2つのクラスターの重心間の距離
② 2つのクラスターの個体同士で最も距離の近い個体間の距離
③ 2つのクラスターの個体同士で最も距離の遠い個体間の距離
④ 2つのクラスター内の偏差平方和の和と、結合した後のクラスター内の偏差平方和との差の絶対値の平方根
⑤ 2つのクラスター間の全ての個体の組み合わせにおける距離の平均

答え 選択肢 ④

解説

前提知識

ウォード法

階層的クラスタリングの一種。最初に、各データを1つのクラスターとして扱い、最も類似しているクラスター同士を順々に結合していく手法。ウォード法における『最も類似している』とは、クラスター同士を結合した時の偏差平方和の和が最も小さいクラスター同士を指します。

ウォード法

『「2つのクラスター内の偏差平方和の和」と「結合した後のクラスター内の偏差平方和」との差の絶対値の平方根』が最も小さいクラスターを順々に結合していきます。

したがって、選択肢④が正解になります。

問題7-2

5種類の寿司ネタ(まぐろ, サーモン, うに・いくら, 貝類, 白身)の好みを5件法『1.好きではない から 5.好きである まで』を用いて15名にアンケートを行った結果、以下の特徴を持つデンドログラムを得た。この時、A, B, Cの3名がア, イ, ウのいずれかの解答を行った。A, B, Cとア, イ, ウの適切な組み合わせを答えよ。

デンドログラムの特徴
AとBの距離が近く、AとBの遠くにCが存在する

まぐろサーモンうに・いくら貝類白身
(ア)53245
(イ)34553
(ウ)45544

選択肢

① A:(ア), B:(イ), C:(ウ)
② A:(ア), B:(ウ), C:(イ)
③ A:(イ), B:(ア), C:(ウ)
④ A:(ウ), B:(ア), C:(イ)
⑤ A:(ウ), B:(イ), C:(ア)

答え ⑤ A:(ウ), B:(イ), C:(ア)

解説

距離

ウォード法における距離は類似性を表しています。問題文よりAとBの距離が近いため、AとBのアンケートの回答結果は類似していることが分かります。逆に、Cは(A, B)と距離が遠いため、アンケートの回答結果が大きく異なることが分かります。

アンケートの回答結果(ア), (イ), (ウ)を見ると、(イ)と(ウ)は全ての項目の点数が近しい値になっています。ここから、AとBは(イ)と(ウ)のどちらかであることが分かります。そこから残った回答結果(ア)がCであることが分かります。(特に、うに・いくらの乖離が大きい)

したがって、選択肢においてCと(ア)が唯一一致する選択肢⑤が正解になります。

問題7-3

同じデータに対して主成分分析を適用したところ、以下の主成分ベクトルを得た。この時、主成分負荷量のマップ(横軸: PC1, 縦軸: PC2)として適切なものを答えよ。

PC1(第1主成分)PC2(第2主成分)
まぐろ 0.8240.450
サーモン-0.7630.580
うに・いくら-0.6620.703
貝類 0.8780.290
白身 0.9060.313

選択肢割愛

答え 選択肢④

解説

値の読み取り

主成分ベクトル(テーブル)より、PC1, PC2の値はそれぞれ以下の符号を持ちます。

PC1(マイナス符号)PC1(プラス符号)
PC2(プラス符号)サーモン, うに・いくらまぐろ, 貝類, 白身
PC2(マイナス符号)

グラフ化

したがって、選択肢4が正解になります。

Sponsored Link