2016年3月14日月曜日

#人をあるタイプに分類する(その2 共通因子を抽出する)

<続き>

分類するための第一歩は、どういう視点でハカるのかを見つける、決めること。
しかも、なるべく少ない視点でハカりたい。そうでないと大変ですから。


今回のテーマは、複数の測定項目の背後に共通する<共通因子>を抽出するという話です。

誰もがイメージしやすいのは、生徒の学力を「理系能力」と「文系能力」という2つの軸(因子)で説明するという方法でしょう。


主要な科目の学力を、「理系能力」「文系能力」という視点(因子とか軸とか呼ぶ)に集約することで、理系能力が高い・低い、文系能力が高い・低いで4分類することができ、生徒の学力の説明が容易になるんです。


もし理系・文系という概念を持っていなかったらどうなるか。
仮に、実施された試験が英語、数学、現代文、物理、地理、公民の6科目だった場合。各科目の得意・不得意のみで生徒を能力を見ようとすると、視点が6つもあります。「英語の得意・不得意という視点からは....、数学の得意・不得意という視点からは...」を繰り返していくほかはなく、個別の科目のことはわかっても、生徒の学力の概要を理解することは非常に難しい。

消費者の理解も同様です。「ブランドイメージ」「レジャーの志向」「日ごろの買物行動の志向」「職業の志向」などを知るためにアンケートで様々な質問をしても、質問項目(測定項目)が多くなればなるほど、そのままでは処理できません。

ボクは昨年暮れに実施した約4700人を対象に行ったアンケートの中に、ライフスタイルやレジャーに対する志向、お金の使い方など様々な質問を盛り込みました(26問)。その回答結果から、レジャーの志向・価値観・興味関心の違いによって、生活者を分類しようと試みました。まずは、もっと少ない分析視点に集約する必要があります。

第一歩は、観測された個々の質問の結果(=変数)の背後にある、<直接には観測することができない潜在的な因子>を抽出して、分析の視点(軸)を減らした上で、回答者のことをどういうモノサシでハカり説明するかをを決めることです。これが[STEP1]です。

問題は、、どうやって、複数の測定項目の背後に共通する<ある何か>を見つけるのかということです。

また理系能力、文系能力で説明します。
各科目の試験の得点を分析すると、科目どうしの相関関係が見えてきます。さらに、それらの科目とは別に、直接は観測できない<何か>(=共通因子)が潜んでいると仮定します。その<何か>があるとすると、それぞれの科目の得点との相関はどのくらいかと算出します。※この時点ではまだ、「理系能力」とか「文系能力」という言葉はついていません。
見つかったこの<何か>がどの科目の得点と相関が強いかを見ます。
1つは、数学、物理の点数と相関が強いけれど、国語や公民の点数とはほとんど相関がない。
もう1つは、現代文や英語の点数と相関が強いけれど、数学や物理とはほとんど相関がない。
これが分かった後、数学や物理の学力の背後に潜む共通する何かを「理系能力」と名付け、後者を「文系能力」と名付けたのです。

ひょっとしたら、実際にはこれとは異なるプロセスだったかもしれません。
経験的に「理系能力」「文系能力」と呼べる能力が存在するという仮説があって、それを検証するために、「じゃあ、いろんな各科目のテスト結果を分析にかけてみよう」と検証したのかもしれません。
つまり、仮説を先に持ち、統計解析によってそれを検証することも可能なのです。



では、次回でいよいよ、「レジャーの志向」についての具体例に進みます。

<続く>
=== Research & Solutions!===

 【続編】
#人をあるタイプに分類する (その3) 共通因子を抽出した!
http://tanaka-tsuyoshi-dts.blogspot.jp/2016/03/blog-post_2.html

 【前編】
#人をあるタイプに分類する(その1) 共通因子とは何か?
http://tanaka-tsuyoshi-dts.blogspot.jp/2016/03/blog-post_10.html

0 件のコメント:

コメントを投稿