本日のゲスト投稿は、民間調査会社、政府機関、学術機関など、さまざまな電話・オンライン調査プロジェクトのサンプリングソリューション設計のエキスパートであるChris DeAngelis氏によるものです。
研究者が全国代表(”nat. rep.”)サンプルを求める場合、対象となる集団が当該国の全人口であり、サンプルの構成にこれを反映させるべきことを意味します。 その時、最高の状態でnat. rep.サンプルは、どのように見ても母集団に「似ている」ことになる。 男性対女性の数は全国比率と一致し、各年齢層や各地域の比率は人口とぴったり一致する等。 非デモグラフィックな尺度(製品所有や心理学など)については、サンプルは母集団と一致する必要があります。
これを実現するために、教科書理論では、系統的誤差を最小化し、サンプリングバイアスに起因する非系統的誤差のリスクを低減するために、大規模なランダムサンプルと高い回答率を必要とします。 マーケティングリサーチの “現実世界 “では、回答率は高くなく、人口統計による回答率の差から、ほとんどの純粋なランダムサンプルは(どんなに洗練された層別化技術であっても)母集団と同じようにはならないのです。 そのため、マーケティングリサーチではクオータサンプルを使用するのが一般的である。 クォータサンプルは、あなたが選んだターゲットとなるデモグラフィックの人口と同じであることが100%保証されます。 ただし、それ以外はサンプリングエラーに左右されます。 年齢を例にとると、16~34歳、35~54歳、55歳以上という枠が設定されている場合、サンプルはこの比率の中で代表的なものになりますが、16~20歳、21~30歳、31~40歳といった年齢層で分析を行った場合、サンプルが正しく見えるという保証はありません。
サンプルのクォータコントロールがどの程度可能かは、サンプルサイズの決定と利用可能な参照データによって異なります。 6つの年齢区分、2つの性別、15の地域からなる180のマス目を作成します。 サンプルサイズが100しかない場合、すべてのセルを埋めることは不可能です。 サンプル数が多くても、セルには人の半分しか必要ないため、データは入っていないことになります。 サンプルをより代表的にするために、重み付けを行うことができます。 連動セルの代わりに、クォータセルを独立して構成することも可能です。 この欠点は、サンプルに大きな「穴」ができることです。例えば、若者のすべてが男性である場合、重み付けで穴を修正することができなくなります。
nat rep」のサンプルを得るためには、どのような変数を使うべきでしょうか?
研究目的や地域によって異なるため、明確な答えはありません。 例えば、英国では年齢、性別、地域、社会階層、米国では年齢、性別、地域、民族性、ベルギーでは年齢、性別、地域、使用言語が使用されることがあります。
年齢、性別、地理的な地域は、経済的な幸福感によって差別化される何かと結びついていることが多い。 これは、収入、教育、社会階層、家の所有権などである。
QuestionPro Audienceがおすすめするもの:
他に指示がない場合、北米では、QuestionPro Audienceは、年齢、性別、および経済的豊かさで区別する追加変数1つを使用します。 (北米では、地理的な要因による表現が自然に行われています)。 ヨーロッパでは、「経済的な幸福」のデータが国勢調査からすべての地域で得られるわけではないので、他に指示がない場合、Audienceは年齢、性別、地域を使用することになります。