層化ランダムサンプリング。定義
層別無作為抽出 サンプリングは、確率的サンプリングの一種である。
調査
の組織は、母集団全体を複数の重ならない同質のグループ(層)に分岐させ、様々な層からランダムに最終メンバーを選んで研究を行うことができるため、コストを削減し、効率を向上させることができるのです。 これらのグループのメンバーは、単純な確率ですべてのグループのメンバーが等しく選択される機会を得られるように、それぞれを区別する必要があります。 このサンプリング方法は、「ランダムクォータサンプリング」とも呼ばれています。
年齢、社会経済区分、国籍、宗教、学歴などが層別無作為抽出に該当します。
ある研究チームが、様々な年齢層の宗教に関する意見を求めている状況を考えてみましょう。 米国市民326,044,985人からフィードバックを集めるのではなく、約10000人のランダムなサンプルを選んで調査することができます。 この1万人の市民を年齢別に分類すると、18〜29歳、30〜39歳、40〜49歳、50〜59歳、60歳以上のグループに分けられる。 各層には明確なメンバーと人数が存在します。
詳細はこちら
デモグラフィックセグメンテーション
8 層別無作為抽出のためのステップ。
- ターゲットを明確にする
オーディエンス
. - 層別変数を認識し、使用する層数を把握する。 これらの層別変数は、研究の目的に沿ったものでなければならない。 あらゆる追加情報が層別変数を決定する。 例えば、すべてのサブグループを理解することが研究の目的であれば、変数はサブグループに関連し、これらのサブグループに関するすべての情報が変数に影響を与えることになる。 層別変数が増えると、ある変数が他の変数の影響を打ち消す可能性が高くなるので、理想的には、層別変数は4~6個以下、層は6個以下のサンプルを使用すること。
- すでに存在するサンプリングフレームを使用するか、対象者のすべての要素について層別変数のすべての情報を包含するフレームを作成する。
- サンプリングフレームを、対象外、過剰、グループ化などの基準で評価した上で、変更する。
- 母集団全体を考えると、各層はユニークであり、母集団の一人一人をカバーする必要があります。 層内では差が少なく、各層では極端に異なることが望ましい。 母集団の各要素は、ただ一つの層に属するべきである。
- 各要素にランダムでユニークな番号を割り当てる。
- 各層の大きさは、要件に応じて把握する。 すべての層におけるすべての要素間の数値分布は、実施すべきサンプリングの種類を決定する。 比例配分型層別サンプリングと不均衡配分型層別サンプリングのどちらかを選択することができます。
- そして、研究者は各層から無作為に要素を選び出し、サンプルを形成することができます。 各層から最低1つの要素を選び、すべての層から代表者を出す必要があるが、各層から2つの要素を選ぶと、収集データの計算の誤差を容易に計算することができる。
詳細はこちら
単純無作為抽出
層別無作為抽出の種類。
-
比例層別無作為抽出。
この方法では、各層のサンプルサイズは、層全体の母数に正比例する。 つまり、各層
サンプル
は同じサンプリング率を持つ。
比例層別無作為抽出の公式。n h = ( N h / N ) * n |
nh= hのサンプルサイズ
th
地層
Nh= h 番目の母集団の大きさ
層
層
N= 母集団全体の大きさ
n= サンプル全体の大きさ
500、1000、1500、2000の4つの層があり、調査機関がサンプリング率として½を選択した場合。 調査員は、それぞれの層から250人、500人、750人、1000人のメンバーを選ばなければならない。
地層 | A | B | C | D |
人口規模 | 500 | 1000 | 1500 | 2000 |
サンプリング比率 | 1/2 | 1/2 | 1/2 | 1/2 |
最終的なサンプリングサイズの結果 | 250 | 500 | 750 | 1000 |
母集団のサンプルサイズに関係なく、サンプリング比率はすべての層で均一となる。
詳細はこちら
システマティックサンプリング
-
不均衡な層化無作為抽出。
サンプリング比率は、比例配分型と不均衡配分型の層化ランダムサンプリングの主要な差別化要因である。 不均衡サンプリングでは、各層は異なるサンプリング割合を持つことになる。
このサンプリング方法が成功するかどうかは、調査者が分数を割り当てる際の精度に依存する。 割り振られた端数が正確でないと、過不足のある層によって結果に偏りが生じる可能性があります。
地層 | A | B | C | D |
人口規模 | 500 | 1000 | 1500 | 2000 |
サンプリング比率 | 1/2 | 1/3 | 1/4 | 1/5 |
最終的なサンプリングサイズの結果 | 250 | 333 | 375 | 400 |
詳しくはこちら
クラスター・サンプリング
層化ランダムサンプリングの例。
研究者や統計学者は、2つ以上の層の間の関係を分析するために層別無作為抽出を使用します。 層化ランダムサンプリングは、複数の層(stratata)を含むので、サンプル値を計算する前にstratataを計算することが非常に重要である。
詳しくはこちら
定量的市場調査
以下は、典型的な層別無作為抽出の例である。
仮に、100(Nhの生徒を対象に、好きな教科について質問した。 中学2年生の生徒と中学3年生の生徒とでは、教科の希望が異なるのは事実です。 正確な調査結果を得るためには、各グレードを様々な層に分けることが理想的です。
各学年の生徒数の表はこちらです。
グレード | 生徒数(n) |
5 | 150 |
6 | 250 |
7 | 300 |
8 | 200 |
9 | 100 |
層化ランダムサンプリング式で各グレードのサンプルを算出する。
層別サンプル(n 5 ) = 100 / 1000 * 150 = 15 |
層別サンプル(n 6 ) = 100 / 1000 * 250 = 25 |
層別サンプル(n 7 ) = 100 / 1000 * 300 = 30 |
層別サンプル(n 8 ) = 100 / 1000 * 200 = 20 |
層別サンプル(n 9 ) = 100 / 1000 * 100 = 10 |
詳しくはこちら
コンビニエンス・サンプリング
層別無作為抽出の利点。
- クラスター・サンプリング、単純無作為抽出、システマティック・サンプリングなどの他の確率的サンプリング手法や、コンビニエンス・サンプリングなどの非確率的手法と比較して、結果の精度が高い。 この精度は、各層の区別に依存する。つまり、すべての層が極端に異なっていれば、結果は高精度となる。
- このサンプリング手法の性質が正確であるため、サンプルを層別するためのチームを訓練するのに便利である。
- この方法は統計的な精度が高いため、サンプルサイズが小さくても、研究者にとって非常に有用な結果を得ることができる。
- このサンプリング手法は、研究者が層別を完全にコントロールできるため、最大限の母集団をカバーすることができます。
詳細はこちらクラスター・サンプリングと層別サンプリング
層化ランダムサンプリングはどのような場合に使用するのか?
-
- 層化ランダムサンプリングは、研究者が利用可能な母集団の中から特定の層のみに焦点を当てることを意図している状況において、非常に生産的なサンプリングの方法です。
母集団データ
. こうすることで、地層の望ましい特性を
調査サンプル
. - 研究者は、2つ以上の異なる層の間の関係を確立することを意図している場合に、このサンプリング方法を使用します。 を使用してこの比較を行った場合
単純なランダムサンプリング
の場合、対象グループが均等に代表されない可能性が高くなります。 - アクセスやコンタクトが困難なサンプルは、層化ランダムサンプリングの手法を用いることで、簡単に調査プロセスに参加することができます。
- サンプルの構成要素が関連する層から選ばれるため、統計結果の精度は単純な無作為抽出よりも高くなります。 層内の多様性は、対象者の多様性に比べてはるかに小さい。 精度の関係で、必要な
サンプルサイズ
ははるかに小さくなり、研究者の時間と労力を節約するのに役立ちます。
- 層化ランダムサンプリングは、研究者が利用可能な母集団の中から特定の層のみに焦点を当てることを意図している状況において、非常に生産的なサンプリングの方法です。
続きを読む