システマティックサンプリングとは?
系統的サンプリングとは、研究者が調査したい母集団をゼロにするために用いる統計的手法のことです。 研究者は、母集団全体のサイズを目的のサンプルサイズで割ることによって、サンプリング間隔を計算します。 系統的サンプリングは、確率的サンプリングを拡張したもので、集団の各メンバーを一定期間ごとに抽出してサンプルを形成するものである。
システマティックサンプリングの定義
系統的サンプリングは、研究者が無作為の出発点を選択することによって対象集団から要素を選び出し、一定の「サンプリング間隔」の後にサンプルメンバーを選択する確率的サンプリング方法と定義されています。
例えば、学生時代、スポーツチームのキャプテンを選ぶとき、ほとんどのコーチが1〜5(1-n)などの数字を連呼し、コーチが決めたランダムな番号の生徒が選ばれました。 例えば、3人がそれぞれのチームのキャプテンとして呼ばれる。 監督にとっても、選手にとっても、ストレスのない選考方法です。 このサンプリング手法では、母集団のすべてのメンバーが均等に選ばれる機会があります。
システマティック・サンプリング手法でサンプルを形成する手順とは?
ここでは、システマティックサンプルを形成するための手順を説明します。
ステップ1サンプリング面の作業を開始するために、定義された構造的な聴衆を開発します。
ステップ2 研究者として、理想的なサンプルのサイズ、つまり、母集団全体から何人をサンプルの一部として選ぶべきかを考えます。
ステップ3サンプルサイズが決まったら、サンプルのメンバー全員に番号を割り振ります。
ステップ4 このサンプルの間隔を定義する。 これが標準的な素子間の距離となる。
例えば,標本間隔は,5000(N=母集団の大きさ)と500(n=標本の大きさ)を割った値である10でなければならない.
区間(i)のシステマティックサンプリング式=N/n=5000/500=10 |
ステップ5.この場合、10人に1人の割合で、条件に合うメンバーを選びます。
ステップ6 サンプルの開始メンバー(r)をランダムに選び、その間隔を乱数に加算して、サンプルのメンバーを追加し続ける。 r, r+i, r+2iなどがサンプルの要素になります。
システマティックサンプリングのしくみ
サンプリングを行う際は、母集団を公平に代表するようにしましょう。 系統的サンプリングは、研究者が具体的に定義された間隔の後にサンプルを選択する、対称的なプロセスである。 このようなサンプリングは、サンプルの選択に関して、研究者にバイアスをかける余地がないのです。 システマティック・サンプリングが具体的にどのように機能するかを理解するために、インストラクターが生徒を一列に並ばせ、3人目ごとに列から出るように指示する体育の授業を例にとって考えてみましょう。 ここでは、講師がサンプルの選択に影響を与えることはなく、クラスを正確に表現することができます。
システマティックサンプリング例
例えば、現地のNGOが人口5000人の中から500人のボランティアを選び、組織的にサンプルを形成しようとする場合、人口の10人目ごとにサンプルを選ぶことができます。
システマティックサンプリングにはどのような種類がありますか?
ここでは、システマティックサンプリングの種類を紹介します。
- システマティックランダムサンプリング
- リニアシステマティックサンプリング
- サーキュラーシステマティックサンプリング
これらのサンプリング技術について詳しく見ていきましょう。
系統的無作為抽出。
系統的無作為抽出は、あらかじめ設定された特定の間隔でサンプルを選択する方法です。 研究者として、1からサンプリング間隔までの間のランダムな開始点を選択します。 以下は、システマティックランダムサンプルを設定するための手順例です。
- まず、サンプリング間隔を計算し、固定する。 (母集団の要素数をサンプルに必要な要素数で割ったもの)
- 1とサンプリング間隔の間のランダムな開始点を選択します。
- 最後に、サンプリング間隔を繰り返し、後続の要素を選択する。
リニアシステマティックサンプリング
線形系統標本は、標本が最後に繰り返されず、「N」個の母集団単位を持つ標本の一部となる「n」個の単位が選択される系統標本抽出法である。 この「n」個のサンプルをランダムに選択するのではなく、研究者はスキップロジックを適用してこれらを選択することができます。 直線的な経路をたどり、特定の集団の末端で停止するのです。
このサンプリングまたはスキップ間隔(k)=N(総母集団単位)/n(サンプルサイズ)
リニアシステムのサンプルはどのように選択されるのですか?
- 母集団全体を分類した配列にする。
- サンプルサイズ(n)を選択する
- サンプリング間隔(k)=N/nを算出する。
- 1〜k(kを含む)の乱数を選択する。
- 選んだ乱数にサンプリング間隔(k)を加えて次のメンバーを追加し、この手順を繰り返してサンプルの残りのメンバーを追加していきます。
- kが整数でない場合は、N/nに最も近い整数を選べばよい。
円形のシステマティックサンプリング。
循環式サンプリングでは、一度終了したサンプルをもう一度同じ地点から開始することから、このような名前がついています。 例えば、N=7、n=2の場合、k=3.5となる。 サンプルの作り方は2通りあります。
- k=3とすると、サンプルは、ad, be, ca, db, ecとなる。
- k=4とすると、サンプルは、ae, ba, cb, dc, edとなる。
循環系サンプルはどのように選択されるのですか?
- サンプリング間隔(k)=N/nを算出する。 (N=11でn=2の場合、kは6ではなく5とされる)。
- 1〜Nの間でランダムに開始
- 母集団全体のメンバーを選択するまで、毎回k個のユニットをスキップしてサンプルを作成します。
- この方法の場合、線形系統標本法のk個の標本と異なり、N個の標本が存在することになる。
線形系統標本と循環系統標本の違い。
ここでは、線形システマティックサンプリングと円形システマティックサンプリングの違いについて説明します。
リニア・システムティック・サンプリング |
サーキュラー・システムティック・サンプリング |
サンプルの作成=k(サンプリング間隔) | サンプル作成=N(総人口) |
このサンプルの始点と終点は明確である。 | 母集団全体を考慮した上で、一旦スタート地点から再スタートします。 |
すべてのサンプルユニットは、選択前に直線的に配置する必要があります。 | エレメントは円形に配置されます。 |
システマティック・サンプリングの利点は何ですか? システマティックサンプリングとは?
ここでは、システマティックサンプリングの利点を紹介します。
- 研究者にとっては、サンプルの作成、実施、分析が非常に簡単で便利です。
- サンプルの各メンバーに番号を振る必要がないため、より迅速かつ簡便に母集団を表現するのに適しています。
- 作成されたサンプルは、メンバー選択の精度に基づき、えこひいきのないものです。
- クラスター・サンプリングや 層別サンプリングなどの 確率的サンプリング手法やコンビニエンス・サンプリングなどの非確率的サンプリング手法では、作成されたクラスターが非常に偏る可能性があるが、システマティック・サンプリングではメンバーが互いに一定の距離を置いているため回避される。
- このサンプリング方法によるリスク要因は極めて少ない。
- 母集団に多様な構成員がいる場合、このサンプリング手法は、サンプルを形成する構成員が均等に分布するため、有益である。
クラスター・サンプリングや層化ランダム・サンプリングのような他の確率的サンプリング手法は、研究者や統計学者がより良いサンプリング結果を得るために系統的サンプリングや単純無作為抽出のような手法に目を向けたために非常に未組織で困難である場合があります。 サンプルサイズの選択とサンプルの出発点の特定が必要であり、サンプルを形成するために一定の間隔で継続する必要があるため、最も時間を消費しない方法である。
システマティックサンプリングはどのような場合に使用するのか?
例えば、人口5000人の中から500人のサンプルを作りたい場合、人口に含まれるすべての人に番号を振らなければならない。
ナンバリングが終わったら、リサーチャーがランダムに、例えば5という数字を選ぶことができます。 5人目の個人は、システムサンプルの最初の一人となる。 その後、10人目のメンバーがサンプルに追加され、以下同様となります(15人目、25人目、35人目、45人目、4995人目まで)。
その他、システマティックサンプリングを使用する4つのシチュエーションを紹介します。
- 予算の制約がある。 単純無作為抽出のような他のサンプリング手法と比較して、このサンプリング手法は、予算の制約があり、また研究の達成も極めて単純である場合に適しています。
- 実施が簡単。 システマティック・サンプリングは、サンプルの決定に定義されたサンプリング間隔に依存するため、研究者や統計学者にとって、より多くの回答者を持つサンプルを管理することが容易になる。 これは、サンプルの作成に費やす時間が最小限で済み、また、システマティックサンプリングは定期的に行われるため、費やすコストも制限されるからである。
- データパターンの欠落。 取り決めをしていない特定のデータがある。 このデータは、系統的なサンプリングを用いて、偏りのない方法で分析することができます。
- 研究においてデータ操作のリスクが低いこと。特にデータ操作のリスクが無視できない場合、幅広いテーマを研究する中で高い生産性を発揮します。
QuestionPro Audienceによるサンプリング
QuestionPro Audienceは、あらゆるレベルの市場調査やブランド調査に参加できるよう、ダブルオプショナルでモバイル対応の2200万人以上の調査回答者のグローバルサンプルを保有しています。 ゲーマーや建築業者など、ニッチなパネリストが必要な場合は、当社のニッチなパネリストと直接コンタクトをとってください。