良い調査研究デザインは、サンプリングエラーを減らそうとする
信頼区間とは何ですか?
信頼区間とは、 調査対象者のすべてのメンバーについて特定の調査質問 をして、サンプルのメンバーが調査に与えたのと同じ回答を返すことができれば、研究者が経験するエラーのマージンです。
たとえば、研究者が4の信頼区間を使用し、調査サンプルの参加者の60%が「友人に推薦する」と回答した場合、ターゲット母集団全体の54%から64%の間で同じ質問をしたときに「友達に推薦する」と言うこともあります。 この場合の信頼区間は+/- 4です。
信頼レベルとは何ですか?
信頼水準は、サンプルから得られたデータを研究者がどの程度自信できるかの表現です。 信頼水準はパーセンテージとして表され、ターゲット人口の割合が信頼区間内にある回答をどれくらいの頻度で出すかを示します。 最も一般的に使用される信頼水準は95%です。 関連する概念を統計的有意性といいます。
彼の標本が実際に標的母集団を代表する確率に関する研究者の信頼は、いくつかの要因によって影響を受ける。
研究の設計と実施に対する研究者の自信と限界の認識は、主に3つの重要な変数、すなわち、サンプルサイズ、反応の頻度、および人口の大きさに基づいています。 研究者は、研究計画段階でこれらの変数を慎重に検討しなければならないことに長年同意してきました。
- サンプルサイズ一般に、より大きなサンプルは、ターゲット母集団を真に反映するデータを提供します。 幅広い信頼区間は、エラーのマージンが大きいため、データの信頼性が低いことを示します 。 幅広い信頼区間は、あなたのベットをヘッジするようなものです。 信頼区間と標本サイズとの間には関係がありますが、 線形関係ではありません。 研究者は、サンプルサイズを2倍にして信頼水準を半分にすることはできません。
- 応答の頻度サンプルデータが対象人口を反映する正確さは、特定の回答をしたか特定の方法で回答した 回答者の割合によっても異なります。 特定の回答をした回答者の数が多いほど、「非常に幸せ」と言えば、回答者はその回答者である可能性があります。 通常の曲線の中央領域では、パーセンテージに多少の変動があります。 つまり、研究者が、 対象集団のメンバーが、サンプル集団のメンバーのような(信頼区間内で)応答すると50%確信している場合、その50%レベルから多少の変動がある可能性があります。
外れ値(標準曲線の遠端または尾部にあるデータ)は、標本の場合と同じように集団内でほぼ同じ割合で発生する可能性が高いことを覚えておくと良いでしょう。ここでは変動が少ない周波数が低いためです。 (Galton Boxのボールがパシフィック・サイエンス・センター展示の真ん中にどのように積み重なっているのかを考えてみましょう。いくつかのボールだけがテールに飛び散っています)。このため、 極端な回答の頻度を確信する方が簡単です。
- 人口のサイズは、研究者が非常に小さく、自分に知られている人口(例えば、人口のすべてのメンバーが研究者によって識別されるのに十分なほど小さい人数)で働いていない限り、 サンプルサイズの重要な要素ではありません。
Creative Research Systemsは次のように指摘しています。
確率の数学は、サンプルのサイズがあなたが調べている総人口の数パーセントを超えていない限り、人口のサイズは無関係であることを証明します。 これは、500人のサンプルが、100,000の都市であるように、15,000,000人の州の意見を調べるのにも同様に有用であることを意味します。
代表的なサンプルを生成するには 、コストがかかり時間がかかるプロセスになる可能性があります。 研究者は、得ようとしている信頼水準か、達成するために必要な正確さと、水力が得られる信頼水準との間に常にトレードオフがあります。
定性的調査のサンプルサイズ
定性的な研究は、本質的に探索的または記述的であり、数値または測定に焦点を当てていません。 しかし、定性的調査のサンプリング誤差に関する懸念は依然として有効である。 原則として、サンプルがターゲットユニバースを代表する場合、研究から出現するテーマまたはパターンは、研究者にとって興味のあるより大きな集団を反映することになる。 サンプルが代表的であり、ターゲット母集団の大部分を占める場合、そのサンプルから得られたデータの精度に対する信頼性は高くなる傾向がある。
調査研究でのサンプルサイズの決定
サンプルサイズの決定に関しては、定量的研究と定性的研究には異なる規則が適用されます。 一般に、質的調査研究によって生成されたデータに自信を持つためには、研究者はデータの使用方法を明確に理解する必要があります。 データは説明的な物語(事例研究やある種の民族誌的研究のような)の基礎を形成するかもしれないし、後に定量的研究において相関性について試験されるかもしれない関連変数を特定するための探索的な方法で役立つかもしれない。
定量調査のサンプルサイズ
定量的研究は、しばしば、ターゲット市場の市場セグメントまたはサブグループ間の比較を含む。 量的研究は数に基づいているため、快適な標本サイズを決定するのはかなり簡単です。研究の重要なグループまたはセグメントごとに、研究者は100人の参加者を調査することを望みます。 この数字は推奨値であり、絶対値ではありません。 市場調査者は、調査研究でサンプルのサイズを決定するために、いくつかの関連する変数を検討します。
調査市場調査を実施する場合、目標は、対象宇宙に当てはまると思われるものをサンプルから推測することです。 サンプルは、 観察または既知のデータを提供します。 この観察されたまたは既知のデータから、研究者は、 未知の値またはパラメータが標的母集団において見いだされる程度を推定することができる。
定量的な調査研究は、研究者の心の中で、ターゲット宇宙 - 研究者が実際にパラメータを知っているよりもむしろ推定しなければならない人口を表す、 通常の対称的な曲線の概念に基づいている。 代表的なサンプルは、研究者が、サンプルデータから、未知の値または関心のあるパラメータを含む可能性が高い推定値の範囲を計算することを可能にする。 この推定された値の範囲は、通常の曲線上の面積を表し、一般に10進数またはパーセンテージとして表されます。
ノーマルカーブと確率
通常の対称カーブは、確率の視覚的表現である。 シンプルなヒューリスティックを見てみましょう。サイエンスセンターの活動では、一度に1枚ずつ2枚のアクリルシートの間に多数のボールが落ちます。 すべてのボールはディスプレイの上部にある同じ開口部を通って落下し、一度静止するとボールのスタックを分ける垂直、平行デバイダの間に落ちます。 数時間後、ボールは正常な曲線の形状を形成した。 新たに導入されたボールが最初に到着したボールの質量に当たったときに、カーブが少し変化します。 しかし全体的に、対称曲線は明白であり、それは科学センターのオブザーバーまたはスタッフによるいかなる行動とも無関係に自然発生した。 ボールが形成する湾曲した形状は、ほとんどのボールが中心に落ちてそこに留まる確率を反映しています。 ボールの数が少なくなるとカーブの遠端に入りますが、必然的にはそうなりますが、数は少ないです。
この正規曲線はサンプルの概念に似ています。 ディスプレイが空になってボールがもう一度ガルトンボックスに落ちるたびに、ボールの積み重ねの構成はわずかに異なります。 しかし、時間の経過とともに、カーブの形はあまり変わらず、パターンは真実になります。