ソーシャルメディア研究におけるサンプルのバイアス誤差を避ける

ソーシャルメディアサンプルの品質を高める方法

現在実施されているソーシャルメディア調査は、非参加バイアスの影響を受ける。 多くのタイプの非参加バイアスが存在し、それぞれのタイプは、調査結果の信頼性影響与える可能性があります。 実際、研究は、到達するのが難しい研究者が、複数の努力を必要とし、他の回答者と大きく異なることを示しています。

これらの違いは、年齢、性別、婚姻状態、社会経済的状態、健康状態、および子供の数に見られた。

回答率

調査終了時のデータがサンプル内のすべてのメンバーを含む程度は、 応答率と呼ばれます。 このコンセプトは、構造化された調査やインタビューのセットではっきりしていますが、ソーシャルメディアの調査ではあいまいです。 しかし、ソーシャルメディアの研究では他の質的研究よりもそれほど重要ではありません。 回答率は、調査を完了する(またはインタビューを受けることに同意した)参加者の数を、 元のサンプリング努力を構成する全人数で除算して計算されます。 総数には、連絡に成功しなかった人や、研究への参加を拒否した人が含まれていなければなりません。

一般化の問題

データの収集方法に関係なく、高いレスポンス率の重要性は十分に強調することはできません。

サンプルの応答率が低い場合、より多くの人口を現実的に生成することは不可能です。 サンプルのバイアスは、応答率が低下するにつれて増加します。 メディアベースの調査では、リターン・レートがサンプルの20〜30%に低下すると、そのグループの参加者のグループ全体のサンプル集団との類似性はほとんどありません。

人々が郵送調査を返すのと同じ傾向、または電話調査に参加することに同意するのは、ソーシャルメディアネットワークに従事する人々、つまり主題(または製品またはサービス)の特定の関心事である)。

サンプルサイズ

より小さいサンプルは、より大きなサンプルよりも大きなサンプリング誤差を有する。 サンプルデータは、より大きな母集団の属性の推定値を提供すると考えてください。 サンプリングフレームから抽出された各サンプルは、そのより大きな集団の別個の推定値を提供する。 理論的には、質問された各質問に対して取られた各サンプルの応答の別個のパターンが存在する可能性がある。 時間の経過と共に、サンプリングフレームから抽出された十分なサンプルがあれば、真のパターンはより大きな母集団の実際の(真の)パターンの周りに収束するでしょう。

誤差の範囲

サンプリング誤差は、より大きな母集団から採取された試料の推定値の精度を表す。 サンプリング誤差は、統計的尺度である信頼水準に関連する誤差のマージンによって表される。 例えば、大統領選挙投票では、現職者が有権者の64%に支持されていることが示されます。 エラーのマージンはプラスまたはマイナス3ポイントで、95%の信頼水準になります。

言い換えれば、100人の有権者サンプルで100以上の投票者が再度投票された場合、95人の有権者は有権者が投票者の61%〜67%を支持していることを示します。 すなわち、有権者の61%+ 3%または-3%。

サンプルサイズに関する決定

サンプルのサイズが上がるにつれて、サンプリングに関連する誤差のマージンは下がりますが、特定の点までしか低下しません。 サンプルのサイズが1000人から2000人の回答者に達した場合、誤差のマージンは十分に小さく、より大きなサンプルを考慮に入れる( 費用効果の高い選択ではない)。 サブグループがより大きい人口の一部である場合、サブグループの人数に応じてサブグループごとに誤差の幅が異なるため、より大きなサンプルサイズが正当化される可能性があります。 例えば、ソーシャルメディアネットワークの1000人のメンバーと95%の信頼区間を持つ1〜3パーセントポイントのどこかに等しい誤差のマージンがあれば、ソーシャルメディアネットワークのサブグループ、約100の番号を有する母親は、約4〜10点の高い誤差マージンを有するであろう。

サンプルの充分量の測定

サンプルは、典型的には、最終的なサイズまたは組成ではなく、使用される選択手順に従って評価される。 これは基本的なことです。ほとんどの状況では、標本がどのようにしてより大きな集団であるを正確に測定することは不可能です。 統計的手法は、便利で根本的に信頼性のある推定を可能にするために使用される。 合理的な信頼区間と誤差のマージンを最初に確立することで、研究者は応答率や適切なサンプリングフレームなどの変数に焦点を当てることができます。