有効

測定方法が測定することになっている特性を測定する精度の程度としての妥当性

品質基準についての詳細

  • 客観性
  • 信頼性

定義

妥当性(妥当性とも呼ばれます)は、テスト手順が測定するように設計された特性を実際にテストする精度の程度として定義されます。
そう... テストが測定していると主張するものを正確に測定する度合い。

したがって、有効性は重要な科学的品質基準です。

答えられるべき質問は: テスト/測定手順で実際に測定されるものは何ですか?
テストは実際に測定対象を測定しますか?
要件:測定対象を事前に明確にする必要があります(能力または構成の定義)

有効性はどのように決定されますか?

妥当性の判断 3つの可能性があります。

  1. 論理的推論(コンテンツの妥当性)
  2. 基準との相関の決定(基準の妥当性)
  3. との相関関係の決定(妥当性を構築する)

の中に トレーニングベースのパフォーマンス診断 有効性の最初の2つの形式は主に関心があり、特に 基準の妥当性.

1.コンテンツの有効性

コンテンツの有効性は、理論的または論理的な考慮事項と、 ない 有効性は経験的調査に基づいて結論付けられます。

1.顔の妥当性:
コンテンツの有効性は、正当化された妥当性の推定に基づいています。
だから…テストはそれが実際に彼に合ったスキルをテストしているという印象を与えます。特性との対応が明らかな場合は、 より論理的な、または ささいな妥当性。

例えば。 (16 mからのサッカーのショット。バスケットボールの投球精度の決定としてのフリースローラインからのシュート力またはフリースローの決定としての線。)

2.専門家による評価:
コンテンツの有効性が明らかでない場合は、有能な人物によるさらなる調査が必要です。
テストは、その内容に関して有効であると単純に判断することはできません。最初に専門家の報告で確認する必要があります。
専門家の評価は、専門家の間のコンセンサスとして理解されています。
妥当性決定におけるエキスパート評価のプロセス:

  • 選ばれた専門家は 書面または口頭で質問されたテストがテスト中の機能をチェックするかどうか
  • 専門家が取得 アンケート そして、テストで決定されたスキルをチェックする必要があります。

80%を超える一致が達成された場合、コンテンツの有効性は肯定的と見なされます。

通知! (コンテンツ有効性の問題)

  • 測定器は常にいくつかのスキルおよび/またはスキルを並行してテストし、テスト実行の技術的な違いが結果を偽造する可能性があります
  • 機能変動 (同じテストで、たとえば腕立て伏せなど、さまざまな被験者のさまざまな特性をテストできます(さまざまなパフォーマンスレベルでの強度持久力対最大強度)

2.基準関連の有効性(基準有効性)

基準の有効性は、テストの結果とテストが決定された基準との間の統計的一致の程度を定義します。
(例:30メートルのスプリントはロングジャンプのパフォーマンスと相関しています。)
計算された相関=基準の妥当性(妥当性係数)

基準の妥当性 で特に重要と考えられている パフォーマンス診断.

分割されます 基準の妥当性 に:

  • 一致の有効性- テスト値と基準値は同時に収集されます。マッチの有効性は0.80より大きくなければなりません。
  • 予測の妥当性- 最初のテスト、次に基準値のコレクション

基準の妥当性の決定:

  1. テスト値の決定 (X)サンプル
  2. 基準値の収集 (Y)同じサンプル
  3. 相関の計算 (X、Y)= rxy

r = 1の相関で、パワーはエラーなしで推定できます。

外部基準関連の有効性: テストのパフォーマンスは外部基準と相関しています。 (例:6ジャンプはロングジャンプと相関関係があります)

内部基準関連の有効性: テストのパフォーマンスは、同じ範囲の有効性について他の測定値を使用して評価されます。 (例:CounterMovement Jumpはジャンプベルトテストで評価されます)

3.妥当性を構築する

定義:
構成要素の有効性とは、測定方法が測定しようとする理論上の構成要素を実際に記録する程度です。
ほとんどの場合、構成要素の有効性は確認因子分析によって決定されます

構成の有効性は、テストで測定することになっているものを理論的に明確にするために重要です。

構築する =理論的/概念的な構造 (例:持久力、強さ、スピード、知能など)

構成は次のように分類できます。

  • 同種の構成: 密接に関連しているスキル (例:ジャンプ力- 最大強度)
  • 異種構成: 密接に関連しないスキル(例:強さ-フィットネス)

さらに、 妥当性を構築する に分け:

  • 収束的妥当性 (類似の要因を測定する他のテストとの合意)
  • 判別の妥当性 (他の構成のどの変数とテストが相関しないか)

構成の検証は3つのステップで行われます。

  1. テスト可能な仮説の導出
  2. 仮説のレビュー
  3. 結論を下す