ニュース&トピックス
統計用語/ストレス文献ノート
2022年3月9日更新
項目(識別力を有している)
下位尺度ごとに因子数を 1 とした探索的因子分析(最尤法)
探索的因子分析(exploratory factor analysis: EFA)と確認的因子分析のちがい
探索的因子分析は、特に因子構造についての仮説を持たない場合に使用する。
全ての因子からすべての項目に因子負荷があると仮定して、因子から項目への因子負荷量を推定する。
1.項目群がどのような因子構造をもっているのか?
2.どの項目がどの因子から負荷を受けているのか?
それに対して
確認的因子分析は、因子構造についての仮説がある場合に使用する。
どの項目が、どの因子から因子負荷を受けているのかを指定し、因子から因子負荷を受けていない項目については因子負荷を0に固定して推定する。
1.研究者の仮説モデルにデータが適合しているかどうか?
2.データがモデルに適合しているかどうかは各種の適合度指標で評価する。
結果
因子負荷の値は、全体としてはいずれも中程度以上の大きさであった。この結果から、いずれの下位尺度においても一定の1次元性が満たされていると判断。
項目反応モデルの当てはめ
日本版MBI-ES の項目得点に対し、原版通り3つの潜在特性を仮定した多次元段階反応モデル(Multidimensional Graded Response Model(MGRM):De Ayala, 1994)を当てはめた。R の mirt パッ
ケージ(Chalmers, Pritikin, & Zoltak, 2014)を使用。
累積確率曲線には、潜在特性ごとに 2パラメタ・ロジスティックモデルを設定した。
累積確率曲線とは
機械翻訳や機械翻訳などの分野において活用されるキーワード
例
さいころを投げたときに「出る目が4以下となる確率」や「出る目が4から6の目が出る確率」といった、ある範囲の確率を求める場合。
確率変数が離散型である場合と連続型である場合がある。
2パラメタ・ロジスティックモデルとは
2パラメタ・ロジスティックモデル(two-parameter logistic model)とは、項目の困難度と識別力によってテスト項目の正答確率を表現しようとするモデルのこと。
参考文献:
芝祐順(編) :項目反応理論―基礎と応用―.東京大学出版会,東京,1991.
長崎栄三・萩原康仁:算数達成度の項目反応理論による比較分析.国立教育政策研究所,東京,2004.
服部環 :心理・教育のためのRによるデータ解析.福村出版,東京,2011.
村木英治 :シリーズ<行動計量の科学>項目反応理論.朝倉書店,東京,2011.
ロジスティック・モデルで扱うパラメータ
1. 識別力(𝑎)…被験者の特性値(能力)の違いが正答確率にどの程度反映するか。
2. 困難度(𝑏)…大きいほどテスト項目が難しい問題である。
3. 当て推量(𝑐)…被験者が偶然正答する確率。
用語集
多変量正規分布=変量正規分布を 2 つ以上の変数に一般化したもの
・mirt パッケージ=R2.14以上のバージョンでインストール(多次元IRT)
・testinfo =パッケージ中にあるTest関数やExample関数を抽出し、テスト先の関数の情報や関数の呼び出し箇所を表示するツール。
段階反応モデル(graded response model: GRM; Samejima, 1969)=項目反応理論の一つ。
IRTは通常2値の回答になるものに対して実施します。段階反応モデルではリッカート尺度のような多値の回答にIRTを適用したモデルです。段階反応モデルは,あるカテゴリーからあるカテゴリーに回答する差分を推定していくことになります
リッカート尺度= ある事柄に対してどの程度同意するかを問う質問。「はい/いいえ」で答える質問よりも微妙な態度や意見の違いを測定できるため、幅広く使用されている。
リッカートの評価スケールの定義
アンケートによるすべて選択回答形式の質問(あらかじめ用意された回答選択肢を回答者に提示する質問)満足度尺度と呼ばれることもある。
5段階または7段階のスケールを使った質問で、一方の極端な意見からその対極にある意見までを選択肢として揃える。
意見の程度を明らかにすることで、得られたフィードバックに対する理解の深さを劇的に変えるポテンシャルがある。
リッカート尺度(生みの親であるアメリカの社会学者レンシス・リッカートの名にちなんだ名称)は、その信頼性の高さゆえに非常に人気のある、意見・認識・行動を測定する方法の1つ。
ある特定のことに関する感情を測定する質問で、回答に「深い詳細レベル」が欲しい場合に使用。
ちょっとマニアックな言葉を使うと、この「深い詳細レベル」のことを統計学では、「分散」と呼ぶ。分散が大きいほど、対象者の考えの微妙な差異を把握可能。
標準偏差=分散の平方根をとることによって計算される基本統計量の1つで、データの散らばりの度合いを示す =標準的な偏差=「標準的な平均値との差」
ペアワイズ法=ソフトウェアのバグの多くが1つまたは2つの因子の組み合わせによって発生している という事実に基づいてテストケースを作成する方法。ペアが複数あり、ある命題がどのペアでも成立つときに使う。
多母集団の同時分析(豊田,2003, pp. 91– 93; Werts, Rock,Linn, & Jöreskog, 1976)=重回帰分析の一つ。R の lavaan パッケージ(Rosseel, 2012)
※内容をシンプルに明確化するため、敢えて割り切った語尾を使用しております。