非パラメトリック検定とは|少人数の職場ストレス評価で使う視点

「心」「カラダ」を支えるけんこう総研ストレスマネジメント

非パラメトリック検定とは|少人数の職場ストレス評価で使う視点

ホーム » 健康経営 » 健康経営戦略・KPI・エビデンス » ストレス計測・行動変容|健康経営のKPI設計と研修効果測定 » 非パラメトリック検定とは|少人数の職場ストレス評価で使う視点

ストレス計測・行動変容|健康経営のKPI設計と研修効果測定

非パラメトリック検定とは|少人数の職場ストレス評価で使う視点

職場のストレス調査や研修前後のアンケートを見たとき、「人数が少ないけれど、この結果を使ってよいのか」と迷う担当者は少なくありません。この記事では、少人数のデータや、きれいな分布にならないストレス評価を読むときに使われる非パラメトリック検定を扱います。統計の専門家向けではなく、人事総務・健康経営担当者が、調査結果を社内で説明するときに使いやすい視点にしました。数字を強く言い切る前に、どの検定を選べばよいのかを確認するための記事です。

非パラメトリック検定は、少ないデータから無理に結論を出すための方法ではありません。職場のストレス調査や研修効果の確認で、データ数が少ない、外れ値がある、正規分布とは言いにくいときに、結果を慎重に読むための統計手法です。

非パラメトリック検定とは何か

非パラメトリック検定とは、データが正規分布していることを前提にしない統計手法です。平均値だけで判断しにくいデータや、人数が少ない調査、回答のばらつきが大きいデータを扱うときに使われます。

職場のストレス調査では、理想的なデータがそろうとは限りません。部署の人数が少ない、回答者が限られる、ストレス度のばらつきが大きい、外れ値がある。このような場面では、平均値だけを見ると判断を誤ることがあります。

非パラメトリック検定では、数値そのものだけではなく、データの順位や大小関係を使って比較します。そのため、少人数データや偏りのあるデータでも使いやすい方法として、研究や実務で利用されています。

企業の健康経営に役立つメンタルヘルス対策セミナーを説明するタニカワ久美子

少人数のストレス評価で平均値だけを見る危険

健康経営の実務では、10人前後の部署、少人数の専門職チーム、介護施設や教育機関の小規模単位で調査結果を見ることがあります。この場合、1人の回答が全体の平均値を大きく動かします。

たとえば、研修前後でストレスレベルを比較したとき、1人だけ大きく数値が変化すると、平均値では「効果があった」ように見えることがあります。反対に、多くの人に小さな変化があっても、平均値だけでは見えにくい場合もあります。

人事総務の担当者が見るべきなのは、平均値の上下だけではありません。人数、ばらつき、外れ値、比較する条件、調査時期を合わせて確認することが必要です。

非パラメトリック検定が向いている場面

非パラメトリック検定は、次のような場面で使いやすい方法です。職場のストレス評価や研修効果の確認では、かなり現実的な選択肢になります。

場面 なぜ注意が必要か 非パラメトリック検定で見られること
サンプル数が少ない 1人の回答が結果に大きく影響する 順位や中央値の違いを使って比較できる
データが正規分布していない 平均値を前提にした検定が合わない場合がある 分布の形に強く依存せずに比較できる
外れ値がある 平均値が極端な値に引っ張られる 順位を使うため外れ値の影響を抑えやすい
ストレス尺度が順序データに近い 点数差の意味が完全に等しいとは言い切れない 大小関係を使って差を見られる
研修前後を比較したい 同じ人の変化を見たい場合がある 対応のあるデータとして比較できる

代表的な非パラメトリック検定

非パラメトリック検定にはいくつかの種類があります。大切なのは、検定名を覚えることではなく、「何と何を比べたいのか」によって方法を選ぶことです。

検定名 使う場面 職場ストレス評価での例
ウィルコクソン符号付順位検定 同じ人の前後比較 研修前と研修後のストレスレベルを比べる
マン・ホイットニーU検定 別々の2群を比較 運動習慣あり群となし群のストレスレベルを比べる
クラスカル・ウォリス検定 3群以上を比較 低活動群・中活動群・高活動群でストレスレベルを比べる

ここで注意したいのは、ウィルコクソン検定には複数の呼び方があることです。研修前後のように同じ人を比べる場合は、ウィルコクソン符号付順位検定を使います。別々の2群を比べる場合は、マン・ホイットニーU検定を使うのが一般的です。

ウィルコクソン符号付順位検定を使う場面

ウィルコクソン符号付順位検定は、同じ対象者の前後比較に使います。たとえば、同じ従業員について、研修前と研修後のストレスレベルを比べたい場合です。

健康経営研修では、「研修を受ける前」と「研修を受けた後」で、疲労感、緊張感、ストレスレベル、セルフケア意識が変わったかを確認することがあります。このとき、同じ人の変化を見るので、対応のあるデータになります。

確認したいこと データの形 使いやすい検定
研修前後でストレスレベルが変わったか 同じ人の前後データ ウィルコクソン符号付順位検定
軽い運動前後で気分が変わったか 同じ人の前後データ ウィルコクソン符号付順位検定
呼吸法の前後で緊張感が変わったか 同じ人の前後データ ウィルコクソン符号付順位検定

この検定では、単に平均値を見るのではなく、前後の差の大きさや方向を順位として扱います。少人数の研修データでも、変化の傾向を慎重に確認しやすくなります。

マン・ホイットニーU検定を使う場面

マン・ホイットニーU検定は、別々の2つのグループを比較するときに使います。たとえば、運動習慣がある従業員グループと、運動習慣がない従業員グループで、ストレスレベルに違いがあるかを見る場合です。

職場のデータでは、部署Aと部署B、日勤者と夜勤者、運動あり群と運動なし群など、別々のグループを比べる場面があります。人数が少ない場合や分布がきれいではない場合、マン・ホイットニーU検定が候補になります。

比較したいこと データの形 使いやすい検定
運動習慣あり群となし群のストレス差 別々の2群 マン・ホイットニーU検定
部署Aと部署Bのストレスレベル差 別々の2群 マン・ホイットニーU検定
研修受講群と未受講群の比較 別々の2群 マン・ホイットニーU検定

ただし、2群に差が出たとしても、それだけで原因まで断定できるわけではありません。部署の業務量、勤務時間、管理職の関わり方、繁忙期かどうかも合わせて見る必要があります。

クラスカル・ウォリス検定を使う場面

クラスカル・ウォリス検定は、3つ以上のグループを比較するときに使います。たとえば、身体活動量を低・中・高の3群に分けて、ストレスレベルに違いがあるかを見る場合です。

職場では、1METs、2〜3METs、4METs以上のように活動量で分けたり、年代別、職種別、勤務形態別に比べたりすることがあります。このような3群以上の比較では、クラスカル・ウォリス検定が候補になります。

ただし、3群以上で差があるとわかった場合でも、どの群とどの群に差があるのかは別に確認する必要があります。健康経営の実務では、統計結果だけでなく、各グループの人数や職場背景を必ず確認します。

p値だけで施策を決めない

非パラメトリック検定でも、結果を見るときにp値が使われます。一般に、p値が0.05未満であれば統計的な差があると判断されることがあります。

しかし、健康経営の実務では、p値だけで施策を決めるのは危険です。サンプル数が少ないと、本当は意味のある傾向があっても有意差が出ないことがあります。反対に、たまたま差が出たように見える場合もあります。

人事総務の担当者が見るべきなのは、「有意差があるかないか」だけではありません。どのくらいの人数で、どのような職場状況で、どの程度の差があり、従業員の声と合っているかを確認することが大切です。

見たい項目 確認する理由 健康経営での使い方
p値 統計的な差の有無を見るため 参考情報として扱う
サンプル数 人数が少ないと結果が不安定になりやすいため 数字を強く断定しない
中央値 平均値より実態を反映しやすい場合があるため 少人数データの見方に使う
ばらつき 同じグループ内でも負担感が違うため 面談やヒアリングにつなげる
職場背景 業務量や勤務形態が影響するため 施策の優先順位を考える

データ補完が向かない場合の考え方

職場の測定データでは、欠損値が出ることがあります。ウェアラブルデバイスの装着不良、測定時間のずれ、回答漏れなどが原因です。

欠損値があるからといって、無理にデータを補完すればよいとは限りません。特に少人数データでは、補完した値が結果に大きく影響することがあります。

その場合は、取れているデータだけで比較できる範囲に絞る方法があります。たとえば、4METs以上のデータが欠損しているなら、1METs群と2〜3METs群だけで比較し、マン・ホイットニーU検定を使って確認することが考えられます。

ただし、その場合も「4METs以上のデータが不足しているため、分析対象は限定されています」と説明する必要があります。健康経営では、結果をきれいに見せることよりも、データの限界を正直に示すことが重要です。

タニカワ久美子の企業研修でのデータの扱い方

タニカワ久美子の企業研修では、ストレス評価の数値を「良い・悪い」の判定には使いません。現場では、人数が少ない部署や、回答者が限られる調査も多くあります。その結果をそのまま断定すると、管理職や従業員が責められているように受け止めることがあります。

研修では、数値を見たあとに、従業員の声、職場の忙しさ、休憩の取りやすさ、運動やセルフケアが続けやすい環境かどうかを合わせて確認します。非パラメトリック検定は、その数字を慎重に読むための補助として扱います。

人事総務の担当者からも、少人数の調査結果をどう説明すれば現場が納得しやすいかを相談されることがあります。統計結果を強く言い切るよりも、面談、管理職支援、職場環境の見直しにつなげる伝え方が大切です。

健康経営担当者が検定を選ぶときの見方

検定を選ぶときは、難しい数式から入る必要はありません。まず、比較したいデータの形を確認します。同じ人の前後比較なのか、別々の2群なのか、3群以上なのかを見れば、候補になる検定はかなり絞れます。

比較したい内容 データの形 候補になる検定
研修前後のストレス変化 同じ人の前後比較 ウィルコクソン符号付順位検定
運動あり群となし群の差 別々の2群比較 マン・ホイットニーU検定
活動量3群での差 3群以上の比較 クラスカル・ウォリス検定
欠損が多いデータ 使える範囲に限定 比較可能な群だけで慎重に検定

このように、検定は施策判断のための道具です。検定名を知っていることよりも、どのデータを、どの目的で比べるのかを決めることが重要です。

非パラメトリック検定は、少人数データを読み誤らないための道具

非パラメトリック検定は、少人数の職場ストレス調査や、分布がきれいではないストレス評価を読むときに役立ちます。平均値だけでは見えにくい差や、外れ値に引っ張られやすい結果を、順位や中央値の考え方で確認できます。

ただし、検定結果は健康経営の判断材料の一部です。p値だけで施策の良し悪しを決めるのではなく、サンプル数、ばらつき、職場背景、従業員の声を合わせて見る必要があります。

人事総務・健康経営担当者にとって大切なのは、統計を難しく扱うことではありません。数字を慎重に読み、従業員が無理なく働ける環境づくりや、研修後フォローにつなげることです。

少人数のストレス評価や研修前後データを、健康経営の改善につなげたいご担当者へ

けんこう総研では、ストレス評価の数値を社員個人の問題で終わらせず、面談、管理職支援、職場環境の見直しにつなげる健康経営支援を行っています。

健康経営フォローアップについて相談する

文責:タニカワ久美子

夜間・土日祝の無料相談も随時受け付けております。
まずはお気軽にお問い合わせください。