QC検定3級|基本統計量の計算方法をわかりやすく解説

QC検定3級の試験では、基本統計量の計算問題が頻繁に出題されます。平均値、メディアン、範囲、偏差平方和、不偏分散、標準偏差という6つの指標は、品質管理の基礎となる重要な概念です。
本記事では、それぞれの基本統計量について、計算方法と意味をわかりやすく解説します。計算の順序を正しく理解することで、試験での得点力が大きく向上しますので、ぜひ参考にしてください。
基本統計量とは?QC検定3級で必ず押さえるべき6つの指標
基本統計量とは、収集したデータの特徴を数値で表したものです。品質管理の現場では、製品の品質や工程の状態を把握するために、データを収集し分析します。そのとき、データ全体の傾向やばらつきを客観的に示すのが基本統計量の役割です。
基本統計量が品質管理で重要な理由
品質管理では「データに基づく判断」が基本となります。感覚や経験だけでなく、数値で現状を把握することで、問題の発見や改善の効果測定が可能になります。基本統計量を正しく理解し計算できることは、品質管理の第一歩といえます。
QC検定3級では、基本統計量の計算問題が毎回出題されています。公式を覚えるだけでなく、それぞれの統計量が何を意味しているのかを理解することが、試験対策として重要です。
データの特徴を数値で表す意味
データの特徴は、大きく分けて「中心の位置」と「ばらつきの程度」の2つの観点で表されます。中心の位置を表す指標が平均値やメディアンであり、ばらつきの程度を表す指標が範囲、分散、標準偏差です。
これらの指標を組み合わせることで、データ全体の姿を数値として把握できます。たとえば、平均値が同じでも標準偏差が異なれば、データの散らばり具合が違うことがわかります。
平均値|データの中心を表す代表値
平均値は、最も基本的な統計量であり、データの中心的な値を表します。すべてのデータを足し合わせ、データの個数で割ることで求められます。
平均値の計算方法
平均値の計算式は以下のとおりです。
平均値 = xの合計 ÷ n
ここで、xは個々のデータの値、nはデータの個数を表します。たとえば、5つのデータ「10、12、14、16、18」の平均値を求める場合、まず合計を計算します。10+12+14+16+18=70です。次に、データの個数5で割ります。70÷5=14となり、平均値は14です。
平均値を使う場面と注意点
平均値は、データの代表値として広く使われています。製品の寸法や重量の管理、工程の出来栄え評価など、さまざまな場面で活用されます。
ただし、平均値には注意点があります。極端に大きい値や小さい値(外れ値)があると、平均値が大きく影響を受けてしまいます。このような場合には、メディアンを使う方が適切なこともあります。
メディアン(中央値)|データの真ん中の値
メディアンとは、データを大きさ順に並び替えたときに、中央に位置する値のことです。日本語では「中央値」とも呼ばれます。
メディアンの求め方
メディアンを求めるには、まずデータを小さい順(または大きい順)に並び替えます。データの個数が奇数の場合は、真ん中の値がメディアンとなります。データの個数が偶数の場合は、中央に近い2つの値を足して2で割った値がメディアンとなります。
たとえば、5つのデータ「12、18、10、16、14」のメディアンを求める場合、まず大きさ順に並び替えます。「10、12、14、16、18」となります。データの個数は5で奇数なので、真ん中の3番目の値である14がメディアンです。
6つのデータ「10、12、14、16、18、20」の場合は、中央に位置する値がありません。この場合、3番目の14と4番目の16を足して2で割ります。(14+16)÷2=15となり、メディアンは15です。
平均値とメディアンの使い分け
平均値とメディアンは、どちらもデータの中心を表す指標ですが、特徴が異なります。平均値はすべてのデータの値を反映しますが、外れ値の影響を受けやすい性質があります。一方、メディアンは外れ値の影響を受けにくく、データの分布が偏っている場合に有効です。
試験では、平均値とメディアンの違いを問う問題も出題されます。それぞれの特徴を理解しておきましょう。
範囲|データのばらつきを簡単に把握する
範囲は、データのばらつきを表す最も簡単な指標です。最大値と最小値の差を計算するだけで求められます。
範囲の計算方法
範囲の計算式は以下のとおりです。
範囲(R) = 最大値 - 最小値
たとえば、5つのデータ「10、12、14、16、18」の範囲を求める場合、最大値は18、最小値は10です。18-10=8となり、範囲は8です。
範囲のメリットと限界
範囲のメリットは、計算が非常に簡単であることです。最大値と最小値さえわかれば、すぐに求められます。現場で素早くばらつきを把握したい場合に便利です。
一方、範囲には限界もあります。範囲は最大値と最小値の2つの値だけで決まるため、それ以外のデータの分布状況を反映しません。また、外れ値があると範囲が大きくなり、実際のばらつきを正確に表さない場合があります。より正確にばらつきを把握するには、分散や標準偏差を使う必要があります。
偏差平方和|ばらつきを計算するための基礎
偏差平方和は、分散や標準偏差を計算するための基礎となる値です。各データが平均値からどれだけ離れているかを数値化したものです。
偏差平方和の計算方法
偏差平方和の計算式は以下のとおりです。
偏差平方和(S) = x²の合計 -(xの合計)² ÷ n
この式は、各データの二乗の合計から、データの合計の二乗をデータ数で割った値を引くことで求められます。この計算方法は、電卓で効率的に計算できるため、試験でもよく使われます。
たとえば、3つのデータ「2、4、6」の偏差平方和を求める場合、まずxの合計を計算します。2+4+6=12です。次にx²の合計を計算します。4+16+36=56です。偏差平方和は、56-(12)²÷3=56-144÷3=56-48=8となります。
なぜ偏差を二乗するのか
偏差とは、各データと平均値の差のことです。偏差をそのまま合計すると、プラスとマイナスが打ち消し合って0になってしまいます。そこで、偏差を二乗することで、すべての値をプラスにしてから合計します。これにより、ばらつきの大きさを正しく捉えることができます。
不偏分散|サンプルから母集団のばらつきを推定する
不偏分散は、サンプルデータから母集団のばらつきを推定するための指標です。偏差平方和をデータ数から1を引いた値で割って求めます。
不偏分散の計算方法
不偏分散の計算式は以下のとおりです。
不偏分散(V) = S ÷(n - 1)
ここで、Sは偏差平方和、nはデータの個数です。先ほどの例で偏差平方和が8、データ数が3の場合、不偏分散は8÷(3-1)=8÷2=4となります。
なぜn-1で割るのか
分散を計算するとき、なぜnではなくn-1で割るのでしょうか。これは、サンプルから母集団の分散を推定する際の偏りを補正するためです。
サンプルの平均値は母集団の平均値とは異なる場合があります。サンプルの平均値を基準に偏差を計算すると、ばらつきが小さめに見積もられる傾向があります。n-1で割ることで、この偏りを補正し、母集団の分散をより正確に推定できます。n-1のことを「自由度」と呼びます。
試験では「なぜn-1で割るのか」という理由を問う問題も出題されることがあります。「母集団の分散を偏りなく推定するため」と覚えておきましょう。
標準偏差|ばらつきを元の単位で表す
標準偏差は、分散の平方根をとった値です。ばらつきを元のデータと同じ単位で表すことができるため、実務で最もよく使われる指標です。
標準偏差の計算方法
標準偏差の計算式は以下のとおりです。
標準偏差(s) = √V = √(S ÷(n - 1))
先ほどの例で不偏分散が4の場合、標準偏差は√4=2となります。
標準偏差を求めるには、まず偏差平方和を計算し、次に不偏分散を計算し、最後に平方根をとるという順序で計算します。この順序を覚えておくことが重要です。
標準偏差の実務での活用
標準偏差は、品質管理のさまざまな場面で活用されます。工程能力指数の計算、管理図の管理限界線の設定、製品のばらつき評価など、多くの分析で標準偏差が使われます。
分散は単位が二乗されているため(たとえばmm²)、直感的に理解しにくい場合があります。標準偏差は元の単位(たとえばmm)で表されるため、実際のばらつきをイメージしやすいというメリットがあります。
試験で狙われるポイント|計算の順序を押さえる
基本統計量の計算問題では、計算の順序を正しく理解していることが重要です。順序を間違えると正しい答えにたどり着けません。
基本統計量の計算順序
基本統計量は、以下の順序で計算します。この順序を覚えておきましょう。
まず、データの合計(xの合計)とデータの二乗の合計(x²の合計)を求めます。次に、平均値を計算します。平均値=xの合計÷nです。続いて、偏差平方和を計算します。偏差平方和=x²の合計-(xの合計)²÷nです。そして、不偏分散を計算します。不偏分散=偏差平方和÷(n-1)です。最後に、標準偏差を計算します。標準偏差=√不偏分散です。
この順序を「合計→平均→偏差平方和→分散→標準偏差」と覚えておくと、計算問題をスムーズに解くことができます。
CBT試験での電卓の使い方
QC検定3級はCBT方式(コンピュータを使った試験)で実施されており、電卓の持ち込みは認められていません。試験では、テストセンターのパソコンに搭載されている電卓機能を使用します。
パソコンの電卓は、普段使い慣れた電卓とは操作感が異なる場合があります。特に偏差平方和の計算では、x²の合計を求める際にメモリ機能を活用すると便利です。各データを二乗した値をメモリに加算していき、最後にメモリの値を呼び出すことで、x²の合計を効率的に求められます。
試験前に、Windowsの電卓アプリなどで操作方法を確認し、計算練習をしておくことをおすすめします。CBT試験では時間配分も重要ですので、電卓操作に慣れておくことで、計算ミスを減らし、解答時間を短縮できます。
まとめ|基本統計量を得点源にしよう
本記事では、QC検定3級で出題される基本統計量について解説しました。最後に、試験対策として押さえておきたいポイントを整理します。
基本統計量は、平均値、メディアン、範囲、偏差平方和、不偏分散、標準偏差の6つです。平均値とメディアンはデータの中心を表し、範囲、分散、標準偏差はデータのばらつきを表します。
計算の順序は「合計→平均→偏差平方和→分散→標準偏差」です。この順序を覚えておけば、計算問題をスムーズに解くことができます。特に、偏差平方和の計算式「x²の合計-(xの合計)²÷n」と、不偏分散でn-1で割る理由は、試験で頻出のポイントです。
CBT試験ではテストセンターのパソコン電卓を使用するため、事前にパソコンの電卓操作に慣れておくことも大切です。基本統計量の計算問題は、正しく理解すれば確実に得点できる分野です。本記事の内容を復習し、計算練習を重ねて、試験本番に備えてください。
