カイゼンベース / KAIZEN BASE

ヒストグラムとは?標準偏差と工程能力指数の活用法

ヒストグラムのイメージ
カイゼンベース運営事務局

カイゼンベース運営事務局

メディア運営、メルマガ配信等

2015年に活動をスタートしたカイゼンベース。世界一のカイゼン情報メディアを目指し、日々コンテンツ・記事の拡充やブラッシュアップを行なっています。

プロフィールはこちら

ヒストグラムとは

ヒストグラムとは

ヒストグラムとは、測定データが存在する範囲を、いくつかの区間に分けて積上げたもので、工程のバラツキ状態を視覚的に見るための手法です。
本ページでは、ヒストグラムの作成方法に加え、バラツキを表す標準偏差の考え方や計算方法、工程の安定度を示す工程能力指数について解説しています。

ヒストグラムは、このイメージ図のように表され、規格幅に対して、データのバラツキはどのくらいになっているか等を視覚的に確認することができます。

ヒストグラムは、山が鋭く高い場合は、バラツキが少ないことを示しており、山がなだらかで低い場合は、バラツキが大きいことを示しています。

分析のポイントとしては、データのバラツキの全体像を掴み、分布の形を確認することが挙げられます。例えば、離れ小島型、二山形、絶壁型等です。
また、規格値と比較する際には、工程能力指数から工程の状態を数値化することも有効です。

ヒストグラムとは

ヒストグラムの見方

それでは次に、ヒストグラムの見方について確認しましょう。

ヒストグラムの形を見る

ヒストグラムの一般型は、このような左右対称に近い形の分布です。工程が管理された状態のときには、このような分布になります。

一般型以外の分布にはどのようなものがあるのでしょうか。いくつか確認してみましょう。

まずは、離れ小島型です。
右端あるいは左端に離れた小島状のデータがあるのが特徴です。測定ミス等の異常値がある場合に現れる分布となります。
離れ小島の分布になった場合には、データの中身を調べ、異常値を取り除くという作業を行なうことが必要です。

次に、歯抜け型です。
測定のまずさや、区間分けの方法が良くない時などに現れる分布です。
歯抜け型の分布が表れた場合には、測定方法、区間分けの見直しを行なうようにしましょう。

ヒストグラムの見方

偏りが出た場合はデータを再度層別する

次に、二山型、高原型です。
二山型は、中央付近の度数が少なく、左右に山が出来る分布です。
高原型は、各区間の度数があまり変わらない高原のような分布です。
これらの分布は、平均値の異なる2つの分布が混ざったデータを使用する時に現れます。

このような分布が発生した場合には、データを再度層別することが必要です。

偏りが出た場合はデータを再度層別する

実務では左右対称でない場合も多い

続いては、裾引型と絶壁型です。
裾引型は、左右非対称でどちらかに片寄った山が出来る分布です。
絶壁型は、片側が絶壁のようになっている分布です。
規格値を飛び出したものがあり、その部分を選別して取り除いた時等に現れます。

これらの分布が発生した場合には、規格で制限されたデータや外されたデータを測定する等、再度状態を確認することが必要です。

ヒストグラムを作成する際には、左右対称の一般型が現れないことも多々あります。
これらの分布の特徴を覚えておき、対象としているデータの状態が適正か確認することが大切です。

実務では左右対称でない場合も多い

ヒストグラムの作り方

それでは次に、ヒストグラムの作り方について確認していきます。

ヒストグラムの作成手順1

ヒストグラム作成の手順1、データ(計量値)の収集です。
今回は事例として、ある製品のサイクルタイムを100回取得したデータを使用します。

手順1 データ(計量値)の収集

ヒストグラムの作成手順2~4

手順2では、データの最大値と最小値を求めます。
今回の場合では、最大値が50.3、最小値が45.5です。

手順3では、区間の数を求めます。今回の場合には、データ数 Nは100個なので、100のルートを取り、10個の区間となります。

手順4では、区間の幅 hを求めます。区間の幅 hは、最大値から最小値を引いたものを区間数で割り、今回の場合は、約0.5となります。

手順2~4

ヒストグラムの作成手順5

手順5では、区間の境界値を求めます。
区間の境界値は、測定単位の二分の一の所にくるように決めます。
今回の場合、第一区間の下側境界値は45.45、上側境界値は45.95、中心値は45.70となります。

この計算は、同様に全区間にて行ないます。

手順5 区間の境界値を求める

ヒストグラムの作成手順6

手順6では、データの度数をカウントし、度数表を作成します。
度数表は、区間、中心値、度数チェック、度数の項目が必要となり、ここに示しているようなイメージで作成します。
なお、度数とは、その区間に当てはまる数のことを指します。

手順6 データの度数をカウントし、度数表を作成する

ヒストグラムの作成手順7

手順7では、いよいよヒストグラムを作成します。
右側に示すように作成し、データ数Nや平均値xバー(エックスバーと音声合成する)、標準偏差σ(シグマ)等の必要事項を記入します。標準偏差については後ほど説明します。

以上がヒストグラムの作成手順となります。
1つ1つ手順を踏んで作成していけば、それほど難しくはないですよね。

手順7 ヒストグラムを作成

平均値と標準偏差

それでは次に、平均値と標準偏差について確認をします。

実務で大事な2つの統計量

データの統計処理にとって最も重要な2つの統計量は何だと思いますか?

実務においては、平均値と標準偏差の2つだけ覚えておけばよいといっても過言ではありません。

標準偏差とは、データの平均値の周辺に、どのくらいデータが散らばっているかを表す統計量のことです。

もう少し詳しく確認してみましょう。

データの統計処理にとって最も重要な2つの統計量

ヒストグラムと平均値

ヒストグラムにおける平均値の役割

ヒストグラムにおける平均値の役割は、やじろべえの支点と同じです。
山の広さがどうであれ、バランスを取る位置が平均値なのです。

平均値だけでは十分でない

つまり、平均値とは、データの中から特徴の1つだけを取り出したものに過ぎないのです。

例えば、このようなバラツキがあるデータ群があったと仮定します。

横軸が製品の大きさであった時、平均値だけでは、データの状態を表すのに十分でないことは、感覚的に分かりますよね?

平均値とは、データの中から特徴の1つだけを取り出したものに過ぎない!

データの特徴が異なる

なぜならば、このようなバラツキのデータ群であった場合でも、平均値は一緒ですが、データの特徴は全然違うということが起こってしまうからです。

平均値は一緒、でもデータの特性は全然違います!

最大値と最小値で比較?

つまり、データの特徴を表す場合、平均値だけではなく、バラツキ度合いの違いは無視できないものなのです。

ではこのバラツキ度合いはどのように比較したらよいでしょうか。

すぐに思いつく方法として、バラツキを最大値と最小値で比較するやり方があります。
ただし、これは必ずしも正しくない場合があります。なぜでしょうか?

バラツキは、最大値と最小値で比較?

なぜならば、このような場合だと、同じバラツキ度合いであるにもかかわらず、数点のデータに影響されてしまい、数値が大きく異なってしまうのです。

同じ程度のバラツキなのに、数字が大きく変わってしまう

標準偏差はバラツキ度合いを表す便利な統計量

そこで必要となるのが標準偏差なのです。
標準偏差というものは、このバラツキ度合いを1つの数字で表すことができる便利な統計量となります。

そこで必要となるのが標準偏差

データに偏りがなく均一にバラついている場合、左右対称の山のようなヒストグラムが出来ることは既に確認をしました。

その際、山が鋭く高い場合は、バラツキが小さく、標準偏差が小さい分布となり、

そして、山が平らで低い場合は、バラツキが大きく、標準偏差が大きい分布となるという特徴があるのです。

バラツキを数値化する標準偏差

実務で役立つ標準偏差の数字

なお、標準偏差は次の数字が実務上役立ちますので覚えておきましょう。

データが左右対称の分布の場合、標準偏差1個分(±σ)には全体の約70%のデータが入ります。つまり、この区間の中に、7割の確率でデータが入ることを意味しています。

標準偏差1個分(±σ)には全体の約70%のデータが入る

更に、標準偏差2個分(±2σ) には、約95%のデータが入ります。

逆に言うと、この区間から外れるデータも5%の確率であり得るということです。

標準偏差2個分(±2σ) には、約95%のデータが入る

そして、標準偏差3個分(±3σ)には、約99.73%のデータが入ります。

つまり、この区間から外れるのは1000回中3回程度となります。
品質管理においては、バラツキの実力値である工程能力を表す際、この3σという数字を使用します。
バラツキの代表値である3σが、規格にどのくらい収まっているのかが重要な視点の1つとなるのです。

標準偏差3個分(±3σ)には、約99.73%のデータが入る

確実に覚えておこう!

まとめると、平均値は、バラツキのあるデータを代表する1つの数字であり、標準偏差は、その平均値からどのくらいバラツキを持っていたかを示す数字です。

標準偏差のポイントとなる基準ラインは次の通りです。

標準偏差1個分(±σ)では、約70%の確率でデータが分布します。30%は外れるということです。
標準偏差2個分(±2σ)では、約95%の確率でデータが分布します。5%しか外れないということです。
標準偏差3個分(±3σ)では、約99.7%の確率でデータが分布します。0.3%しか外れないということです。

これらの基準が、不良対策、ロス対策の際の結果判断に活用されていることを覚えておきましょう。

標準偏差のポイントとなる基準ライン

規格値との比較

それでは次に、規格値との比較について確認します。

ヒストグラムで状態を見てアクションを起こす

一般に、工程が安定している時は、このように、規格の幅に対してバラツキの幅に十分余裕がある状態です。
この場合には、この状態が継続するように維持管理を行います。

一方、工程が安定していない時にはどのような状態になっているでしょうか。
いくつか確認してみましょう。

まずは、両側に余裕がない状態です。
規格の幅に対してバラツキの幅が大きいため、少しの変化ですぐに不具合が発生してしまいます。
この場合には、バラツキを低減させる取り組みが必要となります。

次に、片側に余裕がない状態です。
規格の幅に対してバラツキはさほど大きくはないものの、どちらか片方に偏っており余裕がない状態となります。
この場合には、平均値を下げる、あるいはバラツキをもっと小さくすることで余裕をつくる取り組みが必要です。

最後に、規格を超えた異常状態です。
バラツキの大きさ、平均値の位置いずれも規格から逸脱しており、早急に対策が必要となります。

規格値との比較

工程能力指数とは

それでは次に、工程能力指数について確認します。

工程の品質の安定性を評価する実務的な指標

規格値に対するバラツキは、ヒストグラムの見た目だけなく、「工程能力指数」により判断が可能です。

工程能力指数Cpとは、製品特性値の「平均値」と「製品のバラツキ(標準偏差)σ」が、「合否の基準となる規格の上限と下限」と比較して、どの程度余裕があるか定量的に把握する指数のことです。

工程能力指数は、工程の品質の安定性を評価する実務的な指標です。

工程能力指数とは

工程能力指数Cpの計算式

工程能力指数Cpの計算式はここに示す通りです。

規格上限値SUと規格下限値SLの幅に対して、3σの2倍である6σ(音声合成ではろくしぐまと読む)の幅がどのくらい余裕があるかを計算しています。
両側規格の場合、片側規格の場合とで計算式が異なるので注意が必要です。

工程能力指数Cpの計算式

工程能力指数Cpkの計算式

なお、実務では規格の中心と分布の平均が異なることがほとんどですが、その際には工程能力指数をCpkで表し、ここに示す計算式を使用します。

少し複雑なようにも見えますが、先ほどと同じように、平均値に対する規格の幅とバラツキの幅がどのくらいあるかを計算している式であることに変わりはありません。
該当する数字を1つずつ確実に当てはめて計算をするようにしましょう。

規格の中心と分布の平均が異なる場合

工程能力指数Cpの判断基準

なお、Cpの数値は1.00、1.33、1.67という基準で評価を行います。

1.67より大きい場合は、工程能力としては高いレベルです。

1.33から1.67の場合は、工程能力としては十分であり、今の状態の維持管理が必要です。一般に、工程能力は1.33以上を目指して改善を行います。

1.00から1.33の場合は、工程能力は十分とは言えません。1.33以上になるように改善を進めることが必要です。

1.00に満たない場合は、完全に工程能力不足です。工程改善に加え、再発防止対策を早急に行なうなどの対応が求められます。

一般的な判断基準

ヒストグラム、標準偏差、工程能力指数のまとめ

以上で学んだことをまとめてみましょう。

ヒストグラムとは?標準偏差とは?工程能力指数とは?

  • ヒストグラムは、測定データが存在する範囲をいくつかの区間に分けて積上げたもので、工程のバラツキ状態を視覚的に見るための手法
  • 山が鋭く高い場合はバラツキが少ない、山が低く広い場合はバラツキが大きいと判断する
  • 標準偏差とは、データの平均値の周辺に、どのくらいデータが散らばっているかを表す統計量のこと。データの統計処理においては、平均値と同じくらい重要な統計量
  • 工程能力指数Cpは、バラツキが規格値に対してどの程度余裕があるか定量的に把握する指数。品質管理や品質改善の際にとても有効なツール
  • お客様からの受注変動に追従した生産体制が、ジャストインタイムの理想であり、固定概念を捨てて、知恵と工夫を出し、そして諦めずに、少人化ラインの構築を目指していくことが大切

いかがでしたか?ヒストグラム、標準偏差、工程能力指数の意味は分かりましたか?
製造工程においては、バラツキが必ず発生します。バラツキの少ない安定した品質の製品を造るためには、このバラツキを正しく把握し管理していくことが欠かせません。
是非本ページで解説したヒストグラムや標準偏差、工程能力指数を使いこなせるようになっていきましょう!

関連学習動画

ページトップに戻る