製品進化とマネジメント風景 第123話 信頼性向上のマネジメント
製品の信頼性とは、「部品、モジュール、システムなどのアイテムが、その機能を与えられた条件の下で与えられた期間、遂行できる能力」と定義されています。その意味は明確ですが、耐久性が求められる製品の信頼性を正しく評価する行為は、時代が進むにつれてどんどん難しくなっていると考えます。
なぜか? 以下、それについて少し議論を深めます。
信頼性の定義から分かることですが、『信頼性の評価』を行うためには、実際に製品を実運用環境において、故障するまで運転試験を実施しなければなりません。これは開発者の立場から見るとかなり重たい話です。
時代の進展とともに製品には新たな差別化が求められます。その1つの要素に耐久性がありますが、耐久性が伸びるということは、信頼性を評価するための試験時間がより延びるということを意味します。
それは製品開発期間の増大をもたらし、製品事業の投資効率を悪化させます。耐久性以外で差別化できる製品ならば良いですが、大抵のユーザーはメンテナンス無しで長い耐久性を持つ製品を求めるものです。よって、顧客要求に応えつつ、製品事業の投資効率をも高めるためには、信頼性の評価において工夫が必要です。工夫の1つは耐久試験を何らかの形で加速するというアイデアです。いわゆる加速試験です。
加速試験というアイデアは非常に魅力的であり、適切に設定すれば開発期間を短縮し、事業の投資効率を向上できます。しかし、その設定を誤ると、実運用とは異なる部分が故障する、あるいは、実運用時とは異なる故障モードが生じるということになってしまい、加速試験の本来の意味が失われます。誤った加速試験に合格したからと言って製品を市場に出し、想定外の故障で重大事故が発生してしまった場合、会社は強い社会的非難を受けることになるでしょう。
信頼性の評価についてはもう1つ難しい課題があります。それは、信頼性を適切に評価するために、何台の製品を使って試験を実施する必要があるのかという問題です。JIS規格の中で議論され、ある種の機器については一定の結論が出ています。しかし、製品事業の投資効率をさらに高めたいと考え始めると、試験台数を減らしたくなります。さらに、故障するまで試験を実施という考え方を変え、ある時間まで試験を実施し、故障しなければ試験を打ち切りたいとも考えたくなります。
経営者の視点から見ればその要求は当然なのですが、本来、大量生産する製品の信頼性を評価するには一定数の実証が必要です。最低限の数字として、4~10というのが1つの相場ですが、そこまで減らすことは、結局の所、何らかの仮定に基づいて信頼性が高く見えるようにしているだけとも言えます。仮定が正しい場合には、現実に高い信頼性が得られるでしょう。しかし、仮定に誤りがあれば、見せかけだけの信頼性ということになってしまいます。そうなると、信頼性が高いはずなのに、頻繁に故障を起こす製品ができてしまうことになってしまうわけです。
このように製品の信頼性の評価は悩ましいものですが、これとは別にもう1つ考えておかなければならない事があります。むしろ、こちらの方がより重い課題かもしれません。それは、どんなに信頼性が高い製品であっても、その製品が故障した時に、人命に影響するような重大事故に発展してはならないことです。別の表現をすると、『信頼性と安全性の両立』という課題です。
以上、信頼性に絡んで2つの大きな課題があることをご理解いただけたでしょう。以降は、これら2つの課題について議論し、対処するための方向性を検討していきます。
まず、『信頼性の評価』について考えましょう。開発期間を短縮するには、適正な加速試験方法を考案するのが王道です。そのためには、製品(システム、モジュール、部品、素材)の故障モードを適切に把握していなければなりません。なぜなら、故障モードが分かれば、その故障の発生を加速する条件が見えてくるからです。
設計段階において故障モードを色々と考えるのは大切です。なぜなら、現実に起こる問題のどこまでを人間の頭で予想できるのか、その範囲と限界を認識できるからです。ほとんどの場合、現実は人間の予想を超えて発生しますが、予想することは無駄ではありません。
現実と予想を比較することにより、どこに抜けもれがあったかを知り、なぜ、抜けもれが生じたかを掘り下げていけば、現実を予想できなかった真の原因に辿りつけるからです。原因には技術的な理由もありますが、組織的な理由の方が多いでしょう。
真の原因に辿りついて見通しが良くなれば、顕在化した故障だけでなく、まだ顕在化していない潜在的な故障モードの存在にも気づくことができるようになります。顧客要求が高度化し、その結果、潜在的な故障モードの発生確率がいよいよ高まってきたならば、その時にはそのモードを加速させる試験条件を明らかにし、それを試験に組み込めば良いのです。
『信頼性の評価』の話は一旦ここで止めて、次の『信頼性と安全性の両立』の話に移ります。信頼性と安全性の両立を求められる製品において適用される代表的な考え方は、故障が発生した時に起きる事態の深刻度(リスク)に応じてクラス分けを行うという考え方です。このようなクラス分けをする代表的な産業として、航空機産業と医療機器産業があります。クラスの数は産業に依りますが大雑把には以下の3つです。
第1のクラスは、故障が発生してもその影響は軽微であり、継続使用しても安全性には影響を及ぼさないものが対象です。
第2のクラスは、故障が発生してもすぐには危険な状態を引き起こさないものの、時間の経過とともにそのリスクが上昇していくので、きりの良い所で運用を止め、事後保全が必要なものが対象です。
第3のクラスは、故障の発生が製品自体を危険な状態にするため、製品を速やかに停止する必要があるのですが、製品を停止することにより提供していた機能がなくなると、今度は別の重大な危険を生み出す可能性が出てくるという、そういうものが対象です。厄介な対象ですが、これからの時代はこの種のものが増えてくると予想しています。
第1のクラスについては、故障しても影響が軽微なので、ユーザーが故障の発生を認知できる必要はありますが、製品運用の安全性に影響しないので、修理等の保全をするか否かはユーザーに任せておけば問題ありません。このクラスに属する製品であれば、製品を売りっぱなしにできます。
第1のクラスの代表例はエアコンです。エアコンが故障すれば不快な時間を過ごさなければならなくなりますが、致命的な状況になるとは言えません。よって、壊れる前に交換するという人がいる一方で、壊れるまで使うという人もいます。
私の経験の範囲では、使用頻度の高い部屋のエアコンはだいたい10年で壊れます。一方、使用頻度の低い部屋のエアコンはその倍の期間を使用しても壊れません。よって、壊れるまで使うという考え方も一理あるわけです。
第2のクラスについては、故障が発生してもすぐには危険な状態に陥りませんが、放置しておくといずれ重大事故につながる可能性があるため、事故を避けるには、故障をタイムリーに発見できることが求められます。昔ながらの定期点検でも良いし、IoTを利用する手もあります。どちらにしても、故障の発生を確実に発見し、予防保全できることが重要です。そのためには、故障モードが明らかであるだけでなく、その故障モードを確実に発見する検査手法をセットで保持していなければなりません。
第2のクラスに相当する製品の代表例はエレベータです。詳しくは述べませんが、エレベータは、各階に停止するための機構部分にフェールセーフ構造を適用しています。エレベータの停止には、電磁弁とブレーキディスクの2つの要素が関与します。電磁弁が故障しても、ブレーキディスクの摩擦力が十分にある間は事故が起こりません。よって、電磁弁の故障が発生したら、速やかにそれに気付いて保全すれば安全を保てます。一方、電磁弁の故障に気付かずにいると、いずれブレーキディスクの摩擦力が低下し、エレベータは各階で停止したつもりでも自然に上に上がってしまい、人身事故が起きる可能性が出てきます。
実際、この種のエレベータ事故は過去に何回も発生しています。点検業者が点検時に電磁弁の故障に気付かなかった事が主要因ということになるのでしょうが、見方を変えると、ビルの管理者が、点検業者における故障発見能力の有無を見抜けたならば事故は回避できたはずだということです。事故が起きると関係者全員が不幸になるので、第2のクラスでは、放置は許されず、信頼性と安全性を両立させるために予防保全が重要な要素になります。
第3のクラスでは、故障の発生が重大事故を誘発するため、設計段階において冗長性を持たせておく必要があります。しかし、それは最悪の状況における最後の備えであり、その前段階として、故障が発生する前に予兆を検知して予防保全するのが賢い対応です。
第2のクラス、第3のクラスにおいて『信頼性と安全性を両立』するためには、予防保全が重要な要素であることが分かったので、次はその話に移ります。
予防保全は大きく2つに分類できます。最も一般的なのは、製品の使用時間あるいは使用サイクル数が規定に達したら保全するタイプです。いわゆる定期点検をするものと言えばわかりやすいでしょう。もう1つは、状態監視を行いながら故障の予兆を検知し、故障する前にタイムリーに保全するタイプです。
時間やサイクル数で保全するタイプは、通常、保守的なクライテリアで部品を交換する、あるいは修理を行う形で信頼性と安全性の両立を図ります。その製品を常に高負荷で運用したユーザーから見れば、製品をぎりぎりの所まで使った後に保全を行うので不満はありません。一方、製品に軽い負荷しか掛けないで運用していたユーザーの中には、「たしかに時間やサイクル数は消費したが、まだ保全せずに使い続けられるのではないか」と不満を持つ人もいるでしょう。
このような不満、ニーズがあるので、今日ではIoTによる状態監視を行い、これ以上使用すると不安全リスクが急上昇するという所で保全を行うサービスを提供する製品が増えてきました。こうすれば、前述の不満ユーザーも納得します。
以前は状態監視のためのIoT化に相応の費用が掛かったので、1つ1つの部品が高額な製品にしか適用されませんでした。しかし、今日ではセンサや通信機能を司る部品が半導体化され、微細化と量産効果によりそのコストが下がったため、適用されるすそ野は急速に広がりつつあります。
ただし、これに付随して新たな課題が出てきました。それは、状態監視をする機能の故障です。状態監視をする機能が頻繁に故障するようであれば困ります。基本的に、監視対象である本体よりも高い耐久性と信頼性を持つことが求められます。
しかし、予防保全が必要となる対象製品は、耐熱性が優れているとか、強い衝撃に耐えるといった特性を持つもの等、過酷な環境で使われるものが多いものです。そのような過酷な環境において、対象製品よりも長い期間、適切に状態監視を行わなければならないのですから、監視機器については工夫をしなければなりません。これからの時代の課題の1つと言えましょう。
さて、『信頼性と安全性を両立する』ための予防保全について述べてきましたが、高い精度で予防保全できる製品は実は限られます。なぜでしょうか? 現実に発生する故障は、大抵の場合、人間が設計時にした予想を超えるものになるからです。よって、実際の運用で発生した故障データをたくさん収集し、それを分析した後でないと、有効な予防保全を打てないのです。
つまり、既に長期間運用し、しかも故障のデータを丹念に収集してきた製品にしか、本当に有効な予防保全はできないということなのです。従来にない機能を持つ新製品では、残念ながら、どんなに頑張ってもあまり良い精度の予測はできないし、出てきた予測を信じてはいけないということです。
日本には長期間運用してきた製品がたくさんあり、ビジネスチャンスもたくさんあります。一例は高度成長時代に整備した社会インフラ製品です。老朽化が進んでいるので、放置すればいずれ事故が発生するでしょう。しかし、状態監視による予防保全を上手に行えば、その寿命を大幅に伸ばすことができます。状態監視をAIと組み合わせれば、人間が直に監視するよりもずっと確度の高いシステムにすることができるでしょう。
先進国を中心に人口は減っていくと予想されています。結果として人手不足が深刻になり、老朽化したインフラ保守に手が回らなくなることは目に見えています。日本だけでなく、先進国全体にビジネスチャンスがあるということを意味しているのではないでしょうか?