〒186-0002
東京都国立市東2-21-3

TEL : 042-843-0268

製品進化とマネジメント風景 第103話 イメージセンシングの進化とその適用マネジメント

前回コラムの冒頭でも述べましたが、フランスの賢人ジャック・アタリは10年以上前に監視社会になることを予想していました。実際はどうなったかと言えば、その通りになってしまいました。今では建物の外側あちこちに監視カメラが設置されています。また、陸海空を移動する車、飛行機、船舶にもドライブレコーダが設置されるようになりました。

いずれ自転車、三輪車、車椅子はもちろん、歩行者についてさえも、その帽子や服に自然な形でカメラが装着され、スマホやクラウドに録画を保存する時代になるかもしれませんね。 これらはまず、小さな子供や高齢者が対象になるでしょう。

建物の内側はプライバシーの問題もあるので監視対象から外されていました。しかし、少しずつ広がりつつあります。例えば、駅の構内のような公共の建物の内部、企業の工場内、事務所の内部には監視カメラが設置されるようになりました。 

2010年代の中頃からは、刑事ドラマにおいても、道路や建屋の監視カメラ網の位置を研究し、それを潜り抜けて犯罪が行われるという設定が増え始めました。その時のオチは、道を走るタクシーやトラックに設置されたドライブレコーダが犯人を捕らえていて、それが証拠となって犯人のアリバイが崩れて自供に至るという筋書きです。

さて、イメージセンサという言葉を聞いて何を思い浮かべるでしょうか? 前述の話から、最初に出てくるのはカメラ用の光学イメージセンサだと思います。しかし、今日ではそれ以外のイメージセンサも使われるようになってきました。 

イメージセンサのバラエティが増えたのは用途が多様化したためです。昔ながらの用途は防犯監視ですが、それが事故防止、地形情報の入手、さらには現物の3次元形状の取得などにも広がったためです。 

防犯用途は事務所、工場に加えて一般家庭でも行われるようになりました。この用途ではカメラ画像が使われます。夜間の監視が必要な場合には赤外線カメラ、あるいは低照度イメージセンサを搭載したカメラが使用されます。昔は人がカメラ映像を見て監視するケースが多かったですが、今では動体認識用に学習されたAIプログラムが簡単に入手できるようになったので、それを使うのが普通になりました。 

次に挙げた事故防止の用途が求められるのは基本的に移動する製品です。陸上では自動車、空では航空機に加えてドローンがあります。近々、オートバイ、自転車や空飛ぶクルマも加わるかもしれません。海上では船舶です。これらの機械は金属から造られていて固く、しかもかなりの速度で移動するので、これらが人間に衝突すると、確実に人間が負けて怪我をします。事故防止が求められる所以です。 

その次に挙げた地形情報の入手は、以前は政府の仕事でしたが、最近ではビジネスになりそうだということで企業が参入しています。地図の作成で特に大変なのは台地の起伏の測量です。これは3次元地図の作成だけでなく、土木の分野でも必要とされていました。今日では、VR(バーチャルリアリティ)やAR(拡張現実)と組み合わせた様々なサービスにも使われはじめ、その結果、単なる起伏情報だけでは不十分となり、周辺の建屋や標識までもが取得され、仮想空間に設置されるようになってきました。 

最後に挙げた物体の3次元形状の取得ですが、これも幅広い用途があります。製造業ならば部品の寸法検査や部品の自動識別に使えます。建築業ならば、建屋内の室内データをコンピュータモデル化することにより、施工する前にARやVRを使って顧客に家やビルの内部を見てもらうことができます。家具業であれば、顧客が家具を購入する前に、その家具を部屋に設置した状況をARで確認してもらうことができます。さらにこれらのデータはゲームにも活用できます。 

映画『スターウォーズ』からスピンオフしたものの1つに『マンダロリアン』というドラマがあります。この中では、小型イメージセンサを内蔵した空飛ぶ球体ドローンが出てくるのですが、それが敵方の建屋に侵入し、建屋内を隈なく撮影して帰還し、その後、ホログラムで複雑な建屋内部の構造を映し出すという場面があります。これは今でも実現できそうな話です。軍事関連での用途がありそうですね。 

ここまでに述べた用途を考えると、カメラ用の光学イメージセンサだけでは不十分であり、ミリ波レーダーやレーザーレーダーも必要です。イメージセンサを選択する際の課題は、どれが最もコストパフォーマンスが優れているかという話になりますが、製品がベースとする技術によって、コストを下げやすいものと下げにくいものがあります。 

これは、製品を構成する技術の選択が、その後のコストダウンを左右するということを意味しています。以下では、カメラ、レーダー、レーザーレーダー(以後、Lidar)という3つのイメージセンシングを方法について、用途との相性やコストダウンのしやすさを中心に議論したいと思います。 

現在のカメラのイメージセンサとしては固体撮像素子、それもCMOS(Complementary  Metal Oxide Semiconductor)が主流であり、それを前提として話を進めます。固体撮像素子の機能を分類すると、光電変換、電荷蓄積、電圧変換および出力の4つとなります。 

光電変換の向上は感度を高めます。その代表的な方法は多層膜化です。光の干渉を利用することにより感度を高めるわけです。大雑把には薄くすると感度が上がりますが、単調増加ではなく、山谷があってちょうど良い厚みの時に感度が上がります。薄膜化が有効であるため、半導体の微細化技術との相性が良く、一方でCPU等のロジックICほどの微細化は不要であるため、製造技術の信頼性が高まった後に利用することができました。 これは2つの意味で低コスト化できることを示唆しています。

信頼性の高まった半導体製造技術を使うということは、その製造設備は先行用途で投資が回収されており、競合他社もいるでしょうから、かなり値引きした価格で買える可能性が高いということです。

もう1つは半導体全般に当てはまることですが、小型化すると1回の工程で製造できる数が増えるので低コスト化できることです。ただ、イメージセンサに関しては小さくすると、入ってくる光量を受ける面積が減るため、性能劣化を招く可能性があります。性能を維持して小型化するには何か工夫が必要になるということです。

「センサ部の面積が小さくなると入射する光量が減る」と言いましたが、それは、真っすぐに入ってくる光を捕らえることを前提にした考え方です。もし、斜めから入ってくる光を捕らえ、それを真っすぐに入ってきた光と一緒にしてセンシングできるようにすれば、小型化しても以前と同等の性能を維持できます。

それを実現する工夫がマイクロレンズを何枚も重ねるというアイデアでした。この工夫によって光量は増えたのですが、クロストークと呼ばれる余計な光も入ってくるようになってしまいました。これが受感部にはノイズとなり、画像の品質を悪化させるのです。これを防ぐため、受感部と受感部の間に溝をつくり、その溝を絶縁体で埋める工夫がされ、これによってノイズを減らすことができました。これらは微細化技術があればこそ実現できたのです。 

なお、さらに光量が減ってきた時の対応は前回コラムで述べましたが、複数の素子を1つの素子と見なすことで受感部の面積を増やすことで光量を増やします。Quad-Bayer方式やTetra-pixel方式などと呼ばれます。この方法は光量を増やせるが解像度が低下するという欠点があります。 

このように小型化して安くなった光学イメージセンサはスマートフォンやウェブカメラへの適用に留まらず、ドライブレコーダや自動ブレーキ用のセンサにも使われるようになりました。特に自動ブレーキ用のセンサは交通事故の数を減らす効果があり、社会的にも有用な製品と認められています。 

自動ブレーキ用のイメージセンサは当初、単眼の光学センサが適用されました。その特性から昼間は得意でしたが夜間は苦手でした。イスラエルの企業が圧倒的に強く、日本企業はしばらくの間、歯が立ちませんでした。ただ、最近、状況が変わりつつあります。昼間だけでなく、夜間の能力が重視されるようになってきたからです。 

単眼カメラの弱点は距離感を把握しにくい点です。車速と画像サイズの関係性から計算して算出することはできますがあまり精度が良くありません。そこで人間と同じく2つの目を持つステレオカメラが使われるようになりました。カメラについては車外だけでなく、車内において運転手の眠気モニターにも使われるようになりました。 

しかし、夜間にはライトが当たっていない部分が見えないため、どうしても昼間のような正確さは得られず、飛び出しに対する見落としが起こります。そこで、単眼カメラとミリ波レーダーあるいはLidar(レーザーレーダー)を組み合わせて夜間の安全性を高める方法が標準になりつつあります。 

車載のカメラはウェブカメラと同様に安くなりました。低照度のイメージセンサが入ったものでも1万円かかりません(もちろん、高性能のより高価なものもあります)。ミリ波レーダーも半導体との相性が良く、アンテナを含めて数万円です。これに対して車載用Lidarは3次元探知が必要なので安くても50~100万円超です。今はまだ高級車にしか搭載されていません。 

Lidarは前方だけでなく、その気になれば側方や後方の車を探知可能であり、さらに周辺の建屋などのデータを取得することができます。ただ、値段が高い割に大きな欠点があります。それは、進行方向に対する距離の計測精度は高いのですが、横方向の計測精度が悪いことです。道路を横断する人などは横方向の動きをするので、カメラの方が探知能力は優れています。 

以上から単純に安全性のツールとして考えるならば、Lidarはコストパフォーマンスがカメラに対して劣ります。しかし、道路の周辺情報をデータ化できる点は今後色々と役に立ちそうです。既に利用されているのはゲームへの応用です。例えば、エアロバイク用VRソフトウェアでは、パリ、ロンドン、ニューヨーク、東京などの道路とその周辺建物が再現され、その中を走れる設定となっています。世界中の自転車乗りと一緒に走るので飽きが来ず、運動不足の解消に役立ちます。他の用途にも使えるでしょうから、実はコストパフォーマンスが優れているのかもしれません。 

Lidarは航空機に搭載して精度の良い地形情報の取得、あるいはハヤブサなどの宇宙船に搭載して星に着陸する際の情報取得などに使われています。身近な例では歯や部品の正確な寸法情報の取得にも使われます。精度の良いものでは数百万円から1千万円を超えるので、単価の高いビジネスにしか適用できません。 

精度が少々悪くても良いならば、i-phoneに搭載された廉価Lidarが役に立つようです。土木、建築や家具業界ではスマホ搭載Lidarで得た建物内部や家具のデータを使って顧客価値を高めるサービスに提供しはじめました。 

イメージセンサを応用した製品のすべてに言えることは、センサ情報と学習されたAIを組み合わせることで顧客価値を高めようとしていることです。 

顔認証の世界では、日本企業が数年間連続して世界トップを維持しています。その方法の概略を述べると、単に2次元写真データだけで判断するのではなく、2次元写真データから3次元顔モデルを作成し、下向き、横向きになる状況や喜怒哀楽の表情を浮かべた時の状況も作成し、それを再度、2次元写真画像に戻し、これらのデータを学習することで探知精度を高めています。 

この手法は一種の敵対的生成ネットーワーク(GAN)と呼ばれています。この方法によって質の高い学習データを自動で大量生成できるようになり、AIの検知能力を高めました。詳しくは述べませんが、GANのアウトプットは本物を参考にした架空の偽物であるにも関わらず、その根本的な原理から、本物か偽物かを見分けられないものを作り出します。仏教の教えのとおり、良いモノと悪いモノは一緒にやってくるということなのだと思います。 

画像だけから、あるいは音声だけから本物と偽物の見分けがまったく付かなくなる日はすぐ来ると予想されます。多要素認証ではありませんが、複数の認証情報を組み合わせて見分ける、あるいは聞き分けることになるでしょう。しかし、それらもいずれ模倣され、識別できなくなる日が来ると思います。その時には昔に戻って本人と面談する、本物を触るなど、効率が悪いとされる昔ながらの行為に戻っていくのではないでしょうか。先人の知恵の1つである「三現主義」は、本物と偽物の見分けがつかなくなるデジタル時代を生きていくために重要な最終ツールになりそうですね。