製品進化とマネジメント風景 第105話 生成AIの進化と著作権マネジメント
生成AIの話題が花盛りです。ChatGPTは、テキストを通してもの知りの人と会話をするように質疑ができるので、従来の検索エンジンよりも使い勝手が良いと言えます。従来の検索タイプのサービスがこれに置き換わるのは時間の問題でしょう。
2022年には、テキストを入れるだけで静止画を作り出す画像生成AIが出てきました。用途としてテキスト型の方が需要は多いでしょうが、テキストを入力するだけで非常にリアリティのある静止画を作れるようになったことは驚きであり、瞬く間に世界中に広がりました。
この事が生成AIの応用範囲の広さを知らしめ、多くの企業が自社ビジネスへの適用を考え始めました。クリエイティブ事業の分野では、写真、イラスト、漫画、音楽、映画、脚本などへの応用が検討されています。他業界でもすでに法律、医学、建築への応用が進んでいます。ソフトウェア産業においても、GitHubコパイロットのような生成AIが現れ、このサービスを利用をする企業が現れました。
今後は、新しい材料や化合物の探索から、製品の設計・解析、さらには製品の製造・組立・試験、試験データの解析・評価まで、多くのことが生成AIによって自動化されていくことでしょう。しかし、懸念もあります。人間が生成する資料や著作物よりも1桁、2桁多い量の著作物がAIにより生成され、それらが普及するようになれば、巷で言われているように職を失う人と恐れる人が現れ、ラッダイト運動のような反対運動が生じる可能性があるからです。
今、顕在化しているのは著作権上の問題です。そこで、今回のコラムは生成AIに関連する著者権問題を中心に議論していきます。
当社は法律を専門とする企業ではありません。とは言え、どのようなビジネスも法律的な基礎知識なしには経営はできません。生成AIは殆どのビジネスに影響を及ぼすと予想されるので、日本だけでなく世界の法律界の動きについてある程度は知っておく必要があります。
以下の内容は、法律専門家の著作物(参考文献参照)を読み、事業者の視点で咀嚼して整理したものです。必要なポイントはカバーしたと考えていますが、生成AIの著作権については専門家の間でも意見の対立がいくつかありました。
本コラムは全体像を知る上で有用な読み物になることを考えて書きました。参考になれば幸いです。ただし、実務に適用する際には、自社の法律専門家に必ずご相談いただきたいと思います。
生成AIが作成した画像の著作権については、基本的な問いが少なくとも3つあります。第1は、生成AIを使って出力されたものに著作権が付与されるのかどうか、また、その著作権は誰のものになるかです。
第2は、生成AIが他者の著作物を機械学習するという行為が、他者の著作権を侵害するか否かであり、第3は、他者の著作物を学習した生成AIを使って出力したものが他者の著作権を侵害するか否かです。これらの問いは、法律の専門家でなくても思いつく話です。
第1の問題に対しては、かなりの部分について米国で司法判断が出ました。「生成AIの出力に対して、仮に著作権が認められた場合、誰が著作権者になるのか?」という問いについては非常に明確です。
著作権は人間だけに付与されるものであり、生成AIには著作権が与えられないことが確認されました。これは米国の法律に沿った内容です。日本の法律は、直接的に著作権者は人間だけに限定はしていないのですが、付帯条件を考慮すると人間だけが対象になると考えられています。
一方、英国の法律ではAIにも著作権があるとされます。ただし、著作権者になれるのは人間だけで、AIの著作権を獲得する作業を引き受ける人が著作権者になるとされており、日米とは少し異なります。ただ、米国の判例は、確実に世界各国の司法判断に影響するでしょう。
「生成AIにより生成された出力に著作権が発生するのか?」という問いへの回答は少し複雑です。日本の法律では、生成AIを完全な道具として使い、人間の創作意図や創作的寄与が見てとれる出力であれば著作権が発生すると考えるようです。米国でもそういう考えはあるようですが、2019~2023年に出された米著作権局や米法廷での判決はこれとは異なるものでした。
テキストから画像を生成するAIでは、最初にプロンプトの所にテキストを入力するため、入力する内容をプロンプトとか呪文と呼びます。
米国の判決では、「生成AIにテキスト入力して出力した画像」には著作権はないとされました。その一番の理由は、「生成AIはランダム性の影響を強く受け、同じ呪文を入力しても同じ結果が得られない。つまり、人間は生成AIを道具として完全に制御していないから」というものでした。
AIのランダム性については、私自身、画像を識別する簡単なAIを作成していて気付きましたが、同じデータを同じプログラムを入力して学習させ、同じ収束条件を課しても、最後に出てくるAIモデルは毎回、少しずつ異なるものになるのです。
上手に制御すればその差を抑えることが出来ますが、何も考えずに作成するとかなり大きなばらつきが発生します。ここが、工学で多用される流体力学や構造力学などで使われる従来の科学計算モデルと大きく異なる点です。
米国では、呪文が創作的であっても、人間が生成AIを完全に制御していない以上、画像を作成したのは人間ではなくAIであり、AIには著作権は付与されないので著作権は発生しないという判決となりました。
日本の法律家の中には、呪文が長くて創作的な内容であれば、呪文に対する著作権はもちろんとして、それで生成された画像にも著作権が認められる可能性もあるのではないかと指摘する人もいます。例えば、陶器の製作を例にあげ、釉(うわぐすり)が同じでも、釜の中の温度分布の違いにより、同じものが出来ず、そのため、出てきたものの中から選択をしており、あえて偶然性を利用しているという主張もあります。
芸術性の創作に関して、偶然性の利用について日米間で若干の差があるのかもしれません。ただ、陶器の話に限っていえば、釜の中の温度履歴を計測してこれを制御すれば再現性を高められますし、そもそも釜の温度履歴を制御できる構造に変えれば、やはり再現性を高められます。よって、上記の議論は科学的には少しおかしいかもしれないなと感じています。
同じ文脈で考えると、生成AIがブラックボックスでなくなり、人間がかなりの程度まで制御できるようになれば、人のあつかう道具になるので、著作権が認められる可能性が出てくるのかもしれません。
第2の問いに移ります。生成AIは大量のデータを学習する必要がありますが、そのデータには著作権のあるものとないものに分けられます。著作権のないものであれば学習しても問題ありません。一方、著作権のあるものを学習することについては、日本の法律は他国と少し異なります。
日米欧に共通するのは、個人的な利用だけで著作権のあるものを機械学習することは著作権の侵害にならないとしています。一方、事業化する場合には、欧米では著作権のあるものの学習に制限をかけようとしています。これに対して、日本の法律では、研究目的で学習するだけならば、著作権があるものでも学習して構わないとしているのです。それゆえ、日本は「機械学習の天国」という異名が付けられています。
もしかしたら日本は世界のトップを走っているのかもしれません。あるいは、世界の著作権者から猛反発を受けることになるのかもしれません。どちらになるかは予想がつきません。
ちなみに機械学習天国である日本でも、第3の問いである学習されたAIの出力については配慮しています。事業目的で出力した結果は、著作権侵害の対象になりえるとしています。ただ、ここには複雑な課題が含まれています。
例えば、出力された静止画がフランス印象派のモネの絵に似ていたとします。呪文にモネという言葉をインプットする、あるいは、生成AIの学習データがモネの絵画ばかりであれば、著作権侵害の可能性が高いとされています。ただし、これに対する反論も出ています。画風や画法は著作権の対象でないため、生成AIの出力は、モネの画風や画法を学習しただけであり、モネの絵画そのものを盗用したわけではないという主張があるからです。実際、描かれた題材、モチーフがモネの絵画にないものであれば、そういう主張が出てきそうです。
特定の画家の絵画データではなく、あらゆる画家の絵画を学習した生成AIの場合には、特定の誰かの絵の寄与は確実に減ります。しかし、学習データの中にその絵が入っている限り、絶対に盗用していないとも言い切れないという主張もあります。このように、ここには相当に面倒な話が含まれています。なんらか判断基準を設定しなければ、前に進めなくなりそうです。
従来、「これはモネ風だ」とか「これはゴッホ風だ」というのは人間の定性的な感覚で決められてきたと思います。上記の生成AIの問題を認識した上で前に進むためには、どこまでが画風や画法で、どこから先が著作権侵害の域になるのか、何らかの科学的な基準が必要になるように思われます。 以上が第3の問いへの回答です。
ここまでは画像の話を中心にしてきましたが、次は技術系企業にとって、また、製造系企業にとっても生産性向上への寄与度が高いソフトウェア(プログラム)における著作権の話に移ります。
プログラムの著作権については、マイクロソフト傘下のGitHubがプログラム作成支援AIサービス事業(GitHubコパイロット)を開始し、これに対して訴訟が起きました。原告は、「プログラムには著作権があり、これらのデータベースはあくまでも人間が学習するためのものであり、AIが学習することを想定していない。著作物を学習して使用するならば対価を払え」と言っているのです。
画像の著作権で検討した3つの問いを考えると、まず、1番目の問いは同じ答えになるので割愛しますが、2番目と3番目は画像の時よりも少し複雑になるため、論点を下記に整理しました。
GitHubに含まれるデータベースは、誰でも無料で使用できますが、著作権は明示されています。よって、「機械学習天国」である日本はともかくとしても欧米では学習さえも難しそうです。ただし、米国ではフェアユースという法律上の仕掛けがあり、著作物を公正に利用する場合には、著作権者の許諾がなくても著作物を利用することが可能です。日本にはない仕掛けですが、これは、私的利用だけでなく、事業目的でも他者の著作権物の無許可使用が認められる場合があるということです。
フェアユースに関する訴訟としては、Javaライセンスに関するGoogle社とOracle社の訴訟が有名です。詳しくは述べませんが、米国最高裁は2021年4月に本件に関し、著作物性の判断をせずにフェアユースのみ判断し、Google社のフェアユースが認められました。GitHubはこのJavaライセンスに比べるとずっと大規模な話であり、同様には扱えないかもしれませんが、認められないと決めつけることもできません。
仮に、GitHubのプログラム・データベースがフェアユース対象になれば、誰でもこのデータベースを無料で学習して良いということになります。深読みのしすぎかもしれませんが、マイクロソフトは、傘下企業の公開されたプログラム・データベースをフェアユースの対象にするためにあえて早期に有料サービスを開始し、これに反感を持つ人間に訴訟を起こさせ、早期に司法判断を出させようとしたのではないかと考えています。
公開された著作権付きプログラム・データベースについて、もし機械学習が許容されるようになれば、ソフトウェア産業の生産性は間違いなく大きく向上します。コパイロットを少しでも使えば実感できます。また、時代のニーズにもマッチしています。
一方、許容されない場合には、その国での生産性は伸び悩むでしょう。仮に、他国でこれを許可する国が出てきた場合、許容されない国は許容する国に遅れを取ることになります。
世界のNo.1であり続けたいと考える国であれば、司法もフェアユースを許すだろうという読みがあったのではないでしょうか。あるいは、裁判で敗訴したとしても、特許料のように売り上げの数パーセントを払えば済む話と考え、損害賠償リスクよりもサービスを開始しない事業リスクの方が圧倒的に大きいと考えたのかもしれません。
3番目の問いに対する回答も少し複雑です。まず、プログラムについては、そのアルゴリズムに新規性があれば、それは特許法で守られます。一方、その著作権については、プログラム上の表現がありきたりならば認められません。なんらかの表現上の個性が求められます。
故に、GitHubコパイロットが提示するプログラム案の殆どがありきたりの表現ならば、そこでは著作権問題は生じません。希には問題が生じる可能性がありますが、マイクロソフトはその影響を軽微だと考えているのかもしれません。ただ、気になるのは、その時に訴えられるのがマイクロソフトだけなのか、あるいはコパイロットを使ってソフトウェア開発をした企業も含まれるのかです。この点はとても気になりますね。
ソフトウェアの著作権問題、特許件問題については他にも興味深い話がありますが長くなるので割愛します。
日本は米国のような訴訟国家ではないため、司法判断が出るのが遅れがちです。訴訟が多くないことは良いことだと思いますが、一方で、それによって何か損をしているのではないかという気もしています。
「なぜだろうか」と考えて気付いたのですが、司法判断は、実は知財のデファクトスタンダードに似ています。要するに「早いもの勝ち」ということなのです。事業として有望だが法律的に複雑な問題が出てきたとき、それを裏でいくら精密に議論しても他国への影響はほとんどありません。しかし、実際の裁判で司法判断が示されると、それは世界中に広まり、確実に何らかの影響を与えます。
そういう意味で、「機械学習天国」と呼ばれる日本に固有の法律について、生成AIの学習とその営利目的での使用に関して、世界に先駆けて司法判断が示されれば、それが世界の司法判断の流れを作り出す可能性があると考えます。
マイクロソフトのGitHubの所でも少し述べましたが、生成AIを使う新しい事業分野においては、「戦略的に裁判を起こして司法判断を明示させる」という道があっても良いかもしれないなと考えはじめています。
争いを好まない日本では馴染みにくく、誤解を受けやすい意見であることは承知しています。しかし、成長を志向するならば、前例のない新しい事業領域、これまで想定していなかった事業領域に足を踏み入れることになるはずであり、必ず既存の法律で判断しにくい内容が含まれるものです。
そういう場合、じっくり待つという道もありますが、待っている間に市場が他社に占有されてしまうリスクが生じます。故に、新ビジネスの成長性を確認するために、あえて「世界に先駆けて司法判断を示させる裁判を起こす」という考え方は一考する価値があるのではないでしょうか?
参考文献
1.奥邨浩司、生成AIと著作権に関する米国の動き、コピイライト No.747,Vol.63
2.愛知靖之、AI生成物・機械学習と著作権法、パテント2020 Vol.73 No.8(別冊No.23)
3.清水敬一、坂田泰弘、著作権判決から探るコンピュータプログラムの著作物性有無判断基準、パテント2022, Vol.75,No.8
4.水越尚子、Google社 v. Oracle社 米国最高裁判決、コピイライト No.725,Vol.61
5.柿沼太一、画像生成AIをめぐる著作権法上の論点、法律のひろば 2023.2