〒186-0002
東京都国立市東2-21-3

TEL : 042-843-0268

製品進化とマネジメント風景 第138話 生成AIを有効に活用するマネジメント(その3)

今日では多数の生成AIが使える環境になりました。あまりに沢山あるので、すべてを網羅することはできませんが、いくつかの分野に絞り、どの分野ではどのAIモデルを使うとコストパフォーマンスが良いのか、それについて調査した結果を述べようと思います。 

すべてを網羅していないので、下記の記載には若干の偏りがあるでしょう。一方で、実際に手を動かして検証した結果でもあるので、検証した範囲についてはかなり信憑性が高い内容だと思ってもらって良いと考えます。 

生成AIを利用する分野ですが、対象は以下の5つに絞りました。「検索」、「調査」、「要約」、「翻訳」および「画像生成」です。画像生成は非常に興味深いのですが、著作権問題などではっきりしない所もあるので、現時点でビジネスに使うのはリスクがあると考えており、あくまでも個人利用の範囲や社内でも一時的な参考資料として使うのに留めて置くのが無難です。 

生成AIの種類については、以下の4つを検討しました。第1は、Copilot for MS365であり、第2は、孫正義が「これを使わない人は人生を悔い改めた方が良い」といって話題になったChatGPTです。ちなみに、Copilot proという有料版がありますが、どうやらこれは殆どChatGPTplusと大差ないようです。 

ChatGPTの検証は無料版を使ってみました。無料版の欠点は、AIモデルとして少し前のバージョンが標準であり、最新モデルの実力が分からないことです。そこで、OpenAIのAPIを有料で契約し、自作のpythonプログラムに組込んで使えるようにし、無料版と最新のGPT-5のAIモデルの比較検討をできるようにしました。これが3番目に相当します。 

インターネット上には、世界中のAI研究者が持ち寄ったAIモデルのストックがあります。Hugging Faceというサイトです。ここには無料で使えるAIモデルが無数にあります。話題となっているDeepSeekもここで入手可能です。 

サイトにある多くのAIモデルは、GPUを搭載したマシンでないと現実的な時間で応答してくれませんが、今回の検証は、CPU環境でも小さなストレスで作動させられるモデルで、しかも出所がはっきりしているものを選んでダウンロードして検証しました。これが4番目です。 

今回の調査には、MetaのLLAMA系およびGoogle社のGemma系、Gemini系の最新版の評価は反映されていません。しかし、コストパフォーマンスを追求しますので、近いうちに調査する予定です。 

有料版の価格ですが、Copilot proはChatGPTplusと同じで月20ドル(約3千円)であり、Pro版は月200ドル(約3万円)です。一方、Copilot for MS365はMS365についてくるので月2000円強でOfficeといっしょに使えます。マイクロソフトの各種アプリとの連携に強みがあり、また、バックにソフトウェアストックのGithubが控えているので、プログラム作成支援も非常に強力です。 

ChatGPTとOpenAIのAPIで使えるAIモデルは共通ですが、API使用料は最低5ドルから使えます。課金がストックされ、使った分だけ差し引かれてゼロになったら使えなくなる仕組みです。ChatGPTplusよりも安く使えますが、AIモデルのパラメータ設定は自分で設定する必要があります。それは、目的別に自由に設定できるということでもあります。 

ここから実際に検証した結果について述べていきます。今回の調査対象は、前述したように検索、調査、要約、翻訳、画像生成の5つです。 

まずは検索についてです。Copilot for MS365は、OpneAIのGPT旧モデルを使っているため、両者に差はありませんでした。一方、自作プログラムにGTP-5のAPIを組み込んで検索すると、より専門性が高く精度の良い回答が得られました。少し前の情報であれば、googleよりも格段に優れていると評価しました。ただし、最新情報には少し弱いのでその点は留意する必要があります。 

Hugging Faceからは日本語に強いAIモデルをいくつか選んで検証しましたが、CPUメインのPC環境においてストレスなく使え、しかも、精度が良いと評価できたのはrinna/gemma-2-baku-2bというモデルでした。これは、元々、googleが開発したgemmaというモデルを改良したものです。CPU作動なので1~2分の待ち時間はあります。回答精度は、OpenAIのGPT-5には少し劣りますが、十分に使えるレベルです。完全に無料で使えるオプションになりえます。 

調査については検索とほぼ同じ結果でした。ただし、専門性が高い調査になるほど、GTP-5が優れた回答を出してくれることが分かってきました。費用面については、ある程度の詳しい調査をしても1ドルあれば充分に出来ることも分かりました。googleで検索して複数のサイトを調査するよりもずっと効率的です。 

次は要約です。要約については、前述のgemma2は、要約のために入力できる文章量に制限があり、実用的でないことが分かりました。だいたいA4が1枚程度で限界に達しました。ChatGPTも無料版は制限が大きいですが、有料のAPIを使えば長文を要約できます。約6000字の文章を要約させた所、GPT旧版もGPT-5のどちらも数十秒の待ち時間で回答しました。ともに妥当な内容でしたが、やはりGPT-5の方がより良い要約となっていました。 

次は翻訳です。今回は日本語から英語への翻訳を検証しました。まず、Hugging Faceからの無料AIモデルですが、前述のgemma-2に加えて、Helsinki-NLP-opus-mt-ja-enも試しました。ネットでは翻訳精度が高いという評判が出ていたからです。実際に翻訳を行ってみると、Helsinkiは直訳的であまり良いものではありませんでした。gemma2は意訳されかなり改善されました。一方、OpenAIのGPTの翻訳は旧版であっても非常に素晴らしく、正直、驚かされました。1つ1つの文章だけでなく、その全体の内容を考慮した上での意訳となっていたからです。 

最後に画像生成です。ChatGPTの無料版では画像生成はできないとのことだったので試していません。試したのはHugging Faceで選んだStable diffusionのバージョン1.4版です。これを選んだのは、出所がドイツのハイデルベルグ大学であり、また、作成パラメータ数が20億レベルと小さく、CPUでも動くだろうと考えたからです。プロンプトを適切に設定すれば、5-6分の待ち時間で非常に素晴らしい絵画や写真を作成することが分かりました。これは完全に無料で使えるので、今の所、画像生成はこれで十分ではないかと考えています。 

Hugging Faceにある無料のAIモデルを使えるのは良い話ですが、その種の公開サイトのソフトウェアにはマルウェアが仕込まれている場合があるそうです。従来と異なる点は、実行ファイルや圧縮ファイルで感染するのではなく、また、HTTPなどのウェブ言語で感染するのでもないことです。 

AI用の言語で多用されているpythonを例として説明します。Hugging Faceで使えるAIモデルの多くはpythonで書かれています。pythonプログラムの脆弱性をチェックするbanditというツールでチェックした所、非常にたくさんの脆弱性があることがわかりました。とても自分で修正できる量ではありません。 

この時、いちど諦めかけたのですが、スマホがアプリをサンドボックス環境に入れ、それぞれを独立に使えるようにしていることを思い出し、コンテナ化によって環境を隔離して使えば、脆弱性があって問題が起こっても、コンテナ内だけに留められるので、安全だと気付きました。そこで、コンテナ化の代表ツールであるDockerを導入しました。その際、コンテナ内のアプリを非ルート権限で動かせるようにしました。 

Dockerでコンテナ化し、しかも非ルート権限で動かせるようしたので安心していたのですが、実は、Dockerには致命的な問題があることが分かりました。それは、コンテナの内外を結んで通信するデーモンはルート権限であり、これが乗っ取られるとコンピュータ全体が乗っ取られるという脆弱性が残っていたからです。 

そこで、Dockerとほとんど同じ使い方ができ、しかもルート権限での通信を行わないPodmanというコンテナソフトに変更しました。さらに、メモリフォレンジックやネットワーク監視もできるようにしたので、とりあえず、これで様々な無料のAIモデルを試せるだろうと考えています。 

以上より、コストパフォーマンスの視点からの生成AIの利用方法について、本コラムとしての結論をまとめます。あくまでも製品開発、技術開発を想定した場合の当社の見解です。 

検索・調査については、最新のトピックでない限りは無料のAIモデルでも十分に役に立ちます。有料版の生成AIも同じですが、こちらの方が能力的に高いことは間違いありません。有料版生成AIについて最もコストパフォーマンスに優れた使い方は、OpenAIのAPIを組み込んで5ドル単位で課金し、使った分だけ補充する方法だというのが現時点での結論です。 

要約・翻訳はGTP旧版であっても、実用上、十分に良い結果を得られます。 

画像生成は無料のAIモデルを使えば、実質的に十分だと考えています。しかしながら、著作権問題が生じるリスクがあるため、事業で使用場合には法律上の問題を十分に吟味してからにしてください。 

最後にAIを利用するコンピュータについての見解です。CopilotやChatGPT、あるいはOpenAIのAPIを組み込んで使う限りにおいては、CPUメインのWindowsマシンで全く問題ありません。 

一方で、既存のAIモデルを自社データで学習するなど、若干でも改良するのであれば、GPU搭載の高性能マシンが必要です。WindowsかLinuxかの選択がありますが、AI用途のコストパフォーマンスを考えれば、明らかに後者が有利です。 

なぜなら、そもそもAIモデルはLinuxと相性よく作られているからです。Windowsはこの問題を克服するために、WSLというLinuxの仮想化プラットフォームを置ける仕掛けを作りました。これでAIモデルを問題なく使えるようになるのですが、メモリやストレージの消費が激しいことを痛感しました。要するにコストパフォーマンスが悪いのです。もし、GPU搭載マシンを買うならば、WindowsではなくLinux OSのマシンを購入し、一般業務は安いWindowsマシンに任せたいと思います。